Загрузил nelepin-van94

Математические и инструментальные МППР.

Реклама
êéëëàâëäÄü îÖÑÖêÄñàü
åàçàëíÖêëíÇé éÅêÄáéÇÄçàü à çÄìäà
îÉÅéì Çèé íûåÖçëäàâ
ÉéëìÑÄêëíÇÖççõâ ìçàÇÖêëàíÖí
àçëíàíìí åÄíÖåÄíàäà à äéåèúûíÖêçõï çÄìä
å. ë. ñõÉÄçéÇÄ
åÄíÖåÄíàóÖëäàÖ
à àçëíêìåÖçíÄãúçõÖ åÖíéÑõ
èéÑÑÖêÜäà èêàçüíàü êÖòÖçàâ
ì˜Â·ÌÓ ÔÓÒÓ·ËÂ
í˛ÏÂ̸
àÁ‰‡ÚÂθÒÚ‚Ó
í˛ÏÂÌÒÍÓ„Ó „ÓÒÛ‰‡ðÒÚ‚ÂÌÌÓ„Ó ÛÌË‚ÂðÒËÚÂÚ‡
2013
УДК 005.53:519.81(075.8)
ББК У291.21в631я73
Ц941
М. С. Цыганова. МАТЕМАТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ
МЕТОДЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ: учебное пособие для
студентов направления «Прикладная информатика в экономике». Тюмень:
Издательство Тюменского государственного университета, 2013. 224 с.
Учебное пособие содержит задания для практических занятий по темам дисциплины «Математические и инструментальные методы поддержки принятия решений», предусмотренным рабочей программой данной дисциплины. Задания сопровождаются обзором необходимых
сведений из теории принятия решений, описанием алгоритмов проведения анализа и разобранными примерами. Рассматриваются методы поддержки принятия решений, использующие как объективные, так и субъективные (основанные на предпочтниях ЛПР) модели. Прилагается список
литературы, рекомендованной для самостоятельного изучения.
Рабочая программа дисциплины опубликована на сайте ТюмГУ: Математические и инструментальные методы поддержки принятия решений [электронный ресурс] / Режим доступа: http://www.umk3.utmn.ru,
свободный.
Рекомендовано к изданию кафедрой информационных систем. Утверждено и. о. первого проректора по учебной работе Тюменского государственного университета.
Рецензенты:
Т. Р. Змызгова, к.т.н., доцент, зав. кафедрой «Информатика» Курганского государственного университета
Г. Б. Барская, к.т.н., доцент кафедры информационных
систем
Ответственный
редактор:
А. Г. Ивашко, д.т.н., профессор
ISBN 978-5-400-00854-2
© ФГБОУ ВПО Тюменский государственный университет, 2013.
© М. С. Цыганова, 2013.
2
éÉãÄÇãÖçàÖ
ОГЛАВЛЕНИЕ ..................................................................................................3
1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ ..................6
1.1. Участники процесса принятия решения ..............................................6
1.2. Альтернативы.........................................................................................7
1.3. Критерии.................................................................................................9
1.4. Типовые задачи принятия решений ...................................................10
1.5. Классификация задач принятия решений..........................................11
2. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ОПРЕДЕЛЕННОСТИ ...........13
2.1. Применение моделей линейного программирования
для исследования задачи принятия решения............................................13
2.1.1. Постановка задачи линейного программирования в рамках
теории принятия решений ............................................................... 13
2.1.2. Анализ чувствительности и устойчивость решения задачи
линейного программирования ......................................................... 18
2.2. Применение моделей целочисленного программирования
для исследования задачи принятия решения............................................32
2.2.1. Постановка задачи целочисленного программирования
в рамках теории принятия решений ................................................. 33
2.2.2. Общие сведения о методах решения задач ЦЛП ..................... 35
2.2.3. Метод ветвей и границ ........................................................... 36
2.3. Задания для самостоятельного выполнения......................................60
3. ПРИНЯТИЕ РЕШЕНИЙ ПРИ МНОГИХ КРИТЕРИЯХ. ЗАДАЧИ
С ОБЪЕКТИВНЫМИ МОДЕЛЯМИ .............................................................65
3.1. Методы устранения многокритериальности на основе подхода
исследования операций ..............................................................................65
3.2. Многокритериальные задачи линейного программирования.........67
3.2.1. Постановка многокритериальной задачи ЛП .......................... 67
3.2.2. Общая характеристика ЧМ процедур ..................................... 69
3.2.3. Процедура STEM ................................................................... 72
3.3. Задания для самостоятельного выполнения......................................78
3
4. ПРИНЯТИЕ РЕШЕНИЙ НА ОСНОВЕ СУБЪЕКТИВНЫХ
МОДЕЛЕЙ. ОСНОВЫ ТЕОРИИ ПОЛЕЗНОСТИ........................................81
4.1. Основные понятия теории одномерной полезности.........................81
4.1.1. Постановка задачи.................................................................. 81
4.1.2. Аксиомы рационального выбора. Общий принцип
рационального выбора..................................................................... 82
4.1.3. Методы построения одномерных функций полезности........... 86
4.1.4. Парадигма анализа решения ................................................... 94
4.2. Многокритериальная теория полезности ........................................101
4.2.1. Постановка задачи................................................................ 101
4.2.2. Подходы к построению многомерных функций полезности . 102
4.2.3. Основы многокритериальной теории полезности ................. 103
4.2.4. Пример практического применения многокритериальной
теории полезности (анализ проблемы развития аэропорта) [3]....... 109
4.3. Задания для самостоятельного выполнения....................................117
5. ПРИНЯТИЕ РЕШЕНИЙ НА ОСНОВЕ СУБЪЕКТИВНЫХ
МОДЕЛЕЙ. МЕТОД АНАЛИЗА ИЕРАРХИЙ ...........................................123
5.1. Общая характеристика подхода АНР...............................................123
5.2. Характеристика основных этапов метода АНР...............................124
5.2.1. Построение иерархии ........................................................... 124
5.2.2. Определение приоритетов в иерархии .................................. 125
5.2.3. Оценка согласованности суждений....................................... 132
5.2.4. Формализация понятий «иерархия» и «приоритеты» ............ 134
5.2.5. Определение приоритетов факторов низшего уровня
относительно цели......................................................................... 135
5.3. Пример практического применения анализа иерархий (анализ
альтернатив организации переправы через реку) ..................................140
5.4. Задания для самостоятельного выполнения....................................149
6. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
И РИСКА. МЕТОДЫ ТЕОРИИ ИГР ...........................................................152
6.1. Неопределенности противника. Принятие решений в условиях
конфликта ..................................................................................................153
6.1.1. Основные определения ......................................................... 153
4
6.1.2. Матричные игры .................................................................. 154
6.1.3. Сведение матричных игр к задачам линейного
программирования ........................................................................ 173
6.2. Игры с природой ................................................................................177
6.2.1. Основные понятия ................................................................ 177
6.2.2. Принятие решений в условиях риска .................................... 181
6.2.3. Принятие решений в условиях неопределенности ................ 186
6.3. Задания для самостоятельного выполнения....................................199
7. МЕТОДЫ ПОЛУЧЕНИЯ ЭКСПЕРТНЫХ ОЦЕНОК ............................202
7.1. Общие сведения о проведении экспертизы.....................................202
7.2. Обработка и анализ экспертных оценок ..........................................207
7.2.1. Формирование групповой оценки......................................... 207
7.2.2. Оценка согласованности мнений экспертов .......................... 214
7.2. Задание для самостоятельного выполнения ....................................219
СПИСОК ЛИТЕРАТУРЫ.............................................................................222
5
1. éëçéÇçõÖ èéçüíàü
íÖéêàà èêàçüíàü êÖòÖçàâ
1.1. ìóÄëíçàäà èêéñÖëëÄ èêàçüíàü êÖòÖçàü
Владелец проблемы — это человек, который (по мнению окружающих) должен ее решать, и который несет ответственность за
принятые решения.
Лицо, принимающее решение (ЛПР) — это человек (или группа
людей), обладающий возможностями и полномочиями для принятия решения, который фактически осуществляет выбор наилучшего
варианта действий.
Владелец проблемы нередко является одновременно и ЛПР, но
это бывает далеко не всегда. Владелец проблемы может быть одним
из нескольких человек, участвующих в принятии решения (представителем коллективного органа, члены которого должны идти на
компромиссы). Руководители нередко стремятся переложить принятие решения на других лиц (подписывают подготовленные другими
лицами документы и т. п.). В этих случаях владелец проблемы и
ЛПР — различные участники процесса принятия решения.
Эксперт — это высококвалифицированный специалист в данной предметной области, который имеет опыт и положительные
результаты практической деятельности, обладает возможностями и
желанием провести информационную подготовку процесса принятия решения. К экспертам обычно обращаются за оценками, прогнозами исходов тех или иных решений в случае, когда нет возможности получить объективную информацию. Давая оценки,
эксперты высказывают свое субъективное мнение.
Активные группы — это группы людей, имеющие общие интересы по отношению к проблеме, требующей решения. Они могут в
той или иной степени влиять на процесс принятия решения. Позиции активных групп могут учитываться, в частности, при формулировании критериев оценки качества различных вариантов решения проблемы.
6
В качестве примера рассмотрим проблему принятия решения о
постройке АЭС [5]. Владельцем проблемы (и, возможно, ЛПР) являются местные власти, которые должны дать разрешение на постройку АЭС на своей территории. В роли экспертов выступают
специалисты (физики, медики, экологи и др.), которые дают информацию о влиянии АЭС на людей и окружающую среду, производят расчет вероятностей аварий на АЭС и их возможных последствий и т. п. Активными группами являются: сотрудники
министерства энергетики (заинтересованы в приросте электроэнергии); сотрудники организации, осуществляющей постройку АЭС;
представители защитников окружающей среды; представители рядовых граждан, проживающих на данной территории.
Консультант по принятию решений (аналитик) приглашается
для участия в подготовке принятия сложных (обычно, стратегических) решений. Его роль состоит в разумной организации процесса
принятия решения. Она включает помощь ЛПР и владельцу проблемы в правильной постановке задачи; выявление ролей и позиций активных групп; организацию работы с экспертами, построение и анализ математических моделей и т. п. Аналитик обычно не
дает собственных оценок, он помогает ЛПР уяснить предпочтения
и выработать разумный компромисс.
1.2. ÄãúíÖêçÄíàÇõ
Альтернативы — это варианты, из которых требуется сделать
выбор.
Необходимое условие существования задачи принятия решения
(ЗПР) — наличие возможности выбора: множество альтернатив
должно содержать более одного элемента. Альтернативы могут
быть зависимыми и независимыми.
Независимыми называются те альтернативы, любые действия
с которыми (удаление из рассмотрения, выделение в качестве
лучшей и т. п.) не оказывают влияния на качество других альтернатив. Если решения, принятые по одним альтернативам, оказывают влияние на качество остальных, то такие альтернативы на7
зываются зависимыми. Выделяют следующие виды зависимости
альтернатив [5]:
• непосредственная групповая зависимость: если решено рассматривать хотя бы одну альтернативу из группы, то необходимо рассматривать всю группу;
• зависимость от альтернатив, исключаемых из рассмотрения;
• зависимость от несуществующих («фантомных») альтернатив: образ идеальной альтернативы, создаваемый человеком
во время выбора, оказывает влияние на выбор из реальных
альтернатив (особенно если есть надежда на реализуемость
идеального варианта).
Анализ зависимости альтернатив должен быть этапом в исследовании ЗПР; результаты этого анализа должны учитываться при
выборе метода поддержки принятия решения.
Альтернативы могут быть
— заранее заданными (в ЗПР имеется замкнутое и нерасширяющееся множество альтернатив);
— появляющимися после выработки правила принятия решения;
— конструируемыми в процессе принятия решения.
Примером ЗПР с альтернативами, появляющимися после формирования решающего правила, является задача распределения
ресурсов на научные исследования государственным или частным
фондом. Альтернативы (проекты проведения исследований) появляются после выработки и оглашения правила принятия решений.
Другой пример — формирование кредитной политики банка
(должна быть четко сформулирована до того, как поступят заявки
на выдачу кредитов).
В задачах с конструируемыми альтернативами число вариантов
решения, с рассмотрения которых начинается выбор, может быть
сравнительно невелико, но они не являются единственно возможными. На основе этих альтернатив в процессе выбора могут возникнуть либо новые альтернативы, либо совокупность требований
к недостающим альтернативам. Примеры таких задач: выбор плана
8
политической компании; выбор трассы газопровода; выбор плана
развития города.
Характер альтернатив и их количество накладывают условия на
методы принятия решений [5]:
• если альтернативы заданы, то целесообразно до принятия
решения изучить их методами анализа данных, сгруппировать зависимые или похожие альтернативы, найти сходство и
различия между группами и т. д.;
• при малом числе альтернатив целесообразно предъявлять
их ЛПР для анализа;
• если имеется принципиальная возможность создания новых
альтернатив, то необходимо предусмотреть конкретные способы их конструирования.
1.3. äêàíÖêàà
Критерии — это способ описания альтернативных вариантов
решений, выражения различий между ними с точки зрения предпочтений ЛПР. Обычно критерии оценки не заданы на начальном
этапе анализа проблемы; они должны быть выявлены в диалоге
ЛПР — консультант. В случае, когда определены все или часть
альтернатив, критерии выявляются при сопоставлении альтернатив. Если альтернативы не заданы, критерии определяются ЛПР на
основе его политики, его требований к задаче выбора (рассматриваются предыдущие ситуации принятия решения или ожидаемые
альтернативы).
При оценке качества альтернатив по нескольким критериям
(многокритериальные ЗПР) критерии могут быть зависимыми и независимыми. Критерии называются зависимыми, если оценка альтернативы по одному из критериев определяет (детерминированно
или с большой вероятностью) оценку по другому критерию. В противном случае критерии являются независимыми. Понятие независимости критериев более подробно рассмотрено в разделе 4.2.
Методы исследования ЗПР зависят от числа критериев. В относительно простых случаях, когда качество альтернатив может быть
9
описано с помощью одного критерия, для осуществления выбора
используются методы решения однокритериальных ЗПР. Некоторые из этих методов описаны в разделах 2, 4.1, 6. Методам анализа
ЗПР со многими критериями посвящены разделы 3, 4.2, 5. При небольшом числе критериев (порядка 2-5) задача сравнения двух альтернатив достаточно проста для ЛПР; качества по критериям могут
быть непосредственно сопоставлены и выработан компромисс. При
большом числе критериев задача становится малообозримой. В
этом случае критерии могут быть объединены в группы зависимых
критериев, имеющие определенное смысловое значение. Такие
группы, как правило, являются независимыми. Итогом является
иерархия критериев, которая может иметь различное число уровней.
Метод анализа таких задач рассматривается в разделе 5.
1.4. íàèéÇõÖ áÄÑÄóà èêàçüíàü êÖòÖçàâ
ЗПР различаются в зависимости от требований, предъявляемых к результату решения. Можно выделить три основных типа
ЗПР [2, 5].
1. Упорядочение (ранжирование) альтернатив.
Задача состоит в построении отношения порядка на множестве
альтернатив. Если среди альтернатив нет эквивалентных (одинаковых по принятым критериям оценки), то может быть выстроено
отношение строгого порядка. Результатом является последовательность объектов (альтернатив)
a1
a2
…
am ,
где объект с первым номером является наиболее предпочтительным из всех, объект со вторым номером менее предпочтителен, чем
первый, но предпочтительнее всех остальных и т. д.
При наличии эквивалентных объектов выстраивается отношение
нестрогого порядка. Во многих задачах достаточно построить квазипорядок (не все альтернативы являются сравнимыми). При этом
часть альтернатив может иметь «размытый» ранг (их положение в
последовательности определено некоторым интервалом).
10
2. Разделение альтернатив на упорядоченные по качеству группы.
Разделение объектов на группы (классификация) является
удовлетворительным решением для многих практических задач
(особенно если число объектов велико).
3. Выбор лучшей альтернативы.
Эта задача традиционно является одной из основных в теории
принятия решений. Она часто встречается на практике. Примерами
могут служить выбор проекта сложного технического устройства,
трассы газопровода и т. д. Такие задачи распространены в сфере
политических решений, где альтернатив сравнительно немного, но
сами они сложны для изучения и сравнения.
1.5. äãÄëëàîàäÄñàü áÄÑÄó èêàçüíàü êÖòÖçàâ
Существуют различные подходы к классификации ЗПР.
Широко известна классификация Г. Саймона (H. Simon) и
А. Ньюэлла (A. Newell), предложенная в 1958 г., в соответствии с
которой ЗПР подразделяются на три класса.
1. Хорошо структурированные (количественно сформулированные)
задачи.
Характеризуются тем, что все существенные зависимости могут
быть выражены в числах или символах, получающих в конце концов численные оценки. Примеры задач этого класса рассматриваются в разделе 2.
2. Неструктурированные (качественно выраженные) задачи.
Содержат лишь описание важнейших ресурсов, признаков и характеристик, количественные зависимости между которыми не известны.
3. Слабо структурированные (смешанные) задачи.
Содержат как качественные, так и количественные элементы,
причем качественные и неопределенные стороны проблемы имеют
тенденцию доминировать. Примером могут служить многокритериальные задачи линейного программирования, рассматриваемые в
разделе 3.
Другой подход использует в качестве классификационного признака степень неопределенности параметров анализируемой систе11
мы и внешней среды. В соответствии с этим подходом выделяются
следующие классы ЗПР.
1. ЗПР в условиях определенности.
Характеризуются тем, что все параметры анализируемой системы и внешней среды являются детерминированными. Вследствие
этого выбор той или иной альтернативы однозначно определяет
последствия выбора.
2. ЗПР в условиях риска.
В задачах этого класса точные значения ряда параметров неизвестны, но определены законы распределения вероятностей соответствующих случайных величин. Поэтому последствия выбора
той или иной альтернативы на момент принятия решения определены неоднозначно, но можно оценить вероятности различных последствий.
3. ЗПР в условиях неопределенности.
В задачах этого класса точные значения ряда параметров неизвестны, причем информация о распределении вероятностей этих
значений отсутствует. Последствия выбора той или иной альтернативы на момент принятия решения определены неоднозначно.
4. ЗПР в условиях конфликта.
Принятие решения производится в условиях конкуренции противоборствующих сторон. Результаты принятого решения зависят
от действий других лиц (партнеров, противников и т. п.), которые
нельзя предсказать. Некоторой «компенсацией» неопределенности
в задачах этого класса является предположение о «разумности»
действий противника (партнера и т. п.).
О.И. Ларичевым была предложена фасетная классификация
ЗПР (1984 г.).
• По степени новизны ЗПР делятся на уникальные и повторяющиеся;
• по характеру описания проблемы выделяются следующие
два класса: задачи с целостным описанием проблемы (может
быть сформирован целостный образ вариантов решений) и
многокритериальные задачи;
12
• по типу модели, определяющей связи между параметрами
задачи, выделяются следующие два класса: задачи с объективными моделями (основанными на формализованных закономерностях) и задачи с субъективными моделями (основанными на предпочтениях ЛПР).
Декартово произведение дихотомий задает 8 классов ЗПР, каждому из которых могут быть поставлены в соответствие различные
методы принятия решений (и использующие их системы поддержки принятия решений).
2. èêàçüíàÖ êÖòÖçàâ
Ç ìëãéÇàüï éèêÖÑÖãÖççéëíà
2.1. èêàåÖçÖçàÖ åéÑÖãÖâ ãàçÖâçéÉé èêéÉêÄååàêéÇÄçàü
Ñãü àëëãÖÑéÇÄçàü áÄÑÄóà èêàçüíàü êÖòÖçàü
2.1.1. Постановка задачи линейного программирования
в рамках теории принятия решений
Рассмотрим задачу принятия решения в условиях определенности на примере задачи распределения ресурсов.
Постановка задачи.
Имеется m видов ресурсов; количество i-го вида ресурса составляет bi, i = 1, 2, ... , m (в соответствующих единицах измерения). Эти ресурсы предназначены для производства n видов продукции. В соответствии с используемой технологией, для выпуска
единицы j-го вида продукции необходимо aij единиц i-гo вида ресурса. Требуется определить, какого вида и сколько продукции
следует производить, чтобы производственный план был наилучшим с точки зрения принятого критерия оптимальности.
Критерий оптимальности может быть установлен в соответствии с одной из двух взаимоисключающих целей:
1) при заданных ограничениях на ресурсы максимизировать
получаемый результат (например, прибыль от продажи произведенной продукции);
13
2) при заданном результате минимизировать количество ресурсов, требуемых для его достижения.
Обозначим:
хj – количество выпускаемой продукции j-го вида;
сj – величина, характеризующая вклад в результат единицы
продукции j-го вида (например, прибыль от продажи единицы продукции j-го вида).
По условию задачи имеем ограничения:
n
∑a x ≤ b ,
ij
j
i =1, 2 , … , m .
i
(2.1)
j=1
Кроме того, возможны дополнительные ограничения, связанные с предельными значениями объемов производства и продаж:
j =1, 2 , … , n .
E j ≤ xj ≤ E j ,
(2.2)
Формализация задачи в постановке 1):
n
z1 = ∑ c j x j
→ max ,
(2.3)
j=1
при ограничениях
⎧ n
⎪∑ aij x j ≤ bi , i =1, 2, … , m ,
⎨ j=1
⎪
⎩ E j ≤ x j ≤ E j , j =1, 2, … , n .
(2.4)
Ограничения (2.1) могут быть преобразованы в равенства путем
введения дополнительных переменных:
n
∑a x + s = b ,
ij
j
i
i
j=1
si ≥ 0 ,
i =1, 2, … , m .
Значения дополнительных переменных si равны разности между имеющимся и требуемым количеством i-гo вида ресурса (недо-
14
используемым величинам ресурсов) и, таким образом, характеризуют резервы каждого вида ресурсов.
Формализация задачи в постановке 2):
m
z2 = ∑ si
→ max ,
(2.5)
i=1
при ограничениях
⎧ n
⎪∑ c j x j ≥ C ,
⎪ j=1
⎪ n
⎪
⎨∑ aij x j + si = bi , i =1, 2, … , m ,
⎪ j=1
⎪
⎪E j ≤ x j ≤ E j , j =1, 2, … , n ,
⎪s ≥ 0 , i =1, 2 , … , m ,
⎩i
(2.6)
где С — минимально допустимое значение требуемого результата.
В обоих случаях (в постановках 1) и 2)) получены задачи линейного программирования (ЛП).
Пример 2.1
Предприятие производит три вида продукции: П1, П2 и П3, используя сырье двух видов: С1 и С2. Нормы расхода сырья для производства каждого вида продукции (в соответствии с действующей
на предприятии нормативной и технологической документацией),
количество сырья каждого вида (в условных единицах), имеющееся
в наличии, а также доход, получаемый от реализации единицы
продукции (в денежных единицах), представлены в таблице 2.1.
Таблица 2.1
Сырье
С1
С2
Доход на ед. продукции
Вид продукции
П1
П2
П3
Удельный расход сырья
6
2
1
7
11
5
5
7
8
15
Запас сырья
800
2000
На основании предварительных исследований получены следующие рекомендации:
— производство продукции П1 должно быть не менее 1 и не более
12 единиц (в соответствии с предполагаемым спросом и ограничением на производственные мощности),
— производство продукции П2 должно быть не менее 3 единиц.
Требуется определить оптимальный производственный план в
соответствии с целями 1) и 2).
Формализация.
Ограничения по ресурсам и предельным границам выпуска:
⎧6 x1 + 2 x2 + x3 ≤ 800 ,
⎪
7 x1 +11x2 + 5 x3 ≤ 2000 ,
⎪
⎪
⎨1 ≤ x1 ≤ 12 ,
(*)
⎪
⎪ x2 ≥ 3 ,
⎪ x3 ≥ 0 .
⎩
Все возможные тройки (х1, х2, х3), удовлетворяющие системе
ограничений — допустимые планы (альтернативы).
Формализация задачи в постановке 1):
z1 = 5 x1 + 7 x2 + 8 x3
→ max
при ограничениях (*).
После введения дополнительных переменных система ограничений
(*) примет вид
⎧6 x1 + 2 x2 + x3 + s1 = 800 ,
⎪
⎪7 x1 +11x2 + 5 x3 + s2 = 2000 ,
⎪1 ≤ x1 ≤ 12 ,
⎪
⎨
(**)
⎪ x2 ≥ 3 ,
⎪x ≥ 0 ,
⎪ 3
⎪s1 ≥ 0 , s2 ≥ 0 .
⎩
Предположим, что требуется обеспечить суммарную прибыль
от реализации произведенной продукции не менее 3 000 денежных
16
единиц при минимальном расходе ресурсов (сырья). Формализация
задачи в постановке 2):
z2 = s1 + s2
→ max
при ограничениях (**) и дополнительном ограничении
5 x1 + 7 x2 + 8 x3 ≥ 3000.
Обе полученные задачи ЛП могут быть решены симплексметодом. Представленные на рис. 2.1 и 2.2 оптимальные планы
(с точки зрения целей 1) и 2) соответственно) найдены с помощью
инструмента «Поиск решения» MS Excel.
Рис. 2.1. Решение задачи в постановке 1
(максимизация дохода при ограничениях на ресурсы)
Рис. 2.2. Решение задачи в постановке 2
(минимизация расхода ресурсов при заданном результате)
Комментарии к решению задачи в постановке 1).
Ресурсы, для которых si = 0 (в данном случае — сырье С2), —
лимитирующие: увеличение запасов сырья С2 позволит найти новый
оптимальный план, выполнение которого приведет к увеличению
значения целевой функции. Ресурсы, для которых si > 0 (в данном
случае — сырье С1), — нелимитирующие: увеличение запасов ресурсов, по которым и так имеются резервы в объеме s1 = 396 ед., не
может привести к увеличению значения целевой функции.
Вывод: для повышения эффективности производства (увеличения прибыли) не требуется увеличение запасов всех ресурсов, а
только — лимитирующих (в данном случае — сырья С2).
17
Комментарии к решению задачи в постановке 2).
Сравнение результатов, представленных на рис. 2.1 и 2.2, показывает, что ограничение суммарной прибыли величиной 3 000 д. е.
позволяет сократить расход ресурсов на 121,5 ед. В случае реализации оптимального плана для всех видов ресурсов остаются резервы.
Выводы.
• Реализация найденных оптимальных планов обеспечивает
достижение максимальной эффективности производства (по
максимуму прибыли от реализации или по минимуму расхода ресурсов).
• Реализация найденных оптимальных планов будет возможна даже в условиях высвобождения денежных средств, связанных в излишних запасах нелимитирующих ресурсов.
2.1.2. Анализ чувствительности и устойчивость
решения задачи линейного программирования
Исследование влияния изменения параметров модели (коэффициентов целевой функции и неравенств-ограничений) на полученное
оптимальное решение задачи ЛП называется анализом чувствительности. Анализ чувствительности выполняется после получения оптимального решения. Цель анализа — определить, приведет ли изменение значений параметров модели к изменению текущего
оптимального решения; если да, то как наиболее эффективно получить новое оптимальное решение (если оно существует).
С помощью инструмента «Поиск решения» MS Excel можно
получить отчет об устойчивости найденного оптимального решения, в котором будут представлены основные результаты анализа
чувствительности.
Для возможности наглядной графической иллюстрации проводимого анализа, будем выполнять основные построения на примере
задачи с двумя переменными. Все основные результаты могут быть
обобщены для задачи ЛП в общей постановке.
Изменение коэффициентов целевой функции.
Целевая функция задачи ЛП с двумя переменными имеет вид
→ max ( min ) .
z = c1 x1 + c2 x2
18
Изменение значений коэффициентов с1 и с2 приводит к изменению угла наклона прямых — линий уровня функции z. Это может
привести к изменению оптимального решения: оптимум будет достигаться в другой угловой точке области допустимых решений
(ОДР). В то же время, существуют интервалы изменения коэффициентов с1 и с2 (интервалы оптимальности), в которых сохраняется текущее оптимальное решение. Задача анализа чувствительности — в
получении этой информации.
Пример 2.2
Предприятие производит два вида продукции: П1 и П2, используя сырье двух видов: С1 и С2. Нормы расхода сырья для производства каждого вида продукции (в соответствии с действующей
на предприятии нормативной и технологической документацией),
максимально возможный ежедневный расход сырья, а также доход,
получаемый от реализации единицы продукции, представлены в
таблице 2.2.
Таблица 2.2
Сырье
С1
С2
Доход (тыс. д. е.)
на единицу
продукции
Вид продукции
П1
П2
Удельный расход сырья
6
4
1
2
5
Максимально возможный
ежедневный
расход сырья
24
6
4
На основании исследований отдела маркетинга получены следующие рекомендации:
— ежедневное производство продукции П2 следует ограничить 2
единицами (в соответствии с предполагаемым спросом),
— ежедневное производство продукции П2 не должно превышать
более чем на 1 единицу аналогичный показатель продукции П1.
Требуется определить производственный план, обеспечивающий максимальный ежедневный доход от реализации произведенной продукции.
19
Формализация задачи: z = 5 x1 + 4 x2
при ограничениях
→ max
⎧6 x1 + 4 x2 ≤ 24 ,
⎪
x1 + 2 x2 ≤ 6 ,
⎪
⎪
⎨ x2 ≤ 2 ,
⎪
⎪ x2 − x1 ≤ 1 ,
⎪
⎩ x1 ≥ 0 , x2 ≥ 0 .
Оптимальное решение, найденное с помощью инструмента
«Поиск решения» MS Excel, представлено на рис. 2.3. Графический
способ решения показан на рис. 2.4. Оптимальный выбор — ежедневное производство 3 ед. продукции П1 и 1,5 ед. продукции П2,
что обеспечит ежедневный доход в 21 тыс. д. е.
Рис. 2.3. Оптимальный план, полученный с помощью MS Excel
х2
6х1+4х2 = 24
3,5
х2 – х1 = 1
z = const
3
2,5
2
D
C
1,5
х1+2х2 = 6
B
1
E
0,5
0
A
O
0
0,5
1
1,5
2
2,5
3
3,5
4
х1
Рис. 2.4. Построение оптимального плана графическим методом
20
Целевая функция достигает максимального значения в угловой
точке В(3; 1,5). При изменении коэффициентов целевой функции
точка В останется точкой оптимального решения до тех пор, пока
угол наклона прямой — линии уровня целевой функции будет лежать между углами наклона прямых, пересечением которых является точка В:
6х1 + 4х2 = 24 (ограничение на запасы сырья С1)
и х1 + 2х2 = 6 (ограничение на запасы сырья С2),
как показано на рис. 2.5.
х2
Интервал
оптимальности
3,5
3
2,5
6х1+4х2 = 24
х1+2х2 = 6
2
z = const
D
C
1,5
B
1
E
0,5
0
A
O
0
0,5
1
1,5
2
2,5
3
3,5
4
х1
Рис. 2.5. Определение интервалов оптимальности.
c
1
6
≤ 1 ≤ , с2 ≠ 0 для
2
c2
4
⎡1 6⎤
угловых коэффициентов указанных прямых. Промежуток ⎢ , ⎥ −
⎣2 4⎦
интервал оптимальности для отношения с1/с2.
Оптимальное решение было найдено при с1 = 5, с2 = 4. Предположим, что коэффициент с2 остается неизменным. Тогда точка В
останется точкой оптимального решения при 2 ≤ с1 ≤ 6. Этот инЭто равносильно выполнению условий
21
тервал — интервал оптимальности для коэффициента с1. Это означает: уменьшение коэффициента с1 не более чем на 3 и увеличение
его не более чем на 1 не приведет к изменению оптимального плана (при условии неизменности коэффициента с2).
Аналогично можно получить интервал оптимальности для коэффициента с2. Предположим, что коэффициент с1 остается неизменным. Точка В останется точкой оптимального решения при ус4
10
≤ с2 ≤ 10 . Это означает, что
ловии с1 ≤ с2 ≤ 2с1 , т. е. при
6
3
уменьшение коэффициента с2 не более чем на 2/3 и увеличение его
не более чем на 6 не приведет к изменению оптимального плана
(при условии неизменности коэффициента с1).
Полученные выводы отражаются в отчете об устойчивости,
формируемом MS Excel (см. рис. 2.6).
Рис. 2.6. Отчет об устойчивости решения.
Интервалы оптимальности коэффициентов целевой функции
В общем случае (количество переменных более двух) для определения интервалов оптимальности коэффициентов целевой функции достаточно выполнить следующие операции:
• в выражении целевой функции (2.3) поочередно заменить
коэффициенты cj, j = 1, 2, … , n, выражениями cj + dj, где dj —
величина изменения коэффициента cj;
22
• если переменная хj не входит в оптимальный базис, то зна-
чения двойственных переменных не изменятся; в противном
случае следует вычислить значения двойственных переменных, используя теорему об оптимальном решении двойственной задачи (на основе уже полученного оптимального базиса исходной задачи);
• используя полученные значения двойственных переменных,
вычислить коэффициенты для небазисных переменных в индексной строке симплекс-таблицы (в виде выражений, содержащих dj);
• на полученные выражения наложить условие неотрицательности (откуда и вытекают ограничения на dj).
Как уже отмечалось, информация об интервалах оптимальности
выводится в стандартном отчете об устойчивости, формируемом
MS Excel.
Замечание.
Если в оптимальном решении задачи ЛП хj = 0 (j-й продукт не
вошел в оптимальный план), то уменьшение коэффициента cj целевой функции может быть сколь угодно велико: данный продукт все
равно не войдет в оптимальный план. Значение в столбце «Допустимое увеличение» отчета об устойчивости показывает, насколько
должен быть увеличен коэффициент cj, чтобы j-й продукт вошел в
оптимальный план.
Доступность ресурсов.
В рассматриваемой модели распределения ресурсов правые
части ограничений (2.1) bi, i = 1, 2, ..., m, интерпретируются как
доступное количество i-го вида ресурса. Анализ чувствительности
предполагает, в частности, исследование чувствительности полученного решения к изменению ограничений, налагаемых на ресурсы.
Вернемся к рассмотрению модели, построенной в примере 2.2.
Пример 2.2 (продолжение).
Целевая функция достигает максимального значения в угловой
точке В(3; 1,5), являющейся точкой пересечения прямых
АВ: 6х1 + 4х2 = 24 (ограничение на запасы сырья С1)
и ВС: х1 + 2х2 = 6 (ограничение на запасы сырья С2).
23
Изменение уровня доступности сырья С1 относительно текущего уровня, равного 24 ед., соответствует параллельному переносу
прямой АВ. При этом точка В будет перемещаться вдоль отрезка
CF (см. рис. 2.7). Точка пересечения прямых АВ и ВС останется
точкой оптимального решения до тех пор, пока смещение первой
прямой ограничивается точками
С(2, 2) (пересечение прямых х1 + 2х2 = 6 и х2 = 2)
и F(6, 0) (пересечение прямых х1 + 2х2 = 6 и х2 = 0).
х2
6х1+4х2 = 20
3,5
6х1+4х2 = 36
6х1+4х2 = 24
3
2,5
2
D
х2 = 2
C
1,5
1
х1+2х2 = 6
B
E
0,5
0
O
0
F
A
0,5
1
1,5
2
2,5
3
3,5
4
4,5
5
5,5
6
х1
6,5
Рис. 2.7. Определение интервала осуществимости для ресурса С1
Поэтому точки С и F определяют интервал осуществимости
для ресурса С1 (осуществимости оптимального решения в точке В).
Точке С соответствует количество ресурса С1, равное
6х1 + 4х2 = 6·2+4·2 = 20 (ед.);
точке F — количество ресурса С1, равное
6х1 + 4х2 = 6·6+4·0 = 36 (ед.).
Следовательно, интервал осуществимости для ресурса С1 составляет [ 20 , 36] . Это означает: при уменьшении текущего уровня
ресурса С1 не более, чем на 4 ед., и при увеличении его не более,
чем на 12 ед., гарантируется, что оптимальное решение будет дос-
24
тигаться в точке пересечения прямых, определяемых ограничениями на ресурсы С1 и С2 (но координаты этой точки — оптимальные
значения х1 и х2, будут изменяться с изменением уровня С1).
Аналогично, изменение уровня доступности сырья С2 относительно текущего уровня, равного 6 ед., соответствует параллельному переносу прямой ВС. При этом точка В будет перемещаться
вдоль отрезка AG (см. рис. 2.8).
х2
6х1+4х2 = 24
3,5
х1+2х2 = 20/3
3
2,5
х1+2х2 = 6
2
G
D
1,5
C
х1+2х2 = 4
1
B
E
0,5
0
A
O
0
0,5
1
1,5
2
2,5
3
3,5
4
х1
Рис. 2.8. Определение интервала осуществимости для ресурса С2
Точка пересечения прямых АВ и ВС останется точкой оптимального решения до тех пор, пока смещение второй прямой ограничивается точками
А(4, 0) (пересечение прямых 6х1 + 4х2 = 24 и х2 = 0)
и G(8/3, 2) (пересечение прямых 6х1 + 4х2 = 24 и х2 = 2).
Точки А и G определяют интервал осуществимости для ресурса С2. Точке A соответствует количество ресурса С2, равное
х1 + 2х2 = 4+2·0 = 4 (ед.);
точке G — количество ресурса С2, равное
х1 + 2х2 = 8/3+2·2 = 20/3 (ед.).
25
Следовательно, интервал осуществимости для ресурса С2 со⎡ 20 ⎤
ставляет ⎢ 4 , ⎥. Это означает: при уменьшении текущего уровня
⎣ 3⎦
ресурса С2 не более, чем на 2 ед., и при увеличении его не более,
чем на 2/3 ед., гарантируется, что оптимальное решение будет достигаться в точке пересечения прямых, определяемых ограничениями на ресурсы С1 и С2.
Полученные выводы отражаются в отчете об устойчивости, формируемом MS Excel (см. рис. 2.9).
Рис. 2.9. Отчет об устойчивости решения.
Интервалы осуществимости для ресурсов
Стоимость ресурсов (теневые цены).
Для более точного исследования чувствительности модели ЛП
вводится количественная характеристика степени влияния изменения уровня доступности ресурса на оптимальное значение целевой
функции.
Пусть уровень доступности i-го ресурса, i = 1, 2, … , m, изменяется в пределах интервала осуществимости. Обозначим:
Δi – длина интервала осуществимости i-го ресурса,
Δiz – приращение целевой функции, соответствующее изменению
уровня доступности i-го ресурса на Δi.
Величины
yi =
∆i z
, i =1, 2 , … , m ,
∆i
26
(2.7)
характеризуют изменение оптимального значения целевой функции при изменении уровня доступности i-го ресурса на 1 единицу
(в пределах интервала осуществимости) и называются теневыми
(двойственными) ценами (shadow price, dual price).
Вернемся к рассмотрению модели, построенной в примере 2.2.
Пример 2.2 (продолжение).
Определим теневые цены для сырья С1 и С2.
В соответствии с (2.7):
z ( F ) − z (C )
30 −18
3
y1 =
=
= = 0 ,75 .
36 − 20
16
4
Это означает: изменение доступного количества сырья С1 на 1
ед. (в пределах от 20 до 36 ед.) приведет к изменению ежедневного
дохода на 750 д. е.
z ( G ) − z ( A)
64 3 − 20
1
y2 =
=
= = 0 ,5 .
20 3 − 4
83
2
Это означает: изменение доступного количества сырья С2 на 1
ед. (в пределах от 4 до 20/3 ед.) приведет к изменению ежедневного
дохода на 500 д. е.
Для третьего и четвертого ограничений данной модели теневые
цены равны нулю (т. к. Δ3 = Δ4 = ∞). Это означает, что ограничения,
наложенные на структуру производства, в данном случае не оказывают влияния на оптимальное решение.
Полученные выводы отражаются в отчете об устойчивости,
формируемом MS Excel (см. рис. 2.10).
Рис. 2.10. Отчет об устойчивости решения. Теневые цены
27
Теневые цены характеризуют ценность ресурсов для производителя. Это можно показать путем постановки и экономической
интерпретации двойственной задачи ЛП (на примере рассматриваемой задачи распределения ресурсов).
Пусть имеется покупатель на все ресурсы, используемые предприятием для выпуска продукции. Требуется определить:
— какие цены на эти ресурсы нужно назначить, чтобы продать их
было выгоднее, чем производить продукцию;
— какую минимальную сумму можно выручить от продажи ресурсов при этом условии.
Обозначим через уi цену i-го ресурса, которую назначает производитель, (не имеет никакого отношения к рыночной цене на данный ресурс). Целевая функция — прибыль, которую получит производитель, если продаст по этим ценам все имеющиеся ресурсы:
m
w = ∑ bi yi .
(2.8)
i=1
Система ограничений определяется требованием: прибыль от
продажи ресурсов должна быть не ниже, чем прибыль от производства товаров на основе этих ресурсов. Отсюда
⎧m
⎪∑ aij yi ≥ c j ,
j =1, 2, … , n ,
⎨ i=1
⎪
i =1, 2, … , m .
⎩ yi ≥ 0 ,
(2.9)
Задача ЛП (2.8) — (2.9) является двойственной по отношению к
исходной задаче. Из первой теоремы двойственности следует: для
любой пары допустимых решений исходной и двойственной задачи
соответствующие значения целевых функций удовлетворяют неравенству
n
m
j=1
i=1
z = ∑ c j x j ≤ ∑ bi yi = w ,
причем равенство достигается только в случае оптимальности решений обеих задач. В случае оптимального решения величина w = z
28
представляет собой общий полученный доход. Учитывая, что в
(2.8) bi — общее количество i-го ресурса, двойственная переменная
уi может интерпретироваться как стоимость единицы i-го ресурса,
при которой обеспечивается оптимальный доход. Сопоставляя выражения (2.8) и (2.7), легко заметить, что в обоих случаях речь идет
об одних и тех же значениях уi. Это объясняет название «двойственная цена».
В случае, когда имеется пара допустимых, но не оптимальных
решений исходной и двойственной задач, выполняется строгое неравенство
n
m
j=1
i=1
z = ∑ c j x j < ∑ bi yi = w .
Это означает, что до тех пор, пока суммарный доход от производства строго меньше суммарной стоимости всех используемых
ресурсов, решение как исходной, так и двойственной задачи не
может быть оптимальным.
m
Обозначим: z j = ∑ aij yi ,
j =1, 2, … , n .
i=1
Эта величина характеризует суммарную стоимость ресурсов,
используемых на производство единицы j-го вида продукции.
Величина zj — cj называется приведенной стоимостью производства j-го вида продукции (j-го вида деятельности). Положительное значение этой величины означает, что стоимость ресурсов, потребляемых на производство единицы j-го вида продукции,
превышает доход от реализации этой единицы, поэтому такой процесс экономически неприемлем. Следовательно, переменная хj
должна отсутствовать в оптимальном решении (иметь нулевое значение). Если же приведенная стоимость j-го вида деятельности
равна нулю, то это означает, что достигнута «точка равновесия», и
переменная хj будет иметь в оптимальном решении положительное
значение.
29
В стандартном отчете об устойчивости, формируемом MS
Excel, в столбце «Нормированная стоимость» выводится величина
сj — zj (приведенная стоимость с противоположным знаком).
Пример 2.3
Фабрика игрушек собирает три вида игрушек: модели поездов
(П1), грузовиков (П2) и легковых автомобилей (П3). При сборке
модели каждого вида используется три типа операций. Ежедневный фонд рабочего времени на первую, вторую и третью операцию ограничен предельными величинами: 430, 460 и 420 мин. соответственно. Доход от продажи одной игрушки составляет
соответственно 3, 2 и 5 д. е. На каждой из трех операций для
сборки одной модели поезда требуется 1, 3 и 1 мин. рабочего времени. Соответствующие показатели для сборки моделей грузовиков составляют 2, 0 и 4 мин.; легковых автомобилей — 1, 2 и
0 мин. (0 мин. означает, что соответствующая операция не выполняется). Определим производственный план, обеспечивающий максимальную ежедневную прибыль от реализации продукции.
Обозначим: хj — количество выпускаемых игрушек j-го вида.
Исходная задача имеет вид: z = 3x1 + 2 x2 + 5 x3 → max
при ограничениях:
⎧ x1 + 2 x2 + x3 ≤ 430 ,
⎪
⎪3x1 + 2 x3 ≤ 460 ,
⎨
⎪ x1 + 4 x2 ≤ 420 ,
⎪
⎩ x1 , x2 , x3 ≥ 0 .
Все возможные тройки (х1, х2, х3), удовлетворяющие системе
ограничений — допустимые планы (альтернативы).
Двойственная задача имеет вид:
w = 430 y1 + 460 y2 + 420 y3
при ограничениях:
30
→ min
⎧ y1 + 3 y2 + y3 ≥ 3 ,
⎪
⎪2 y1 + 4 y3 ≥ 2 ,
⎨
⎪ y1 + 2 y2 ≥ 5 ,
⎪
⎩ y1 , y2 , y3 ≥ 0 .
На рис. 2.11 представлено оптимальное решение исходной задачи и стандартный отчет об устойчивости MS Excel.
Рис. 2.11. Оптимальное решение и отчет об устойчивости
Комментарии к полученным результатам.
• Переменная х1 не вошла в оптимальный план. Это означает,
что производство моделей поездов в заданных условиях является экономически невыгодным. Об этом же свидетельствует отрицательное значение в столбце «Нормированная стоимость».
• Переменные х2 и х3 входят в оптимальный план с положительными значениями. При этом приведенная стоимость производства моделей грузовиков и легковых автомобилей равна
нулю, т. е. стоимость ресурсов, потребляемых на их производство, не превышает дохода от реализации этих видов игрушек.
31
• Для того, чтобы производство моделей поездов стало экономически выгодным (переменная х1 вошла в оптимальный
план), коэффициент с1 целевой функции (доход от продажи
одной модели) должен увеличиться не менее, чем на 4 денежных единицы.
• Найденное решение останется оптимальным, если коэффициенты целевой функции (каждый по отдельности) будут изменяться в пределах
– ∞ ≤ с1 ≤ 7, 0 ≤ с2 ≤ 10, 7/3 ≤ с3 ≤ +∞.
• Ресурсы времени, необходимого на выполнение операций 1 и
2, используются полностью, а на выполнение операции 3 остается резерв 20 мин. (см. значения в столбце «Результ. значение»
таблицы «Ограничения»). Это означает, что ресурсы 1 и 2 являются лимитирующими, а ресурс 3 — нелимитирующим.
• Значения теневых цен на ресурсы показывают: увеличение
фонда рабочего времени на операцию 1 на 1 мин. будет приводить к увеличению значения целевой функции на 1 д. е.,
при условии, что фонд рабочего времени на эту операцию
будет изменяться в пределах 230 ≤ b1 ≤ 440; увеличение фонда рабочего времени на операцию 2 на 1 мин. будет приводить к увеличению значения целевой функции на 2 д. е., при
условии, что фонд рабочего времени на эту операцию будет
изменяться в пределах 440 ≤ b2 ≤ 860; увеличение фонда рабочего времени на операцию 3 нецелесообразно — данный
ресурс не является дефицитным.
2.2. èêàåÖçÖçàÖ åéÑÖãÖâ
ñÖãéóàëãÖççéÉé èêéÉêÄååàêéÇÄçàü
Ñãü àëëãÖÑéÇÄçàü áÄÑÄóà èêàçüíàü êÖòÖçàü
В практике принятия организационных решений нередко
встречаются задачи, совпадающие по постановке с задачами ЛП,
но отличающиеся особенностью: искомые значения переменных
должны быть целыми числами. Такие задачи называются задачами
32
целочисленного программирования (ЦЛП). Условие целочисленности существенно затрудняет решение таких задач.
2.2.1. Постановка задачи
целочисленного программирования
в рамках теории принятия решений
Пусть х1, х2, … , хn — управляемые переменные.
Требуется определить значения х1, х2, … , хn, при которых
n
z = ∑c j x j
→ max ( min )
(2.10)
⎧ n
⎪∑ aij x j ≤ bi , i =1, 2 , … , m ,
⎨ j=1
⎪
j =1, 2 , … , n ,
⎩x j ≥ 0 ,
(2.11)
j=1
с учетом ограничений
(2.12)
хj — целые, j = 1, 2, … , p, p ≤ n.
Отличие этой задачи от задачи ЛП — наличие дополнительного
ограничения (2.12). В случае р = n имеем полностью целочисленную задачу; в противном случае (р < n) — частично целочисленную задачу.
Замечание.
Система ограничений задачи в исходной постановке может
содержать (для некоторых i) ограничения вида
n
n
∑ a x ≥ b или ∑ a x = b .
ij
j
i
ij
j=1
j
i
j=1
Такие ограничения могут быть приведены к виду (2.11) теми же
способами, что и при решении задач ЛП.
Рассмотрим два класса задач, сводящихся к модели ЦЛП.
1. Задача планирования выпуска неделимых видов продукции.
33
Предприятие производит конечную продукцию n видов. Используемая технология требует учета m производственных факторов, ресурсы которых ограничены величинами bi, i = 1, 2, ..., m
(в соответствующих единицах измерения). В соответствии с технологией производства, для выпуска единицы j-го вида продукции,
j = 1, 2, ..., n, необходимо aij единиц i-гo вида ресурса. Величина
прибыли, получаемой от реализации единицы j-го вида продукции
равна cj, j = 1, 2, ..., n. Произведенные продукты являются неделимыми (фактический смысл имеют только целые значения их количества). Требуется определить производственную программу,
обеспечивающую максимум суммарной прибыли с учетом ограничений на ресурсы каждого из производственных факторов.
Обозначим: хj — объем производства j-го вида продукции.
Формализация задачи:
n
z = ∑c j x j
→ max
j=1
при ограничениях
n
∑ a x ≤ b , i =1, 2, … , m ,
ij
j
i
j=1
xj ≥ 0,
j =1, 2, … , n ,
хj — целые, j = 1, 2, … , n.
2. Задача о загрузке судна (о рюкзаке, о ранце).
Судно (автомобиль, самолет, рюкзак и т. п.) имеет ограничения
по объему (грузоподъемности). Задано множество наименований
предметов, возможных для загрузки на судно, всего n видов. Каждый помещенный на судно груз приносит определенную прибыль.
Известно:
ai – объем (вес) одного предмета i-го наименования, i = 1, 2, ..., n;
ci – прибыль, которую приносит один загруженный предмет i-го
наименования;
b – предельный объем (грузоподъемность) судна.
34
Требуется определить такой набор предметов, который при загрузке на судно обеспечит максимум суммарной прибыли с учетом
ограничения на объем (грузоподъемность) судна.
Обозначим:
хi – количество предметов i-го наименования, подлежащих загрузке.
Формализация задачи:
n
z = ∑ ci xi
→ max
i=1
при ограничениях
n
∑a x ≤ b ,
i i
i=1
xi ≥ 0 ,
i =1, 2, … , n ,
хi — целые, i = 1, 2, … , n.
Замечание.
В задаче о загрузке судна в приведенной выше постановке считалось, что допускается загрузка более одного предмета каждого
наименования, если это является экономически целесообразным.
Вместе с тем, в ряде задач изначально предполагается наличие
только одного предмета каждого наименования. В этом случае ограничение целочисленности формулируется более жестко: хi = 0
или хi = 1 (хi = 1, если i-й предмет подлежит загрузке, хi = 0 в противном случае).
2.2.2. Общие сведения о методах решения задач ЦЛП
Методы решения задач ЦЛП основаны на использовании вычислительных возможностей методов ЛП. Алгоритмы решения целочисленных задач, как правило, включают следующие три шага.
1. «Ослабление» области допустимых решений (ОДР) задачи
ЦЛП:
• для двоичных переменных хi установление непрерывных
ограничений 0 ≤ хi ≤ 1;
35
• для остальных переменных — отбрасывание требования
целочисленности.
В результате получается обычная задача ЛП.
2. Определение оптимального решения полученной задачи ЛП.
3. Добавление (с учетом полученного на предыдущем шаге решения) специальных ограничений, которые итерационно изменяют ОДР задачи ЛП таким образом, чтобы в результате получилось оптимальное решение, удовлетворяющее требованиям
целочисленности.
По способам генерации ограничений, итерационно изменяющих
ОДР, методы решения задач ЦЛП можно разбить на два класса:
• Метод ветвей и границ.
Предназначен для решения полностью и частично целочисленных задач. Используется многими коммерческими программами,
реализующими решение задач ЦЛП. Вычислительная практика
свидетельствует в пользу того, что этот метод является более надежным и эффективным, чем метод отсекающих плоскостей.
• Метод отсекающих плоскостей.
Существует несколько модификаций этого метода. Наиболее известные из них предназначены для решения полностью целочисленных задач. Может использоваться как дополнительный метод
при решении подзадач, генерируемых методом ветвей и границ.
2.2.3. Метод ветвей и границ
Метод ветвей и границ может применяться и для решения нелинейных задач. Поэтому идея метода излагается для задачи дискретной оптимизации (для определенности — максимизации) в
общей постановке. Далее представлены алгоритмы, реализующие
эту идею для решения задач ЦЛП, относящихся к двум разным
классам.
Идея метода
Идея метода состоит в разбиении множества допустимых решений X на непересекающиеся части и отбрасывании тех частей,
на которых целевая функция заведомо не может иметь оптимального значения. После этого оставшиеся части опять разбиваются на
36
непересекающиеся множества и т. д.; на каждой итерации допустимое множество сокращается. Процесс заканчивается, когда будет
установлено, что в какой-то точке целевая функция принимает оптимальное значение z*. При этом не гарантируется, что не придется
рассмотреть все точки допустимого множества. Но в подавляющем
большинстве случаев происходит существенное сокращение вариантов перебора за счет эффективной организации процесса поиска.
Пусть рассматривается задача
z ( x1 , x2 , … , xn ) → max
при ограничениях ( x1 , x2 , … , xn ) ∈ X ,
где Х — конечное множество допустимых решений.
Сначала находятся верхняя и нижняя оценки максимума целевой функции на Х, т. е. числа z1(X) и z2(X) такие, что
⎡ z1 ( X ) , z2 ( X )⎦
⎤. Вопрос о способе нахождения этих оценок
z* ∈⎣
для каждого класса задач решается отдельно. При этом желательно,
⎡ z1 ( X ) , z2 ( X ) ⎦
⎤ была небольшой (иначе оценчтобы длина отрезка ⎣
ка будет малоэффективной). В качестве нижней оценки может быть
взято значение целевой функции в какой-нибудь точке Х.
Если z1 ( X ) = z2 ( X ) , то это означает, что z * = z1 ( X ) = z2 ( X ) .
Если удается найти точку
( x1* , x*2 , … , x*n ) ∈ X , в которой
z ( x1* , x*2 , … , x*n ) = z2 ( X ) , то эта точка соответствует оптимальному
решению данной задачи (одному из оптимальных решений). Если
такую точку найти не удается, то множество Х разбивается на непересекающиеся части
k
X = ∪ X i , где X i ∩ X j = ∅ при i ≠ j .
i=1
Вопрос о способе разбиения для каждого класса задач решается
отдельно.
Далее, для каждого множества Xi, i = 1, 2, … , k, находятся
верхняя и нижняя оценки максимума целевой функции на Xi: z1(Xi)
37
и z2(Xi). Очевидно, что для всех i z2(Xi) ≤ z2(X), причем за неимением лучшей оценки в качестве z2(Xi) можно взять z2(X). Если для каких-нибудь i и j выполняется z2(Xi) < z1(Xj), то множество Xi исключается из рассмотрения (т. к. заведомо не может содержать
оптимальное решение).
Оставшиеся после отбрасывания множества опять подвергаются процедуре разбиения и т. д. В ходе этого процесса (по мере
уменьшения числа элементов в подмножествах) должно происходить сближение оценок z1(Xi) и z2(Xi). Важно, что на каждой итерации разбиению можно подвергать не все множества, а только некоторые или даже одно. В качестве кандидата на разбиение обычно
выбирается множество с наибольшей верхней оценкой целевой
функции (так называемое перспективное множество). Предполагается, что таким образом удастся отбросить другие неразбитые
множества и тем самым сократить количество вычислительных
операций.
Описанный процесс называется ветвлением. Система множеств, которые участвуют в этом процессе, представляет собой
древовидную структуру. Сравнение оценок целевой функции производится каждый раз только на листовом уровне (для множеств,
которые еще не подвергались делению). Работа алгоритма заканчивается, когда в каком-то из множеств найдется точка, обеспечивающая верхнюю оценку для данного множества, причем эта верхняя оценка не меньше, чем верхние оценки всех остальных
множеств.
Схема решения задач ЦЛП методом ветвей и границ
В задачах данного типа
— в качестве верхней оценки максимума целевой функции берется
максимум целевой функции, найденный без учета ограничений
целочисленности;
— существует естественный способ разбиения ОДР на части.
Пусть рассматривается задача максимизации (2.10) — (2.12).
Общая схема алгоритма.
1. Положить t = 0.
38
Задать нижнюю границу оптимального значения целевой функции z1 = –∞.
Решить задачу ЛП (2.10) — (2.11) (получается из исходной задачи ЦЛП отбрасыванием условий целочисленности). Зафиксировать найденное оптимальное значение целевой функции z2(0).
Внести эту задачу в список подзадач, подлежащих исследованию,
под номером t.
2. Если список подзадач для исследования пуст, то прекратить
вычисления. Оптимальным решением задачи ЦЛП является
то, которое соответствует текущему значению z1, если таковое
существует.
В противном случае выбрать из списка подзадач, подлежащих
исследованию, подзадачу с номером s, при котором достигается
максимальное значение z2(s) (выбранная задача удаляется из списка).
3. Выбрать одну из переменных хj, j = 1 , 2 , ... , p, значение х*j которой в оптимальном решении s-й подзадачи ЛП не является
целым.
Исключить из ОДР область [х*j ] < хj < [х*j ]+1, где [v] — целая
часть числа v.
Сформулировать две задачи ЛП: в первой из них к имеющимся
ограничениям добавить ограничение хj ≤ [х*j], во второй — ограничение хj ≥ [х*j]+1.
4. Для каждой из подзадач, сформулированных на шаге 3, выполнить следующие действия:
если задача не имеет допустимого решения или если полученное оптимальное значение целевой функции меньше или равно
z1, то исключить эту задачу из дальнейшего рассмотрения;
в противном случае: если полученное оптимальное решение
подзадачи удовлетворяет целочисленным ограничениям, то
зафиксировать его, принять z1 равным соответствующему оптимальному значению целевой функции;
в противном случае: положить t = t + 1, зафиксировать оптимальное значение целевой функции как z2(t), включить задачу в
список подзадач, подлежащих исследованию, под номером t.
5. Перейти на шаг 2.
39
Замечание.
Можно получить целочисленное решение, не дойдя до последней итерации, однако при этом не известно, действительно ли это
решение является оптимальным.
Пример 2.4
Решить задачу ЦЛП z = 5x1 + 4x2 → max
при ограничениях
⎧ x1 + x2 ≤ 5 ,
⎪
⎨10 x1 + 6 x2 ≤ 45 ,
⎪
⎩ x1 , x2 ≥ 0 ,
x1, x2 — целые.
Шаг 1
t = 0, z1 = –∞.
Оптимальное решение задачи ЛП z = 5x1 + 4x2 → max
при ограничениях
⎧ x1 + x2 ≤ 5 ,
⎪
⎨10 x1 + 6 x2 ≤ 45 ,
⎪
⎩ x1 , x2 ≥ 0 ,
найденное симплекс-методом, имеет вид:
х*1 = 3,75; х*2 = 1,25; z* = 23,75.
z2(0) = 23,75.
Задача вносится в список подзадач, подлежащих исследованию,
под номером 0.
Шаг 2
Подзадача, внесенная в список на шаге 1 (с номером 0), выбирается для исследования и удаляется из списка. На рис. 2.12 штриховкой выделена ОДР 0-й подзадачи ЛП; черными точками — ОДР
исходной задачи ЦЛП.
40
х2 8
7
6
5
4
х1 = 3,75
х2 = 1,25
z = 23,75
3
2
1
0
0
1
2
3
4
5
х1
Рис. 2.12. ОДР исходной задачи ЦЛП, а также ОДР
и оптимальное решение задачи без учета условий целочисленности
Шаг 3
Выберем для ветвления переменную х1 (значение х*1 не является целым). Исключим из ОДР область 3 < х1 < 4 (эта область не содержит целочисленных значений х1, поэтому никакое допустимое
решение исходной задачи ЦЛП не будет потеряно) — см. рис. 2.13.
х2
8
7
6
ОДР задачи ЛП с
ограничениями 1)
5
4
3
2
ОДР задачи ЛП с
ограничениями 2)
1
0
0
1
2
3
4
5
х1
Рис. 2.13. ОДР подзадач ЛП, полученных на первой итерации
41
Сформулируем две задачи ЛП:
z = 5x1 + 4x2 → max
при ограничениях
⎧ x1 + x2 ≤ 5 ,
⎧ x1 + x2 ≤ 5 ,
⎪
⎪
⎪10 x1 + 6 x2 ≤ 45 ,
⎪10 x1 + 6 x2 ≤ 45 ,
1) ⎨
2) ⎨
⎪ x1 ≤ 3 ,
⎪ x1 ≥ 4 ,
⎪
⎪
⎩ x1 , x2 ≥ 0 .
⎩ x1 , x2 ≥ 0 .
Оптимальное решение исходной задачи ЦЛП находится либо в
ОДР подзадачи с ограничениями 1), либо в ОДР подзадачи с ограничениями 2).
Шаг 4
Рассмотрим подзадачу с ограничениями 1). Оптимальное решение этой задачи, найденное симплекс-методом, имеет вид:
х*1 = 3; х*2 = 2; z* = 23.
Полученное решение удовлетворяет целочисленным ограничениям. Зафиксируем его, положим z1 = 23.
Рассмотрим подзадачу с ограничениями 2). Оптимальное решение этой задачи, найденное симплекс-методом, имеет вид:
х*1 = 4; х*2 = 0,83; z* = 23,33.
Полученное решение не удовлетворяет целочисленным ограничениям. Положим t = 1, внесем задачу в список подзадач, подлежащих исследованию, под номером t, зафиксировав z2(t) = 23,33.
Шаг 5
Переход на шаг 2.
Шаг 2
Подзадача с номером 1 (с ограничениями 2)), выбирается для
исследования и удаляется из списка.
Шаг 3
Выберем для ветвления переменную х2 (значение х*2 не является целым). Исключим из ОДР область 0 < х2 < 1.
Сформулируем две задачи ЛП:
z = 5x1 + 4x2 → max
42
при ограничениях
⎧ x1 + x2 ≤ 5 ,
⎧ x1 + x2 ≤ 5 ,
⎪
⎪
10 x1 + 6 x2 ≤ 45 ,
10 x1 + 6 x2 ≤ 45 ,
⎪
⎪
⎪
⎪
4) ⎨ x1 ≥ 4 ,
3) ⎨ x1 ≥ 4 ,
⎪
⎪
⎪ x2 ≤ 0 ,
⎪ x2 ≥ 1 ,
⎪ x1 , x2 ≥ 0 .
⎪ x1 , x2 ≥ 0 .
⎩
⎩
Шаг 4
Рассмотрим подзадачу с ограничениями 3). Оптимальное решение этой задачи, найденное симплекс-методом, имеет вид:
х*1 = 4,5; х*2 = 0; z* = 22,5.
Полученное значение z* меньше текущего значения z1, поэтому
эта задача исключается из дальнейшего рассмотрения.
Рассмотрим подзадачу с ограничениями 4). Задача не имеет допустимого решения (система ограничений противоречива). Это хорошо видно на рис. 2.13 (в ОДР нет ни одного решения, для которого выполнялось бы х2 ≥ 1). Поэтому данная подзадача также
исключается из дальнейшего рассмотрения.
Шаг 5
Переход на шаг 2.
Шаг 2
Список подзадач для исследования пуст, поэтому следует прекратить вычисления. Оптимальным решением задачи ЦЛП является
х*1 = 3, х*2 = 2;
оптимальное значение целевой функции — z* = 23.
(соответствует текущему значению z1).
Замечание 1.
В примере 2.4 вычисления производились строго в соответствии с описанным выше алгоритмом. В некоторых случаях (например, когда коэффициенты целевой функции являются целыми)
включение в основной алгоритм дополнительных поверок может
привести к сокращению числа итераций, необходимых для получения оптимального решения. Так, в примере 2.4 в ходе исследования
43
задачи с ограничениями 1) получено текущее значение z1 = 23. Далее найдено оптимальное значение целевой функции задачи с ограничениями 2), равное 23,33. Принимая во внимание, что коэффициенты целевой функции — целые числа, можно сделать вывод:
оптимальное целочисленное решение задачи с ограничениями 2) не
может быть больше, чем z1 = 23, и исключить эту задачу из дальнейшего рассмотрения.
Дерево работы алгоритма представлено на рис. 2.14. Пунктирной рамкой отмечены вычисления, которые можно сократить, используя целочисленность коэффициентов целевой функции.
0-я задача ЛП
х*1 = 3,75; х*2 = 1,25; z* = 23,75
x1 ≤ 3
Задача с ограничениями 1)
х*1 = 3; х*2 = 2; z* = 23
Нижняя граница (оптимум)
x1 ≥ 4
Задача с ограничениями 2)
х*1 = 4; х*2 = 0,83; z* = 23,33
x2 ≤ 0
Задача с ограничениями 3)
х*1 = 4,5; х*2 = 0; z* = 22,5
x2 ≥ 1
Задача с ограничениями 4)
Нет решения
Рис. 2.14. Дерево работы алгоритма метода ветвей и границ.
На первой итерации — ветвление по переменной х1
Замечание 2.
Выбор переменной для ветвления в общем случае произволен.
Неудачный выбор может привести к существенному увеличению
объема вычислительных операций. На рис. 2.15 показано дерево
работы алгоритма для задачи ЦЛП примера 2.4 в случае, когда на
первой итерации ветвление выполняется по переменной х2. На сегодняшний день не существует строгой теории, на основании которой можно было бы наиболее эффективно выбирать переменную
для ветвления и последовательность рассмотрения подзадач ЛП.
Для частных случаев имеются эвристические соображения, позволяющие «угадать» наиболее эффективный путь.
44
0-я задача ЛП
х*1 = 3,75; х*2 = 1,25; z* = 23,75
x2 ≤ 1
x2 ≥ 2
1-я подзадача ЛП
х*1 = 3,9; х*2 = 1; z* = 23,5
x1 ≤ 3
x1 ≥ 4
2-я подзадача ЛП
х*1 = 3; х*2 = 2; z* = 23
Нижняя граница (оптимум)
4-я подзадача ЛП
х*1 = 4; х*2 = 0,83; z* =23,33
3-я подзадача ЛП
х*1 = 3; х*2 = 2; z* = 23
x2 ≤ 0
x2 ≥ 1
5-я подзадача ЛП
х*1 = 4,5; х*2 = 0; z* = 22,5
6-я подзадача ЛП
Нет решения
Рис. 2.15. Дерево работы алгоритма метода ветвей и границ.
На первой итерации — ветвление по переменной х2
Алгоритм решения задачи о загрузке судна
Рассмотрим задачу о загрузке судна в следующей постановке:
n
z = ∑ ci xi
→ max
(2.13)
i=1
при ограничениях
n
∑a x ≤ b ,
i i
(2.14)
хi = 0 или хi = 1, i = 1, 2, … , n.
(2.15)
i=1
Для решения задачи (2.13)–(2.15) (как и любой задачи ЦЛП)
может использоваться алгоритм, представленный выше. Однако в
данном случае эффективность алгоритма может быть повышена за
счет обоснования «удачного» выбора переменной для ветвления на
каждой итерации. А именно: выбирается переменная, соответствующая предмету, обладающему наибольшей «эффективностью»
45
(из числа предметов, еще не исследованных относительно их размещения на судне).
Схема алгоритма.
0. Для каждого предмета вычислить коэффициент
c
hi = i , i =1, 2 , … , n ,
ai
характеризующий эффективность i-го предмета.
Все предметы упорядочить в порядке убывания величины hi (в
дальнейшем используется нумерация предметов по убыванию hi).
Положить z1 = 0.
Вычислить верхнюю оценку значения целевой функции z2.
Для этого
• из условий
l
∑a j > b ,
j=1
l−1
∑a ≤ b
j
j=1
определить l — номер предмета, включение которого приводит к
нарушению ограничения на суммарный объем предметов;
• определить z2:
l−1
l−1
⎛
⎞
−
z2 = ∑ c j + hl ⋅⎜
b
∑ a j ⎟⎟.
⎜
⎝
⎠
j=1
j=1
Первое слагаемое характеризует суммарный эффект от предметов, размещаемых без нарушения ограничения на объем; второе
слагаемое характеризует верхнюю границу дополнительного эффекта, возможного за счет дальнейшего включения предмета с
максимальной эффективностью (из оставшихся предметов).
1. Положить t = 1.
Выбрать для ветвления переменную x1 (попытка размещения в
первую очередь предмета с наибольшей эффективностью).
Внести в список подзадач, подлежащих исследованию, две задачи:
11) задача (2.13) — (2.15) с дополнительным ограничением x1 = 1;
12) задача (2.13) — (2.15) с дополнительным ограничением x1 = 0.
46
Добавление указанных ограничений соответствует разбиению
исходного множества допустимых решений Х на два непересекающихся подмножества: подмножество X11 содержит все допустимые
решения, для которых x1 = 1 (первый предмет размещен на судне);
подмножество X12 содержит все допустимые решения, для которых
x1 = 0 (первый предмет не размещен) — см. рис. 2.16.
Х
х1 = 1
х1 = 0
X 11
X 21
Рис. 2.16. Ветвление исходного множества допустимых решений
на первой итерации
Для задач 11) и 12)
• определить l(1k), k = 1, 2 — номера предметов, включение
которых приводит к нарушению ограничения на суммарный
объем:
l (1k )
l (1k )−1
j=2
j=2
a1 x1 + ∑ a j > b , a1 x1 + ∑ a j ≤ b ;
• вычислить верхние оценки значения целевой функции
z2(1k), k = 1, 2:
l (1k )−1
⎛
⎞
⎜
z2 (1k ) = c1 x1 + ∑ c j + hl (1 ) ⋅⎜b − a1 x1 − ∑ a j ⎟
⎟.
k
j=2
j=2
⎝
⎠
l (1k )−1
Первые два слагаемые характеризуют суммарный эффект от
предметов, размещаемых без нарушения ограничения на объем;
третье слагаемое характеризует верхнюю границу дополнительного
эффекта, возможного за счет дальнейшего включения предмета с
максимальной эффективностью (из оставшихся предметов).
2. Если список задач для исследования пуст, то прекратить вычисления. Оптимальным решением задачи является то, которое соответствует текущему значению z1.
47
В противном случае для дальнейшего исследования выбрать из
списка задачу, имеющую наибольшее значение z2(tk). Выбранная
задача удаляется из списка.
Положить z2 равным наибольшему значению z2(tk) из оставшихся в списке задач.
3. Определить Gs — множество индексов переменных, которые
могут быть включены в решение со значением 1 (соответствующие
предметы могут быть размещены на судне дополнительно к уже
имеющимся) без нарушения ограничения на суммарный объем.
Если индекс j не может быть включен в Gs (нарушается ограничение на суммарный объем независимо от значений других свободных переменных), то положить xj = 0.
⎧
⎫
⎪
⎪
Если Gs = Ø, то положить z1 = max ⎨
∑ c j x j , z1⎬ ;
⎪по переменным,
⎪
⎩получившим значения
⎭
если z1 < z2 , то перейти на шаг 2;
в противном случае получено оптимальное решение, соответствующее значению z1; прекратить вычисления.
Если Gs ≠ Ø, перейти на шаг 4.
4. Выбрать переменную xr для ветвления, исходя из условия
hr = max h j
j∈Gs
(попытка добавления в первую очередь предмета с наибольшей
эффективностью).
Положить t = t + 1.
Внести в список задач для исследования две задачи:
t1) к уже имеющимся ограничениям добавить xr = 1,
t2) к уже имеющимся ограничениям добавить xr = 0.
Это соответствует очередному разбиению множества допустимых решений на итерации t (рис. 2.17).
48
Х
х1 = 1
х1 = 0
X 11
X 21
……………
X 1t −1
х1 = 1, … , хr = 0
х1 = 1, … , хr = 1
X 1t
X 2t
Рис. 2.17. Ветвление множества допустимых решений на итерации t
Для задач с номерами t1, t2 выполнить следующие действия.
Определить l(tk), k = 1, 2 — номера предметов, включение которых приводит к нарушению ограничения на суммарный объем:
r
l (t k )
j=1
j=r+1
∑a j xj + ∑ a j > b ,
r
l (tk )−1
j=1
j=r+1
∑a j x j + ∑ a j ≤ b ,
и вычислить верхние оценки значения целевой функции z2(tk):
l (tk )−1
l (tk )−1
r
r
⎛
⎞
⎟
−
−
z2 (tk ) = ∑ c j x j + ∑ c j + hl (t ) ⋅⎜
b
a
x
a
∑
∑
j j
j ⎟.
⎜
k
j=1
j=r+1
j=1
j=r+1
⎝
⎠
Если не существует номера l(tk), для которого выполнялись бы
эти ограничения, то
r
в случае ∑ a j x j + ar+1 > b
j=1
49
r
r
⎛
⎞
⎟
−
положить z2 (tk ) = ∑ c j x j + hr+1 ⋅⎜
b
a
x
∑
j j ⎟;
⎜
⎝
⎠
j=1
j=1
r
в случае ∑ a j x j + ar+1 ≤ b , r +1= n
j=1
r+1
положить xr+1 =1 , z2 (tk ) = ∑ c j x j ;
j=1
если z2(tk) ≥ z2, то получено оптимальное решение, соответствующее значению z2(tk); прекратить вычисления.
5. Перейти на шаг 2.
Пример 2.5 [13] Система обработки информации реального
времени.
Система предназначена для выполнения в течение периода
управления определенного перечня задач S = {s1, s2, …, sn}. Для
выполнения задачи sj требуется аj единиц процессорного времени.
Общий ресурс процессорного времени составляет Т единиц времени, но при отказе некоторых функциональных блоков системы он
может сократиться до b единиц. Степень важности задачи sj равна
сj. Исходные данные представлены в таблице 2.3, ресурс процессорного времени в ограниченном режиме составляет 72 ед. времени. Требуется с учетом степени важности задач определить набор
задач, обеспечивающий максимально возможную эффективность
функционирования системы в условиях ограниченных ресурсов
процессорного времени.
Таблица 2.3
Номер задачи i
Значения
параметров
1
2
3
4
5
6
7
8
9
аi
18
12
20
23
12
10
11
9
7
сi
8
4
7
11
5
6
5
10
8
50
На концептуальном уровне данная задача сводится к задаче о
загрузке судна:
• задачи s1, s2, …, sn — предметы, размещаемые на судне,
• ресурс процессорного времени — предельный объем b,
• время выполнения i-й задачи — объем предмета аi,
• степень важности i-й задачи — доход сi от размещения i-го
предмета на судне.
В результате получаем задачу (2.13) — (2.15), где коэффициенты аi и сi определяются из таблицы 2.3, b = 72.
Далее применяется алгоритм решения задачи о загрузке судна.
Шаг 0
c
Для каждого предмета вычисляется коэффициент hi = i ,
ai
предметы упорядочиваются в порядке убывания величины hi. Результаты показаны в таблице 2.4.
Вычисление верхней оценки значения целевой функции z2:
6
5
∑ a > 72 , ∑ a ≤ 72 ,
j
j
j=1
j=1
поэтому l = 6, hl = h6 = 0,444;
5
5
⎛
⎞
⎟
−
z2 = ∑ c j + 0, 444⋅⎜
72
a
∑
j ⎟ = 40 + 0 , 444⋅12 = 45 ,328 .
⎜
⎝
⎠
j=1
j=1
z1 = 0.
Таблица 2.4
Номер задачи i
Старая
нумерация
Новая
нумерация
hi
аi
сi
9
8
6
4
7
1
5
3
2
1
2
3
4
5
6
7
8
9
Значения параметров
1,143 1,111 0,6 0,478 0,455 0,444 0,417 0,35 0,333
7
9
10
23
11
18
12
20
12
8
10
6
11
5
8
5
7
4
51
Шаг 1
t = 1.
Для ветвления выбирается переменная x1 (в новой нумерации).
В список задач, подлежащих исследованию, вносится две задачи:
11) исходная задача с дополнительным ограничением x1 = 1;
12) исходная задача с дополнительным ограничением x1 = 0.
Для задачи 11:
6
5
j=2
j=2
7 + ∑ a j > 72 , 7 + ∑ a j ≤ 72 , поэтому l(11) = 6;
5
5
⎛
⎞
⎟
z2 (11 ) = 8 + ∑ c j + 0, 444⋅⎜
72
7
a
−
−
∑
j ⎟ = 45,328 .
⎜
⎝
⎠
j=2
j=2
Для задачи 12:
7
6
j=2
j=2
0 + ∑ a j > 72 , 0 + ∑ a j ≤ 72 , поэтому l(12) = 7;
6
6
⎛
⎞
z2 (12 ) = 0 + ∑ c j + 0 ,417⋅⎜
72
0
−
−
∑ a j ⎟⎟ = 40,417 .
⎜
⎝
⎠
j=2
j=2
Шаг 2
В списке 2 задачи:
задача 11 (x1 = 1), z2 (11 ) = 45,328 ;
задача 12 (x1 = 0), z2 (12 ) = 40 ,417 .
Для дальнейшего исследования выбирается задача 11 (удаляется
из списка); z2 = 40,417.
Шаг 3
Gs = {2, 3, … , 9}.
Шаг 4
Выбор переменной для ветвления:
hr = max h j = h2 , поэтому искомая переменная — х2.
j∈Gs
t = 2.
52
В список задач, подлежащих исследованию, вносятся две задачи:
21) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1;
22) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 0.
Для задачи 21:
6
5
j=3
j=3
7 + 9 + ∑ a j > 72 , 7 + 9 + ∑ a j ≤ 72 , поэтому l(21) = 6;
5
5
⎛
⎞
⎟
−
−
−
z2 ( 21 ) = 8 +10 + ∑ c j + 0, 444⋅⎜
72
7
9
a
∑
j ⎟ = 45 ,328 .
⎜
⎝
⎠
j=3
j=3
Для задачи 22:
7
6
j=3
j=3
7 + 0 + ∑ a j > 72 , 7 + 0 + ∑ a j ≤ 72 , поэтому l(22) = 7;
6
⎛
6
⎞
j=3
⎝
j=3
⎠
⎟
z2 ( 22 ) = 8 + 0 + ∑ c j + 0 ,417⋅⎜
⎜72 − 7 − 0 − ∑ a j ⎟ = 39 ,251 .
Шаг 5
Переход на шаг 2.
Шаг 2
В списке 3 задачи:
задача 12 (x1 = 0), z2 (12 ) = 40 ,417 ;
задача 21 (x1 = 1, x2 = 1), z2 ( 21 ) = 45,328 ;
задача 22 (x1 = 1, x2 = 0), z2 ( 22 ) = 39, 251.
Для дальнейшего исследования выбирается задача 21 (удаляется
из списка); z2 = 40,417.
Шаг 3
Gs = {3, 4, … , 9}.
53
Шаг 4
Выбор переменной для ветвления:
hr = max h j = h3 , поэтому искомая переменная — х3.
j∈Gs
t = 3.
В список задач, подлежащих исследованию, вносятся две задачи:
31) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1, x3 = 1;
32) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1, x3 = 0.
Для задачи 31:
6
5
j=4
j=4
7 + 9 +10 + ∑ a j > 72 , 7 + 9 +10 + ∑ a j ≤ 72 , поэтому l(31) = 6;
5
5
⎛
⎞
⎟
−
−
−
−
z2 (31 ) = 8 +10 + 6 + ∑ c j + 0, 444⋅⎜
72
7
9
10
a
∑
j ⎟= 45 ,328 .
⎜
⎝
⎠
j=4
j=4
Для задачи 32:
7
6
7 + 9 + 0 + ∑ a j > 72 , 7 + 9 + 0 + ∑ a j ≤ 72 , поэтому l(32) = 7;
j=4
j=4
6
⎛
⎞
⎜
z2 (32 ) = 8 +10 + 0 + ∑ c j + 0, 417⋅⎜ 72 − 7 − 9 − 0 − ∑ a j ⎟
⎟= 43,668 .
⎝
⎠
j=4
j=4
Шаг 5
Переход на шаг 2.
Шаг 2
В списке 4 задачи:
задача 12 (x1 = 0), z2 (12 ) = 40 ,417 ;
6
задача 22 (x1 = 1, x2 = 0), z2 ( 22 ) = 39, 251;
задача 31 (x1 = 1, x2 = 1, x3 = 1), z2 (31 ) = 45,328 ;
задача 32 (x1 = 1, x2 = 1, x3 = 0), z2 (32 ) = 43,668 .
54
Для дальнейшего исследования выбирается задача 31; z2 = 43,668.
Шаг 3
Gs = {4, 5, … , 9}.
Шаг 4
Выбор переменной для ветвления:
hr = max h j = h4 , поэтому искомая переменная — х4.
j∈Gs
t = 4.
В список задач, подлежащих исследованию, вносятся две задачи:
41) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1, x3 = 1, x4 = 1;
42) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1, x3 = 1, x4 = 0.
Для задачи 41:
6
5
j=5
j=5
7 + 9 +10 + 23 + ∑ a j > 72 , 7 + 9 +10 + 23 + ∑ a j ≤ 72 , поэтому l(41) = 6;
z2 ( 41 ) = 8 +10 + 6 +11+ с5 + 0 , 444⋅(72 − 7 − 9 −10 − 23 − a5 ) = 45,328 .
Для задачи 42:
8
7
j=5
j=5
7 + 9 +10 + 0 + ∑ a j > 72 , 7 + 9 +10 + 0 + ∑ a j ≤ 72 ,
поэтому
l(42) = 8;
7
7
⎛
⎞
⎟= 43,75 .
−
−
−
−
−
z2 ( 42 ) = 8 +10 + 6 + 0 + ∑ c j + 0,35⋅⎜
72
7
9
10
0
a
∑
j
⎜
⎟
⎝
⎠
j=5
j=5
Шаг 5
Переход на шаг 2.
Шаг 2
В списке 5 задач:
задача 12 (x1 = 0), z2 (12 ) = 40 ,417 ;
задача 22 (x1 = 1, x2 = 0), z2 ( 22 ) = 39, 251;
55
задача 32 (x1 = 1, x2 = 1, x3 = 0), z2 (32 ) = 43,668 ;
задача 41 (x1 = 1, x2 = 1, x3 = 1, x4 = 1), z2 ( 41 ) = 45,328 ;
задача 42 (x1 = 1, x2 = 1, x3 = 1, x4 = 0), z2 ( 41 ) = 43,75 .
Для дальнейшего исследования выбирается задача 41; z2 = 43,75.
Шаг 3
Gs = {5, 6, … , 9}.
Шаг 4
Выбор переменной для ветвления:
hr = max h j = h5 , поэтому искомая переменная — х5.
j∈Gs
t = 5.
В список задач, подлежащих исследованию, вносятся две задачи:
51) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1;
52) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 0.
Для задачи 51:
l(51) = 6;
z2 (51 ) = 8 +10 + 6 +11+ 5 + 0, 444⋅( 72 − 7 − 9 −10 − 23 −11) = 45,328 .
Для задачи 52:
7
7 + 9 +10 + 23 + 0 + ∑ a j > 72 ; 7 + 9 +10 + 23 + 0 + a6 ≤ 72 , поj=6
этому l(52) = 7;
z2 (52 ) = 8 +10 + 6 +11+ 0 + c6 + 0,417⋅(72 − 7 − 9 −10 − 23− 0 − a6 ) = 45,085 .
Шаг 5
Переход на шаг 2.
Шаг 2
В списке 6 задач:
задача 12 (x1 = 0), z2 (12 ) = 40 ,417 ;
задача 22 (x1 = 1, x2 = 0), z2 ( 22 ) = 39, 251;
56
задача 32 (x1 = 1, x2 = 1, x3 = 0), z2 (32 ) = 43,668 ;
задача 42 (x1 = 1, x2 = 1, x3 = 1, x4 = 0), z2 ( 41 ) = 43,75 ;
задача 51 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1), z2 (51 ) = 45,328 ;
задача 52 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 0), z2 (52 ) = 45,085 .
Для дальнейшего исследования выбирается задача 51; z2 = 45,085.
Шаг 3
Gs = {7, 9}, x6 = 0.
Шаг 4
Переменная для ветвления — х7.
t = 6.
В список задач, подлежащих исследованию, вносятся две задачи:
61) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 0, x7 = 1;
62) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 0, x7 = 0.
Для задачи 61:
7 + 9 +10 + 23 +11+ 0 + a7 + a8 > 72 , 7 + 9 +10 + 23 +11+ 0 + a7 ≤ 72 ,
поэтому l(61) = 8;
z2 (61 ) = 8 +10 + 6 +11+ 5 + 0 + 5 + 0,35⋅(72 − 7 − 9 −10 − 23−11− 0 −12) = 45 .
Для задачи 62:
7 + 9 +10 + 23 +11+ 0 + 0 + a8 > 72 , 7 + 9 +10 + 23 +11+ 0 + 0 ≤ 72 ,
поэтому l(62) = 8;
z2 (62 ) = 8 +10 + 6 +11+ 5 + 0 + 0 + 0 ,35⋅( 72 − 7 − 9 −10 − 23 −11− 0 − 0) = 44 , 2 .
Шаг 5
Переход на шаг 2.
Шаг 2
В списке 7 задач:
задача 12 (x1 = 0), z2 (12 ) = 40 ,417 ;
задача 22 (x1 = 1, x2 = 0), z2 ( 22 ) = 39, 251;
57
задача 32 (x1 = 1, x2 = 1, x3 = 0), z2 (32 ) = 43,668 ;
задача 42 (x1 = 1, x2 = 1, x3 = 1, x4 = 0), z2 ( 41 ) = 43,75 ;
задача 52 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 0), z2 (52 ) = 45,085 ;
задача 61 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 0, x7 = 1),
z2 (61 ) = 45 ;
задача 62 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 0, x7 = 0),
z2 (62 ) = 44, 2 .
Для дальнейшего исследования выбирается задача 52; z2 = 45.
Шаг 3
Gs = {6, 7, 8, 9}.
Шаг 4
Переменная для ветвления — х6.
t = 7.
В список задач, подлежащих исследованию, вносятся две задачи:
71) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 0, x6 = 1;
72) исходная задача с дополнительными ограничениями
x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 0, x6 = 0.
Для задачи 71:
7 + 9 +10 + 23 + 0 +18 + a7 > 72 , 7 + 9 +10 + 23 + 0 +18 ≤ 72 ,
поэтому l(71) = 7;
z2 (71 ) = 8 +10 + 6 +11+ 0 + 8 + 0 ,417⋅( 72 − 7 − 9 −10 − 23 − 0 −18) = 45,085 .
Для задачи 72:
7 + 9 +10 + 23 +11+ 0 + a7 + a8 > 72 , 7 + 9 +10 + 23 +11+ 0 + a7 ≤ 72 ,
поэтому l(72) = 8;
z2 (7 2 ) = 8 +10 + 6 +11+ 0 + 0 + 5 + 0 ,35⋅(72 − 7 − 9 −10 − 23 − 0 − 0 −12) = 43,85 .
Шаг 5
Переход на шаг 2.
Шаг 2
В списке 8 задач:
58
задача 12 (x1 = 0), z2 (12 ) = 40 ,417 ;
задача 22 (x1 = 1, x2 = 0), z2 ( 22 ) = 39, 251;
задача 32 (x1 = 1, x2 = 1, x3 = 0), z2 (32 ) = 43,668 ;
задача 42 (x1 = 1, x2 = 1, x3 = 1, x4 = 0), z2 ( 41 ) = 43,75 ;
задача 61 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 0, x7 = 1),
z2 (61 ) = 45 ;
задача 62 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 0, x7 = 0),
z2 (62 ) = 44 ,2 ;
задача 71 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 0, x6 = 1),
z2 (71 ) = 45,085 ;
задача 72 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 0, x6 = 0),
(
z2 7 2 ) = 43,85 .
Для дальнейшего исследования выбирается задача 71; z2 = 45.
Шаг 3
Gs = Ø (не существует предмета, который можно было бы разместить, не нарушая ограничения на суммарный объем), поэтому
x7 = x8 = x9 = 0.
⎧
⎫
⎪ 6
⎪
z1 = max ⎨∑ c j x j , 0⎬ = 8 +10 + 6 +11+ 0 + 8 = 43.
⎪ j=1
⎪
⎩
⎭
z1 < z2, переход на шаг 2.
Шаг 2
В списке 7 задач:
задача 12 (x1 = 0), z2 (12 ) = 40 ,417 ;
задача 22 (x1 = 1, x2 = 0), z2 ( 22 ) = 39, 251;
задача 32 (x1 = 1, x2 = 1, x3 = 0), z2 (32 ) = 43,668 ;
задача 42 (x1 = 1, x2 = 1, x3 = 1, x4 = 0), z2 ( 41 ) = 43,75 ;
59
задача 61 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 0, x7 = 1),
z2 (61 ) = 45 ;
задача 62 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 0, x7 = 0),
z2 (62 ) = 44 ,2 ;
задача 72 (x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 0, x6 = 0),
z2 (7 2 ) = 43,85 .
Для дальнейшего исследования выбирается задача 61; z2 = 44,2.
Шаг 3
Gs = Ø (не существует предмета, который можно было бы разместить, не нарушая ограничения на суммарный объем), поэтому
x8 = x9 = 0.
⎧
⎫
⎪ 7
⎪
z1 = max ⎨∑ c j x j , 43⎬ = max {8 +10 + 6 +11+ 5 + 0 + 5 , 43} = 45.
⎪ j=1
⎪
⎩
⎭
z1 > z2, получено оптимальное решение:
x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 0, x7 = 1, x8 = 0, x9 = 0.
Дерево работы алгоритма показано на рис. 2.18.
2.3. áÄÑÄçàü Ñãü ëÄåéëíéüíÖãúçéÉé ÇõèéãçÖçàü
При выполнении задания 2.1 можно использовать инструментарий MS Excel. При выполнении заданий 2.2 и 2.3 инструментарий
MS Excel можно использовать для решения подзадач ЛП на каждой
итерации метода ветвей и границ (но не для получения решения в
готовом виде).
Задание 2.1
Руководство предприятия, выпускающего неоднородную продукцию, стремится определить, какими должны быть уровни производства для каждого продукта в течение некоторого наперед заданного периода. Предприятие имеет возможность реализовать от
одного до четырех различных типов производственнотехнологических процессов и обладает правом выбора того или
иного варианта.
60
Исходная задача
z2 = 45,328
x1 = 0
Задача 11
z2(11)= 45,328
Задача 12
z2(12)= 40,417
x2 = 1
x2 = 0
Задача 21
z2(21)= 45,328
Задача 22
z2(22)= 39,251
x3 = 1
x3 = 0
Задача 31
z2(31)= 45,328
Задача 32
z2(32)= 43,668
x4 = 1
x4 = 0
Задача 41
z2(41)= 45,328
Задача 42
z2(42)= 43,75
x5 = 1
x5 = 0
Задача 51
z2(51)= 45,328
Задача 52
z2(52)= 45,085
x7 = 1
x7 = 0
Задача 61
z2(61)= 45
Задача 62
z2(62)= 44,2
z1 = 45
x1 = 1
x6 = 1
x6 = 0
Задача 71
z2(71)= 45,085
Задача 72
z2(72)= 43,85
z1 = 43
Рис. 2.18. Дерево работы алгоритма примера 2.5
Технологические процессы (ТП) первого и второго типов ориентированы на получение продукции А, а технологические процессы третьего и четвертого типов — на получение продукции В. Расходы, связанные с каждым из технологических процессов,
определяются трудозатратами (измеряемыми в человеко-неделях),
количеством (в единицах веса) потребляемого в течение недели
материала М1 и количеством (в ящиках) потребляемого в течение
недели материала М2. Т. к. затраты, связанные с различными технологическими процессами, не одинаковы, то прибыльность процессов оказывается разной даже в том случае, когда они используются для получения продукции одного и того же вида.
61
При составлении производственного плана на неделю диапазон
возможностей предприятия ограничен как за счет трудовых ресурсов, так и за счет потребляемого сырья (материалов М1 и М2). Производственно-экономические показатели и имеющиеся ограничения приведены в таблице 2.5.
Таблица 2.5
Количество
Человеконедель
Материала
М1 (кг.)
Материала
М2 (ящ.)
Доход с ед.
продукции
На единицу продукции На единицу продукции
В наличии
А
В
(не более)
ТП1
ТП2
ТП3
ТП4
1
1
1
1
15
7
5
3
2
120
3
5
10
15
100
4
5
9
11
Необходимо определить, какими должны быть уровни производства для каждого технологического процесса в течение недели,
чтобы обеспечить максимальный суммарный доход.
1. Сформулировать задачу линейного программирования.
2. Найти оптимальный производственный план.
3. Сформулировать двойственную задачу и получить ее оптимальное решение (не решая «с нуля», а используя найденное
решение исходной задачи). Дать экономическую интерпретацию двойственной задачи и ее оптимального решения.
4. Выполнить анализ чувствительности найденного оптимального решения, в ходе которого получить ответы на следующие вопросы:
1) В каких пределах может изменяться величина дохода, получаемого с единицы каждого вида продукции, чтобы найденное
решение оставалось оптимальным?
2) Какие из ресурсов, используемых для производства, являются в заданных условиях лимитирующими, а какие — нелимитирующими? Как можно использовать эту информацию при решении задачи оптимальной организации производства?
62
3) Имеются ли среди четырех возможных технологических
процессов такие, реализация которых в заданных условиях является экономически невыгодной? Если да, то насколько должен быть увеличен доход от реализации единицы продукции
соответствующего типа, чтобы эти процессы вошли в оптимальный план (стали экономически выгодными)?
4) Предположим, что уровень доступности материала М1 увеличился до 130 кг в неделю. Приведет ли это к увеличению суммарного дохода от реализации продукции? Если да, то насколько увеличится доход? Может ли в этом случае измениться структура
оптимального плана (какой-либо производственный процесс, который первоначально был признан экономически невыгодным,
войдет в оптимальный план, или, наоборот, какой-либо процесс
будет исключен из оптимального плана)?
5) Предположим, что уровень доступности материала М2 увеличился до 120 ящ. в неделю. Приведет ли это к увеличению суммарного дохода от реализации продукции? Если да, то насколько
увеличится доход? Может ли в этом случае измениться структура
оптимального плана? Изменятся ли ответы на эти вопросы, если
предположить, что уровень доступности материала М2 увеличился
до 170 ящ. в неделю?
6) Предположим, что предприятие имеет возможность высвободить денежные средства, связанные в излишних запасах нелимитирующих ресурсов, и за счет этих средств увеличить
уровни доступности лимитирующих ресурсов. Предположим
для определенности, что этих средств достаточно для увеличения на 4 единицы запасов любого вида лимитирующих ресурсов. Вложение в какой вид ресурса приведет к наибольшему
увеличению дохода?
5. Оформить отчет. Содержание отчета:
1) Постановка задачи линейного программирования.
2) Полученное оптимальное решение и его экономическая интерпретация.
3) Постановка и экономическая интерпретация двойственной
задачи. Оптимальное решение двойственной задачи.
4) Ответы на вопросы п. 4 (с обоснованием).
63
Задание 2.2.
В условиях задания 2.1 имеется дополнительное ограничение:
продукция фирмы является неделимой (фактический смысл имеют
только целые значения).
1. Сформулировать задачу целочисленного программирования.
2. Решить поставленную задачу с помощью метода ветвей и границ. Построить дерево работы алгоритма.
3. Показать существование зависимости числа итераций алгоритма от выбора переменной ветвления и последовательности рассмотрения подзадач ЛП (достаточно рассмотреть две различные
стратегии выбора).
4. Оформить отчет. Содержание отчета:
1) Постановка задачи целочисленного программирования.
2) Описание алгоритма решения методом ветвей и границ.
3) Полученное оптимальное решение и его экономическая интерпретация.
4) Дерево работы алгоритма.
5) Результаты исследований п. 3.
Задание 2.3.
Производится планирование предвыборной кампании. Денежные средства, выделяемые на проведение кампании, ограничены и
составляют 18 000 д. е. Избирательный округ включает 8 участков.
Данные о числе избирателей и денежных средствах, необходимых
для проведения мероприятий кампании по каждому участку, приведены в таблице 2.6.
Таблица 2.6
Участок
1
2
3
4
5
6
7
8
Число избирателей
3 100
2 600
3 500
2 800
2 400
2 700
3 600
3 000
Необходимые средства, д. е.
3 500
2 500
4 000
3 000
2 000
2 800
4 200
3 200
64
Каждый участок может либо использовать все выделенные ему
деньги, либо не использовать их совсем. Необходимо найти оптимальное распределение денежных средств между участками.
1. Сформулировать задачу целочисленного программирования.
2. Показать, что концептуально задача может рассматриваться как
задача о загрузке судна, и решить ее методом ветвей и границ.
Построить дерево работы алгоритма.
3. Оформить отчет. Содержание отчета:
1) Постановка задачи целочисленного программирования.
2) Обоснование выбора алгоритма решения.
3) Описание алгоритма решения.
4) Полученное оптимальное решение и его интерпретация.
5) Дерево работы алгоритма.
3. èêàçüíàÖ êÖòÖçàâ èêà åçéÉàï äêàíÖêàüï.
áÄÑÄóà ë éÅöÖäíàÇçõåà åéÑÖãüåà
Особенность задач, рассматриваемых в данном разделе, состоит
в следующем: модель, описывающая ОДР задачи, объективна, но
качество решения оценивается по нескольким критериям (возможно, противоречивым). В условии задачи отсутствует информация,
позволяющая найти компромисс между оценками по различным
критериям, поэтому этот компромисс не может быть найден на основе объективных расчетов. Такие задачи являются слабоструктурированными (недостаток объективной информации принципиально неустраним на момент принятия решения). Для анализа и
решения таких задач разработаны специальные методы.
3.1. åÖíéÑõ ìëíêÄçÖçàü åçéÉéäêàíÖêàÄãúçéëíà
çÄ éëçéÇÖ èéÑïéÑÄ àëëãÖÑéÇÄçàü éèÖêÄñàâ
На основе подхода исследования операций были разработаны
следующие методы устранения многокритериальности.
65
1. Условная оптимизация (перевод всех критериев, кроме одного,
в ограничения).
Примером может служить известный метод «стоимостьэффективность» (разработан в конце 50-х гг. XX в. в США для решения военных задач). Суть метода состоит в следующем. Разрабатываются объективные модели стоимости и эффективности, аналогичные
моделям исследования операций. При согласовании критериев стоимости и эффективности используются следующие подходы:
• фиксированная эффективность при минимально возможной
стоимости (выбор «самого дешевого» варианта решения, обладающего заданной эффективностью);
• фиксированная стоимость при максимально возможной эффективности (случай бюджетных ограничений).
Объективный ответ на вопрос, на каком уровне установить ограничение на один из критериев, в общем случае не вытекает из
условий задачи (ни требуемая эффективность, ни бюджетные ограничения обычно не устанавливаются жестко). При нескольких критериях (более двух) этот вопрос становится еще сложнее. Таким
образом, при переводе всех критериев, кроме одного, в ограничения, исследователь совершает произвол, ничем не оправданный с
точки зрения лица, ответственного за решение проблемы.
2. Постулирование некоторых «принципов», определяющих наилучшее решение (справедливой уступки, введение агрегированного критерия и т. п.).
В этом случае возникает проблема обоснования выбора принципа, определяющего наилучшее решение. Как правило, этот выбор не
вытекает из имеющейся объективной информации. Н. Н. Моисеев
отмечает, что выбор того или иного принципа «соответствует определенным гипотезам, принятие которых остается на совести исследователя» [7].
3. Разделение процесса решения задачи на два этапа.
Первый этап — объективный анализ проблемы, выявление и
исследование бесспорных зависимостей. Результатами первого
этапа обычно являются объективная модель задачи и множество
Парето. Второй этап — окончательное нахождение наилучшего
решения. Выполняется лицом, ответственным за принятие решения, которому переданы результаты первого этапа.
66
Следует отметить: исключение из рассмотрения альтернатив, не
принадлежащих множеству Парето, не решает задачу многокритериального выбора, а только облегчает ее решение. На втором этапе
проблема многокритериальности остается (хотя и для меньшего
числа альтернатив).
Подводя итоги, можно заключить:
— необходимость принятия решений при многих критериях требует нахождения способов соизмерения критериев;
— выбор соотношений между критериями должен быть основан
на предпочтениях лица, принимающего решение (ЛПР).
Отсюда вытекает важный с методологической точки зрения шаг:
отказ от поиска объективного, единственно возможного решения
проблемы. Этот шаг является признаком появления новой парадигмы, характерной для принятия решений при многих критериях.
Следует отметить: качество решения, основанного на субъективной информации (предпочтениях ЛПР), зависит не только от
личности ЛПР, но и от процедуры выработки решения.
3.2. åçéÉéäêàíÖêàÄãúçõÖ áÄÑÄóà
ãàçÖâçéÉé èêéÉêÄååàêéÇÄçàü
Многокритериальные задачи математического (чаще всего, линейного) программирования широко распространены при обосновании экономических, организационных, технических решений.
Для анализа таких задач используется «подход, основанный на
идее выявления предпочтений одновременно с исследованием допустимого множества действий для отыскания эффективных решений» [4]. Средством реализации этого подхода являются человекомашинные (интерактивные, диалоговые) процедуры.
3.2.1. Постановка многокритериальной задачи ЛП
Объектом применения большинства человеко-машинных процедур (ЧМП) является многокритериальная задача ЛП в следующей постановке.
67
Задача 1.
Требуется найти вектор х = (х1, х2, … , xn)T, принадлежащий области
D = {A·x = b; xi ≥ 0, i = 1, 2, … , n},
(3.1)
где
⎛ a11 a12
⎛ b1 ⎞
a1n ⎞
⎜
⎟
⎜ ⎟
a2 n ⎟
⎜ a21 a22
⎜ b2 ⎟
A =⎜
⎟, b = ⎜ ⎟,
⎜
⎟
⎜ ⎟
amn ⎠
⎝ am1 am 2
⎝bm ⎠
и максимизирующий (минимизирующий) совокупность целевых
функций
n
Ck ( x ) = ∑ Cik xi , k =1, 2, … , N
(3.2)
i=1
при наиболее предпочтительном соотношении между их значениями в точке решения.
Последнее требование означает, что на множестве эффективных (парето-оптимальных) решений требуется найти решение х*,
соответствующее экстремуму априорно неизвестной функции полезности V(z) ЛПР:
x* ∈ arg maxV ( z ( x )) ,
(3.3)
где z(x) = (C1(x), C2(x), … , CN(x)).
Доказано, что любое эффективное решение задачи (3.1)–(3.2)
может быть найдено как точка максимума взвешенной суммы целевых функций C1(x), C2(x), …, CN(x) с априорно неизвестными весами. Поэтому формально нахождение х* сводится к интерактивному процессу поиска оценки вектора весов λi = (λi1, λi2, … , λiN ) и
вычисления
T
x i ∈ arg max λ i ⋅( z i ) ,
i
i
i
i
(3.3')
где z = (C1(x ), C2(x ), … , CN(x )), верхний индекс означает номер
итерации. Поиск хi, удовлетворяющего (3.3'), означает решение задачи ЛП с одним критерием
68
N
C ( x i ) = ∑ λik Ck ( x i ) .
(3.4)
k =1
Замечание.
Формальное представление (3.3') не означает, что все ЧМП
представляют собой итеративные процедуры поиска весов. Но после того, как решение найдено, оно всегда может быть представлено в виде (3.3').
В ряде задач проблема многокритериальной оптимизации может рассматриваться как задача поиска удовлетворительного решения.
Задача 2.
Требуется найти решение (вектор х = (х1, х2, … , xn)T, удовлетворяющий (3.1)), которое обеспечивает выполнение условий
Ck(x) ≥ lk, k = 1, 2, … , N.
(3.5)
ЛПР обычно не может заранее сообщить значения порогов lk, выделяющих множество L удовлетворительных решений в D. В общем
случае величины lk зависят от достигнутых по другим критериям значений, поэтому условия (3.5) могут корректироваться по мере анализа
новых альтернатив и изменения представлений ЛПР об ОДР.
Возможны и другие постановки многокритериальной ЗПР.
3.2.2. Общая характеристика ЧМ процедур
В большинстве ЧМП используется два вспомогательных преобразования.
1. Перед решением задачи производится нормирование целевых
функций Ck(x) и порогов lk. Например, для целевых функций
выполняется преобразование
Ck′ ( x ) =
Ck ( x ) − C k
C k −C k
,
где C k , C k − соответственно минимальное и максимальное значения функции Ck(x); значения функции C'k(x) — в диапазоне от 0 до 1.
69
2. Наряду с текущим значением х вычисляются экстремальные значения (х)ν, получаемые при оптимизации одного критерия Сν.
Обозначим: zν = (y1ν, y2ν, … , yNν), где ykν = Ck((x)ν), k, v = 1, 2, … , N.
zν — вектор целевых функций решения (х)ν, оптимального по критерию Сν.
Набор z1, z2, … , zN составляет матрицу Y, на главной диагонали
которой yνν — недостижимые одновременно значения, образующие
точку «абсолютного максимума». Анализ матрицы Y способствует
осознанию диапазона допустимых альтернатив. В частности, сравнение (y11, y22, … , yNN) и вектора z(x) помогает ЛПР оценить реалистичность и степень достижения поставленной цели.
Общая схема ЧМ процедуры
ЧМП включает чередующиеся фазу оптимизации (выполняет
ЭВМ) и фазу анализа (выполняет ЛПР). Каждая фаза может включать несколько шагов.
• На фазе оптимизации ЭВМ
а) используя полученную от ЛПР на предыдущем шаге информацию Ii–1ЛПР, формирует новую ОДР Di;
б) вычисляет соответствующее новым данным решение xi и характеризующий его вектор zi;
в) вырабатывает вспомогательную информацию IiЭВМ.
• На фазе анализа ЛПР
г) оценивает предъявленное решение xi (или несколько решений)
и определяет, является ли оно приемлемым;
если да, то процедура окончена;
в противном случае — анализирует вспомогательную информацию IiЭВМ;
д) сообщает дополнительную информацию IiЛПР, с помощью которой можно вычислить новое решение xi+1.
Различные ЧМ процедуры отличаются друг от друга содержанием и способами выполнения каждого из перечисленных шагов.
Эффективность процедуры определяется в наибольшей степени
характером взаимодействия ЛПР и ЭВМ, выражаемом в количестве
и качестве информации I iЭВМ и I iЛПР. По взаимодействию ЛПР–
ЭВМ ЧМП можно разделить на 3 группы [2, 4]:
70
1) прямые ЧМ процедуры;
2) процедуры оценки векторов;
3) процедуры поиска удовлетворительных значений критериев.
Для прямых ЧМП характерно, что ЛПР непосредственно ведет
поиск предпочтительного варианта, задавая на каждом шаге либо
новое решение xi, либо новые значения параметров, по которым
оно может быть вычислено (отсутствует шаг а) ). В основе лежит
предположение, что ЛПР без труда определит необходимый компромисс между критериями, ему нужно лишь некоторое изучение
ОДР. Достоинствами прямых ЧМП являются относительная простота и возможность реализации на базе различных методов математического программирования. Недостаток состоит в следующем:
при увеличении числа критериев ЛПР сложно оценить влияние
значений весов и каждого из ограничений на получаемое решение.
В основе процедур оценки векторов лежит предположение, что
ЛПР может непосредственно оценивать полезность вариантов решений, предъявляемых ему в виде векторов в пространстве критериев, и систематически искать в этом пространстве наилучший
вектор. Разработано множество ЧМ процедур данного типа. Наиболее известные — процедура Дайера-Джоффриона, ЗайонцаВаллениуса и др. Отличие от прямых методов состоит в систематическом поиске, помогающем ЛПР выбрать наилучшее решение.
Уязвимое место многих процедур этой группы — предположение,
что ЛПР может безошибочно определять оптимальное направление
изменения целевой фукции (3.4).
Для процедур поиска удовлетворительных значений критериев
характерно, что ЛПР, накладывая и изменяя ограничения на значения критериев в точке решения, решает задачу поиска значений lk в
(3.5). Одной из первых ЧМП этого типа была процедура STEM. Авторы этой процедуры: Бенайюн Р. (Benayoun R.), Ларичев О. И.,
Монгольфье Ж. (Montgolfier J.), Терни Ж. (Tergny J.). Далее представлен алгоритм и пример практического применения процедуры
STEM.
71
3.2.3. Процедура STEM
Алгоритм выполнения процедуры STEM [2, 4].
Шаг аi).
Вычисляется нормированная матрица Yi, на основании которой
определяется система весов λi, соответствующая наибольшей сумме относительных значений критериев.
Матрица Yi характеризует область допустимых значений:
• если значения двух столбцов близки, то соответствующие
критерии зависимы (изменения всех иных критериев одинаково влияют на эти два критерия);
• можно выявить противоречивые критерии: высокая оценка
по одному сопровождается низкой оценкой по другому.
Веса λi определяются следующим образом. Пусть αik — среднее
значение, взятое по всем элементам k-го столбца матрицы Yi, кроме
диагонального. Индексы (технические веса) критериев λik, k = 1, 2,
… , N, определяются из системы уравнений:
λik 1− αik
, j≠k ;
=
λij 1− αij
N
∑ λ =1 .
i
k
k=1
Термины «индекс», «технический вес» подчеркивают, что значения λik не назначаются ЛПР, а вычисляются. Индекс может интерпретироваться как коэффициент внимания, которое следует
уделять критерию при поиске решения: если все элементы k-гo
столбца близки к единице, то значение αk тоже близко к единице,
значение (1 — αk) близко к нулю, и соответствующий индекс мал.
Это значит, что при оптимизации по другим критериям значение
данного критерия близко к наилучшему, и можно не уделять ему
внимание. И наоборот.
Шаг бi).
Определяется решение xi задачи (3.3') и вычисляется вектор zi.
Шаг вi).
Формируется сообщение IiЭВМ = {zi, Yi}.
Шаги г i, д i).
Если x i ∉ L (не выполняется хотя бы одно из условий (3.5)), то
ЛПР указывает, значение по какому из критериев является наиме72
нее удовлетворительным и насколько его следует улучшить: IiЛПР =
={Vμ(zi), liμ}, где Vμ(zi) — характеристический критериальный вектор, μ-я компонента которого равна 1, а остальные компоненты
равны 0; liμ — величина порога удовлетворительности.
Шаг аi+1).
Определяется новая ОДР Di+1:
к области Di добавляется ограничение Cμ(x) ≥ liμ.
Определяется матрица Yi+1 и система весов λi+1.
Шаг бi+1).
Определяется решение xi+1 и вычисляется вектор zi+1.
Шаг вi+1).
Формируется сообщение Ii+1ЭВМ = {zi+1, Yi+1} и т. д.
Авторы применяли процедуру STEM для решения задачи анализа
различных вариантов управления кадрами крупной фирмы (N = 4,
m = 200, n = 350). В литературе имеется описание применения
этой процедуры к оптимизации производственной программы
предприятия.
Пример применения процедуры STEM: управление персоналом
[2, 4].
Консультативной фирмой SEMA (Франция) была предложена
модель, характеризующая изменения состава персонала крупной
организации и продуктивности ее работы. Эта модель применялась
для прогнозирования последствий различных вариантов управления кадрами (разные стратегии приема на работу и повышения в
должности через два, три и четыре года). В качестве переменных
модели рассматривалось количество сотрудников, назначенных на
различные должности в определенные периоды времени.
Использовалось четыре критерия, представляющих собой линейные функции от переменных: общее «удовлетворение» кадров
(SA); фактическая эффективность работы кадров (EF); стоимость
приема на работу дополнительных сотрудников (ЕВ); стоимость нехватки кадров по отношению к прогнозируемым потребностям (ЕС).
При построении модели фиксировались следующие зависимости:
1) эффективность работы сотрудника линейно зависит от отношения оценки его возможностей Q к оценке требований t,
предъявляемых к сотруднику на данной должности;
73
2) удовлетворение сотрудника во время пребывания на определенной должности сначала возрастает до максимального значения, а затем со временем уменьшается до первоначального значения также в зависимости от отношения Q к t.
После формализации была получена многокритериальная задача ЛП с 4 критериями качества, 350 переменными и 200 ограничениями. Никакой априорной информации о сравнительной важности
критериев не имелось.
Для решения задачи использовалась процедура STEM.
Шаг а1).
1) Выполнение оптимизации (в ОДР — области D1) по каждому из критериев отдельно.
2) Нормирование критериев и переход к относительным значениям критериев.
Итог: нормированная матрица Y1 (диагональные элементы равны 1, внедиагональные элементы меньше 1):
Критерии
SA
EF
EB
EC
SA
EF
EB
EC
1
0,86
0,131
0,442
0,875
1
0,149
0,45
0,275
0,09
1
0,733
0,83
0,765
0,4
1
Результаты анализа матрицы Y 1:
— сильная зависимость критериев SA и EF;
— противоречивость этих критериев критериям ЕВ и ЕС;
— противоречивость критериев ЕВ и ЕС друг другу.
3) Определение начальных индексов (технических весов) критериев:
α1k — среднее значение, взятое по всем элементам k-го столбца
матрицы Y1, кроме единицы, k = 1, 2, 3, 4;
индексы критериев определяются из системы уравнений
λ1k 1− α1k
;
=
λ1j 1− α1j
74
4
∑ λ =1 .
1
k
k =1
Итог:
Критерии
λ1k
SA
0,261
EF
0,256
EB
0,317
EC
0,166
Шаг б1).
Решение задачи
C 1 ( x ) = λ11 ⋅SA ( x ) + λ12 ⋅ EF ( x ) + λ13 ⋅ EB ( x ) + λ14 ⋅ EC ( x ) → max ,
определение вектора x1 = arg max C1(x)
и вектора z1 = (SA(x1), EF(x1), EB(x1), EC(x1)).
Результат: z1 = (0,965; 0,85; 0,45; 0,675).
Шаг в1).
Предъявление ЛПР I1ЭВМ:
ненормированных значений вектора z1: (0,965; 0,85; –1920; –1269);
ненормированных значений диагональных элементов матрицы Y1
(значения, достигаемые при максимизации по каждому из критериев в отдельности) как ориентира: (1; 1; –276; –157).
Вопрос к ЛПР: все ли компоненты вектора z1 имеют удовлетворительные значения?
Шаги г1, д1).
Ответ ЛПР I1ЛПР: V3(z1) = (0, 0, 1, 0), l13 = –1000
(значение по критерию ЕВ — наименее удовлетворительное; приемлемым является значение ЕВ = –1000).
Шаг а2).
1) Определение новой ОДР D2 (в диалоге с ЛПР).
1
1
• К области D добавляется ограничение ЕВ(x) ≥ l 3 = –1000
и, поочередно, ограничения, соответствующие близким к l13 значениям; находятся максимально возможные значения остальных критериев.
Критерии
SA
EF
EC
EB ≥ –750
0,67
0,62
– 731
EB ≥ –1000
0,78
0,72
– 157
75
EB ≥ –1250
0,84
0,82
– 157
EB ≥ –1500
0,90
0,88
– 157
• Анализ таблицы (ЛПР):
вектор, соответствующий ограничению ЕВ ≥ –1500, обеспечивает приемлемый компромисс между повышением качества по
критерию ЕВ и понижением качества по критериям SA и EF.
Результат: новая ОДР получается добавлением к области D1 ограничения
ЕВ(x) ≥ –1500.
2) Нормирование критериев и переход к относительным значениям.
3) Определение новых значений индексов трех критериев для
ОДР D2: λ21, λ22, и λ24.
Шаг б2).
Решение задачи
C 2 ( x ) = λ12 ⋅SA ( x ) + λ22 ⋅ EF ( x ) + λ24 ⋅ EC ( x ) → max ,
определение вектора x2 = arg max C2(x)
и вектора z2 = (SA(x2), EF(x2), EC(x2)).
Шаг в2).
Предъявление ЛПР I 2ЭВМ:
ненормированных значений вектора z2: (0,885; 0,775; –1068);
ненормированных значений диагональных элементов матрицы Y2
(значения, достигаемые при максимизации по каждому из критериев в отдельности) как ориентира: (0,9; 0,88; –157).
Вопрос к ЛПР: все ли компоненты вектора z2 имеют удовлетворительные значения?
Шаги г2, д2).
Ответ ЛПР I2ЛПР: V3(z2) = (0, 0, 1), l23 = –600
(значение по критерию ЕС — наименее удовлетворительное; приемлемым является значение ЕС = –600).
Шаг а3).
1) Определение новой ОДР D3:
2
2
• К области D добавляется ограничение EC(x) ≥ l 3 = –600
и, поочередно, ограничения, соответствующие близким к l23 значениям; находятся максимально возможные значения остальных критериев.
76
Критерии
EС ≥ –800
EB ≥ –600
EB ≥ –400
SA
EF
0,85
0,8
0,8
0,75
0,73
0,68
• Анализ таблицы (ЛПР):
— вектор, полученный при ЕС ≥ –800 обеспечивает приемлемый
компромисс между повышением качества по критерию ЕС и
понижением качества по критериям SA и EF;
— с учетом сильной взаимозависимости критериев SA и EF, решение, соответствующее максимуму EF, выбирается как окончательное решение проблемы:
SA = 0,85; EF = 0,8; EB = –1500; EC = –800.
Блок-схема процедуры STEM [2, 4] представлена на рис. 3.1.
Исследование ОДР.
Оптимизация по каждому из критериев
Определение индексов критериев.
Оптимизация по критерию (2.4)
Диалог с ЛПР
(предъявляются вектор zi и
диагональные элементы матрицы Yi ).
Все ли компоненты вектора zi имеют
удовлетворительное значение?
Нет
Выбор критерия Сμ с наименее удовлетворительным
значением. Назначение удовлетворительного значения
для критерия Сμ
Определение максимально возможных значений остальных
критериев при ряде ограничений, наложенных на Сμ
Выбор ЛПР ограничения, накладываемого на
критерий Сμ. Переход к новой ОДР
Окончательное решение
Рис. 3.1. Блок-схема процедуры STEM.
77
Да
3.3. áÄÑÄçàü Ñãü ëÄåéëíéüíÖãúçéÉé ÇõèéãçÖçàü
Задание 3.1
Администрация небольшого города разрабатывает ставки местного налогообложения. Ежегодная база налогообложения недвижимости составляет 550 млн. д. е., налогообложения розничных и
оптовых продаж — 35 млн. и 55 млн. д. е. соответственно. Ежегодное потребление городом бензина оценивается в 7,5 млн. галлонов.
Администрация планирует разработать систему налоговых ставок,
основанную на перечисленных базах налогообложения и учитывающую следующие требования:
• налоговая ставка на недвижимость не может составлять более 0,03;
• налоговые ставки на розничную и оптовую продажи не могут превышать 0,1;
• налог на бензин не должен превышать 0,04 д. е. за галлон.
При этом
1) желательно, чтобы налоговые поступления составили не менее 25 млн. д. е. от всех баз налогообложения;
2) желательно, чтобы налог с розничных продаж не превышал
10% от суммы всех собираемых налогов;
3) желательно, чтобы налог с оптовых продаж не превышал
15% от суммы всех собираемых налогов;
4) желательно, чтобы налог на бензин не превышал 0,02 д. е. за
галлон.
1. Сформулировать многокритериальную задачу ЛП.
Указание.
Требования относительно налоговых ставок (маркированный
список) определяют систему ограничений. Условия 1) — 4) позволяют сформулировать целевые функции (частные критерии).
Обозначим х1, х2, х3, х4 — налоговые ставки на недвижимость,
розничную и оптовую продажу и на бензин соответственно.
Тогда, например, условие 2) можно формализовать следующим
образом:
35х2 + С2 = 0,1(550х1 + 35х2 + 55х3 + 7,5х4),
С2 → max.
78
2. Построить ЧМ процедуру определения ставок налогообложения, удовлетворяющих предъявляемым требованиям и оптимизирующих совокупность целевых функций. Предусмотреть,
чтобы информация IЭВМ выводилась в удобной для ЛПР форме
(например, не значение С2, полученное в результате выполнения очередного шага, а соответствующий этому значению процент, который составляет налог с розничных продаж в общей
сумме налогов).
3. Решить полученную задачу с помощью разработанной ЧМ процедуры (для решения последовательности задач ЛП можно использовать MS Excel).
4. Оформить отчет. Содержание отчета:
1) Постановка многокритериальной задачи ЛП.
2) Описание ЧМ процедуры нахождения приемлемого решения
и краткое описание рекомендуемых программных модулей.
3) Описание работы процедуры при решении поставленной задачи по шагам (включая результаты, получаемые на каждом
шаге, IЭВМ и IЛПР).
4) Полученные результаты и их интерпретация.
Задание 3.2
Лесозаготовительная компания использует три участка леса
площадью 100 тыс., 180 тыс. и 200 тыс. акров для заготовки древесины и последующих лесопосадок. Древесная продукция компании
разбита на три основные категории: пиломатериал, клееная фанера и
древесная измельченная масса. Для каждого участка лесного массива возможны различные альтернативные варианты его эксплуатации,
которые различаются стоимостью разработок, арендной платой, периодом чередования вырубок и лесопосадок, объемом произведенной продукции. Альтернативы представлены в таблице 3.1.
Для гарантии будущего производства необходимо, чтобы на
каждый акр леса, выведенный из использования, приходилось
столько не выведенных из использования акров леса, каков период
чередования вырубок и лесопосадок. Арендная плата — это плата,
взимаемая за порубку леса.
79
Таблица 3.1
3
Участок
1
2
3
д. е. в год/акр Период чем в год/акр
Альтерна
редования Пиломате
Древесная
тива Стоимость Аренда
Фанера
(годы)
масса
риалы
A1
1000
160
20
12
0
0
A2
800
117
25
10
0
0
A3
1500
140
40
5
6
0
A4
1200
195
15
4
7
0
A5
1300
182
40
3
0
7
A6
1200
180
40
2
0
6
A7
1500
135
50
3
0
5
A1
1000
102
20
9
0
0
A2
800
55
25
8
0
0
A3
1500
95
40
2
5
0
A4
1200
120
15
3
4
0
A5
1300
100
40
2
0
5
A6
1200
90
40
2
0
4
A1
1000
60
20
7
0
0
A2
800
48
25
6
4
0
A3
1500
60
40
2
0
4
A4
1200
65
15
2
0
3
A5
1300
35
40
1
0
5
Компания преследует цели: ежегодное производство пиломатериалов, фанеры и древесной массы должно быть не менее 200 тыс.,
150 тыс. и 350 тыс. м3 соответственно. При этом:
• ежегодный бюджет на восстановление леса составляет
2,5 млн. д.е.;
• ежегодная арендная плата должна составлять 100 д. е. за акр.
Требуется определить оптимальный вариант эксплуатации для
каждого участка леса.
1. Сформулировать многокритериальную задачу ЛП.
2. Построить ЧМ процедуру определения оптимального варианта
эксплуатации участка леса.
80
3. Решить поставленную задачу с помощью разработанной ЧМ
процедуры.
4. Оформить отчет. Содержание отчета:
1) Постановка многокритериальной задачи ЛП.
2) Описание ЧМ процедуры нахождения приемлемого решения
и краткое описание рекомендуемых программных модулей.
3) Описание работы процедуры при решении поставленной задачи по шагам (включая результаты, получаемые на каждом
шаге, IЭВМ и IЛПР).
4) Полученные результаты и их интерпретация.
4. èêàçüíàÖ êÖòÖçàâ
çÄ éëçéÇÖ ëìÅöÖäíàÇçõï åéÑÖãÖâ.
éëçéÇõ íÖéêàà èéãÖáçéëíà
В этом и следующем разделе рассматриваются методы обоснования решений, ориентированные на задачи, в которых используются модели субъективного характера: строится не модель окружающей реальности, а модель желаний, предпочтений, политики
человека, принимающего решение.
4.1. éëçéÇçõÖ èéçüíàü íÖéêàà éÑçéåÖêçéâ èéãÖáçéëíà
4.1.1. Постановка задачи
ЛПР должен выбрать одну из нескольких альтернатив (способов
действий) А1, А2, … , Аm, каждая из которых в конечном итоге будет
иметь результатом некоторый исход. Оценка предпочтительности
возможных исходов осуществляется с помощью одного критерия f.
В общем случае ЛПР не знает точно, к какому именно исходу приведет любая из выбранных альтернатив, но для каждой альтернативы может установить вероятности различных исходов. Такая ситуация характерна для задач принятия решения в условиях риска.
81
Примеры одномерных (один критерий) задач.
1. Пусть цель компании состоит в максимизации прибыли. Критерием, выбранным для описания исходов, может быть
— нарастающий итог денежных поступлений,
— чистый денежный доход и т. п.
2. Службы, рассчитанные на непредвиденные случаи (скорая помощь, полиция, пожарная служба), отвечают на запросы о помощи, высылая служебный транспорт. Критерий эффективности — период реагирования (период времени от момента
получения запроса до момента прибытия служебного транспорта на место происшествия).
3. Системы массового обслуживания. Целью проводимого исследования является улучшение обслуживания. Критерием может
быть
— «время задержки» (время, в течение которого заявка ожидает
обслуживания),
— эффективность выполнения операций.
Например, эффективность работы аэропорта может характеризоваться числом взлетно-посадочных операций в час.
Замечание.
Ситуация, когда результатом выбора альтернативы является наступление некоторого детерминированного исхода, может рассматриваться как частный случай исследуемой в данном разделе
задачи выбора в условиях риска (единственный возможный исход
наступает с вероятностью 1).
Если каждому возможному исходу поставлено в соответствие
значение «полезности» этого исхода, то рациональный выбор —
это выбор альтернативы с наибольшей ожидаемой полезностью.
Для возможности численного сравнения полезностей требуется
формализация понятия «полезность».
4.1.2. Аксиомы рационального выбора.
Общий принцип рационального выбора
Будем рассматривать индивидуума (ЛПР), система предпочтений которого является полной: для любых двух событий (возможных исходов) он может указать, какое из них является более пред82
почтительным, либо указать, что данные исходы для него равноценны. Будем обозначать:
x
y — исход х более предпочтителен, чем у;
х ~ у — исходы х и у равноценны.
Предположим также, что ЛПР может сравнивать не только детерминированные исходы, но и альтернативы, связанные с риском
(лотереи).
Лотереей (x, p, y) будем называть игру (рискованный выбор) с
двумя исходами: х с вероятностью р и у с вероятностью 1– р (рис. 4.1).
х
р
1– р
у
Рис. 4.1. Лотерея (x, p, y)
Ожидаемая (средняя) цена лотереи (x, p, y) равна р·х + (1 — р)у.
Предполагается, что ЛПР имеет четкое представление, что он
предпочитает: детерминированный исход х или лотерею (y, 0.5, z).
Ясно, что
( y, 0.5, z ) ;
y
z , то x
если x
z
x , то ( y, 0.5, z )
x.
и если y
Но если z
x
y , то любое утверждение о предпочтении
между х и лотереей (y, 0.5, z) содержит существенно новую инфор( y, 0.5, z ) , то это позволяет заклюмацию. А именно: если x
чить, что предпочтение х по сравнению с у превышает предпочтение z по сравнению с х.
y
Получение численной оценки отношения предпочтения x
x основано на следующей идее. Если 0 < р <
к предпочтению z
1, и детерминированный исход х находится в отношении безразличия с лотереей (y, 1 — р, z), то р можно рассматривать как численy к предпочтению
ную оценку отношения предпочтения x
83
z
y . Развитие идеи предполагает построение правила соответствия, которое полезности каждого исхода х сопоставляет число
U(x) такое, что
y следует U(x) > U(y);
(4.1)
1) из x
(4.2)
2) U((x, р, у)) = рU(x) + (1 — р)U(у).
Для существования численного представления полезности в
указанном смысле необходимо выполнение ряда условий, формулируемых в виде аксиом.
Аксиома 1.
Все рассматриваемые исходы х, у, z, … принадлежат некоторому множеству Х исходов; на Х задано отношение предпочтитель.
ности
Аксиома 2.
является линейным порядком на Х. Это означает:
Отношение
1) Для любых исходов x и y выполняется одно и только одно из
y или y
x.
соотношений: х ~ у, x
y и y
z следует x
z (транзитивность).
2) Из x
Аксиома 3.
( x, p, y ) ; из x ≺ y следует
Из x
y следует x
x ≺ ( x, p, y ) .
Аксиома 4.
y
z следует, что существует вероятность р, 0 < p < 1,
Из x
такая что ( x, p, z ) ≺ y ;
Сколь бы предпочтителен не был исход х сам по себе, его
влияние можно сделать сколь угодно слабым, придавая ему
достаточно малую вероятность (предпочтение между y и z
сохраняется)
из x ≺ y ≺ z следует, что существует вероятность р, 0 < p < 1,
такая что ( x, p, z )
y.
Аксиома 5.
(х, р, у) ~ (y, 1 — р, х).
84
Аксиома 6.
( (x, p, y), q, y) ~ (x, pq, y), т. е. лотереи
р
х
рq
q
1– р
1– q
у
х
у
1– рq
и
у
являются равноценными.
Теорема 4.1
Если выполняются аксиомы 1 — 6, то существует числовая
функция полезности U, определенная на множестве исходов Х,
для которой справедливы соотношения (4.1) и (4.2). При этом
функция U(x) является единственной с точностью до линейного
преобразования: если существуют две функции полезности U и
U', то U'(x) = ω0U(x) + ω1, где ω0 > 0.
Обозначим через L лотерею, имеющую исходы (выигрыши)
х1, х2, …, хn , наступающие с вероятностями р1, р2, … , рn соответственно. Ожидаемая (средняя) цена лотереи L (математическое
ожидание выигрыша) равна
n
х = ∑ xi ⋅ pi .
(4.3)
i=1
Ожидаемая полезность этой лотереи равна
n
U ( L ) = ∑U ( xi )⋅ pi
(4.4)
i=1
и является показателем, который при выборе лотереи следует максимизировать.
Общий принцип рационального выбора:
1) для каждого действия (альтернативы) определить возможные исходы и вероятности этих исходов,
2) определить ожидаемую полезность каждого действия,
3) выбрать действие (альтернативу) с наибольшей ожидаемой
полезностью.
85
Правило выбора альтернативы в соответствии с 3) известно как
критерий ожидаемой полезности.
Замечание.
Ожидаемая цена и ожидаемая полезность лотереи, определяемые формулами (4.3) и (4.4), относятся к лотерее с конечным числом исходов. В случае бесконечного числа исходов вероятностное
распределение описывается плотностью f(x). В этом случае ожидаемая цена лотереи (ожидаемый выигрыш) равна
х = ∫ x⋅ f ( x ) dx ;
(4.5)
X
ожидаемая полезность лотереи равна
U ( L ) = ∫ U ( x )⋅ f ( x ) dx .
(4.6)
X
4.1.3. Методы построения
одномерных функций полезности
Детерминированным эквивалентом (эквивалентом определенности) лотереи L называется величина x̂ такая что ЛПР безразличен в выборе между участием в лотерее L и гарантированным получением x̂ :
U ( ˆx ) = U ( L )
(4.7)
или x̂ = U −1 (U ( L )) .
Прямой метод установления полезности основан на следующей
идее. Поскольку полезность не абсолютна, а относительна, то можно произвольно назначить полезности двух исходов (установить
начало отсчета и единицу измерений), а затем для остальных исходов определить их полезность относительно этих двух. Обозначим:
х0 — наименее предпочтительный (один из наименее предпочтительных) исход,
х* — наиболее предпочтительный (один из наиболее предпочтительных) исход.
Положим U(х0) = 0, U(х*) = 1.
86
Для каждого исхода х полезность определяется путем установления вероятности р, при которой х является детерминированным
эквивалентом лотереи (х*, р, х0):
U(x) = p·U(x*) + (1 — p)·U(х0) = p.
Значение р устанавливает ЛПР.
Пример 4.1
Инвестиция в 20 000 д. е. может при наиболее благоприятной
ситуации принести прибыль в 40 000 д. е.; при наименее благоприятной ситуации — быть полностью потеряна.
Тогда U(х0) = U(–20 000) = 0, U(х*) = U(40 000) = 1.
Необходимо определить полезность промежуточных значений:
–10 000, 0, 10 000, 20 000, 30 000.
Пусть х = 20 000.
Вопрос к ЛПР:
каково значение вероятности р, при которой
безразличен выбор между гарантированным получением 20 000 д.
е. и лотереей (40 000, р, –20 000)?
Ответ ЛПР: р = 0,8.
Тогда U(20 000) = 0,8·U(40 000) + 0,2·U(–20 000) = 0,8.
Значения полезности для остальных исходов определяются
аналогично.
После определения значений полезностей исходов рекомендуется проверить согласованность суждений ЛПР. Пусть x′ ≺ x′′ ≺ x′′′ ,
причем х'' — детерминированный эквивалент лотереи (х''', р, х').
Условие согласованности:
число р должно удовлетворять равенству
U(x'') = p·U(x''') + (1 — p)·U(х')
или
p =
U ( x′′) −U ( x′)
.
U ( x′′′) −U ( x′)
Прямой метод установления полезности может применяться в
задачах, где число исходов сравнительно невелико (по данным [3],
не более 50). При наличии большого числа исходов и/или естест-
87
венного упорядочения исходов целесообразнее другой подход.
Суть его состоит в выполнении следующих действий:
• непосредственного установления полезностей для нескольких исходов с помощью прямого метода;
• подбора кривой, описывающей полученные точки (xi, U(xi))
с помощью регрессионного анализа, линейной интерполяции
и т. п.
Качественные характеристики функции полезности отражают
определенные особенности предпочтений ЛПР относительно возможных исходов и лотерей. Математическое выражение этих особенностей позволяет сформулировать ограничения на функцию
полезности, что может существенно облегчить процедуру построения этой функции.
Одна из таких характеристик — монотонность.
Примеры.
1) Исходы хi — значения прибыли (в денежных единицах).
Практически для любого ЛПР ( x1 < x2 ) ⇔ (U ( x1 ) < U ( x2 )) .
Функция полезности — монотонно возрастающая.
2) Исходы ti — время реагирования службы скорой помощи.
Тогда (t1 < t2 ) ⇔ (U (t1 ) > U (t2 )) .
Функция полезности — монотонно убывающая.
3) Медицинская практика: задачи, связанные с ненормальным содержанием сахара в крови пациента. Мерой эффективности х того
или иного метода лечения является процентное содержание сахара
в крови. В этом случае функция полезности не является монотонной (максимум полезности — при нормальном уровне сахара, отклонения от нормы как в сторону увеличения, так и в сторону
уменьшения приводят к уменьшению значения полезности).
Для монотонной функции полезности детерминированный эквивалент любой лотереи определяется единственным образом. Далее рассматриваются только возрастающие функции полезности.
Это обосновано следующими соображениями:
• если функция полезности убывает, то преобразованием критерия всегда можно добиться, чтобы она стала возрастающей;
88
• если функция полезности на всем исследуемом промежутке
не монотонна, то можно построить две функции полезности:
U1(x) на промежутке возрастания предпочтений,
U2(x) на промежутке убывания предпочтений.
График и функциональная форма функции полезности характеризуют отношение ЛПР к риску. Рассмотрим возможное поведение
ЛПР, анализирующего целесообразность участия в лотерее (х', 0.5,
х''), где x′ x′′ .
x′ + x′′
.
Ожидаемый выигрыш равен х =
2
ЛПР называется не склонным к риску, если он предпочитает гарантированное получение ожидаемого выигрыша любой лотереи
(х', 0.5, х'') участию в этой лотерее. Это означает, что полезность
для ЛПР ожидаемого выигрыша лотереи больше ожидаемой полезности этой лотереи.
Теорема 4.2
ЛПР не склонен к риску тогда и только тогда, когда его функция полезности вогнута (рис. 4.2 а).
ЛПР называется склонным к риску, если он предпочитает участие в любой лотерее (х', 0.5, х'') гарантированному получению
ожидаемого выигрыша этой лотереи. Это означает, что полезность
для ЛПР ожидаемого выигрыша любой лотереи меньше ожидаемой
полезности этой лотереи.
Теорема 4.3
ЛПР склонен к риску тогда и только тогда, когда его функция
полезности выпукла (рис. 4.2 б).
ЛПР называется безразличным (нейтральным) к риску, если для
него безразличен выбор между участием в любой лотерее (х', 0.5,
х'') и гарантированным получением ожидаемого выигрыша этой
лотереи. Это означает, что полезность для ЛПР ожидаемого выигрыша любой лотереи равна ожидаемой полезности этой лотереи.
Теорема 4.4
ЛПР безразличен к риску тогда и только тогда, когда его функция полезности линейна (рис. 4.2 в).
89
U(x)
U(x)
а
x
U(x)
б
x
в
x
Рис. 4.2. Функция полезности ЛПР, не склонного (а), склонного (б)
и безразличного (в) к риску
Для облегчения процедуры построения функции полезности
целесообразно использовать информацию о монотонности, а также
о склонности (несклонности, безразличия) ЛПР к риску.
Процедура построения функции полезности
Не существует единого свода правил построения функции полезности, которого следует жестко придерживаться во всех случаях. Однако существуют основные этапы, характерные для любой
процедуры построения [3]:
1. Подготовка к построению.
2. Идентификация качественных характеристик.
3. Установление количественных ограничений.
4. Подбор функции полезности.
5. Проверка согласованности.
Первый этап (может не проводиться, если ЛПР знаком с анализом решений) включает следующие мероприятия.
• Объяснение методологии анализа решений ЛПР.
Цель — обеспечить ситуацию, когда ЛПР осознает необходимость описания его предпочтений, намерено обдумывать свои суждения, касающиеся различных исходов, понимает необходимость
корректировки ранее высказанных суждений в случае изменения
своего мнения.
• Структуризацию задачи (с помощью ЛПР).
— Выбор критерия для описания возможных исходов;
— выбор шкалы для измерения значений критерия;
— ограничение области, на которой следует выявить предпочтения, до минимально возможных размеров: определение значе-
90
ний х0 и х*, таких, что выявляемые предпочтения должны относиться только к исходам х, удовлетворяющим х0 ≤ х ≤ х*.
Второй этап включает следующие мероприятия.
• Получение ответа на вопрос: является ли функция полезности монотонной.
Для этого требуется задать вопрос ЛПР: верно ли, что исход Q
предпочтительнее, чем S (рис. 4.3)? В случае положительного ответа: предпочтительнее ли T, чем R? И т. д. В заключение: если xk > xj,
всегда ли k-й исход предпочтительнее, чем j-й?
0
х
S
x(S)
Q
x(Q)
R
x(R)
T
x(T)
х*
Рис. 4.3. Выяснение характера монотонности функции полезности.
x(S), x(Q), … — оценки исходов S, Q, … по выбранной шкале.
• Получение ответа на вопрос: является ли ЛПР не склонным,
безразличным или склонным к риску.
Для этого требуется задать вопрос ЛПР: предпочитает ли он лотерею (x + h, 0.5, x — h) или гарантированное значение х при произвольно выбранных х и h? Вопрос можно повторять, варьируя
значения х и h (оставляя одно из них неизменным).
Если вся область возможных исходов покрыта (выбором лотерей) и всегда
— предпочитался х, то ЛПР не склонен к риску;
— предпочиталась лотерея, то ЛПР склонен к риску;
— выбор безразличен, то ЛПР безразличен к риску.
Третий этап включает следующие мероприятия.
• Установление значений полезности для нескольких конкретных точек.
Обычно это связано с нахождением детерминированного эквивалента для нескольких лотерей вида (х, 0.5, у). Для облегчения работы ЛПР можно использовать метод схождения. Суть метода состоит в следующем.
ЛПР задается вопрос: предпочитает ли он лотерею (x', 0.5, x'')
или х1. Значение х1 выбирается так, чтобы разумно было ожидать
выбор лотереи — см. рис. 4.4. Если ЛПР выбирает лотерею, то сле91
дующий вопрос: что предпочтительнее, лотерея или х2? Значение х2
выбирается так, чтобы разумно было ожидать выбор х2.
х'
х1
х3
х5 …
x̂ … х6
х4
х2
х''
Рис. 4.4. Процедура схождения
Следующий вопрос — относительно х3, близкого к х1. И т. д.
Процедура «схождения» продолжается до тех пор, пока не будет
достигнуто значение x̂ такое, что выбор x̂ и лотереи (x', 0.5, x'')
для ЛПР одинаково предпочтительны. Тогда
U ( ˆx ) = U (( x′, 0.5, x′′)) = 0.5 (U ( x′) +U ( x′′)) .
Процедура повторяется для нескольких лотерей.
Например, для построения функции полезности на промежутке
х0 ≤ х ≤ х1 требуется
— определить детерминированный эквивалент х0,5 для лотереи (х0,
0.5, х1), откуда U ( x0 ,5 ) = 0,5 (U ( x0 ) +U ( x1 )) ,
— определить детерминированные эквиваленты х0,25 и х0,75 для лотерей (х0, 0.5, х0,5) и (х0,5, 0.5, х1) соответственно, откуда
U ( x0 ,25 ) = 0,5 (U ( x0 ) +U ( x0 ,5 )) , U ( x0 ,75 ) = 0 ,5 (U ( x0 ,5 ) +U ( x1 )) .
Если предпочтения ЛПР возрастают по х и х0 < х1, то можно
принять U(х0) = 0, U(х1) = 1. Используя полученные ранее соотношения, определим: U(х0,25) = 0,25; U(х0,5) = 0,5; U(х0,75) = 0,75.
Всего получено пять точек для определения функции полезности.
• Проверка согласованности.
Например, определение детерминированного эквивалента x̂
лотереи (х0,25, 0.5, х0,75) по мнению ЛПР. В случае согласованности
x̂ = x0 ,5 .
Если проверка выявила противоречивость предпочтений, то
следует обратить внимание ЛПР на эти противоречия и повторить
часть процедуры построения значений полезности.
92
Итогом данного этапа являются несколько точек для определения функции полезности и кривая, соединяющая эти точки (см.
рис. 4.5).
U(х)
1
0,75
0,5
0,25
0
х0
х0,25 х0,5
х0,75
х1
х
Рис. 4.5. Точки для определения функции полезности
Задача четвертого этапа — определить, существует ли функция
полезности, обладающая одновременно всеми выявленными качественными и количественными свойствами. Один из способов решения этой задачи предполагает следующие действия.
1) Отыскание параметрического семейства функций полезности, обладающего нужными качественными свойствами (например, несклонность к риску);
2) Отыскание значений параметров для определения конкретной функции на основе имеющихся количественных оценок.
Цель пятого этапа — выявление «искажений» функции полезности ЛПР (не полное соответствие функции истинным предпочтениям ЛПР). Общий способ проверки состоит в следующем: попросить ЛПР сравнить по предпочтительности некоторую лотерею и
некоторый детерминированный исход или две лотереи. Для согласованности необходимо, чтобы более предпочтительная для ЛПР
ситуация имела большую ожидаемую полезность.
При формулировании вопросов к ЛПР целесообразно делать это
в терминах, наиболее понятных ЛПР. Пример [3]: Грейсон (Grayson
C. J.) занимался выявлением предпочтений относительно различных
денежных сумм для большого числа предпринимателей, занятых
разведочными поисками нефти и газа. Он рассматривал гипотетические рискованные предприятия по бурению, указывая требуемые
капиталовложения, возможный выигрыш и вероятность успеха и
93
задавал вопрос, согласится ли ЛПР участвовать в этих предприятиях.
Например, вопрос владельцу компании: согласился бы он вложить
$20 000 в предприятие с возможным выигрышем в $100 000, если
вероятность успеха составляет 0,47? В случае положительного ответа вероятность успеха понижалась до тех пор, пока опрашиваемый
не становился безразличен в выборе между участием в предприятии
и отклонением предложения. В случае отрицательного ответа на
первоначальное предложение вероятность успеха повышалась до
получения вероятности, соответствующей безразличию. Если вероятность, соответствующая безразличию, равна р, то
U(0) = p·U(80 000) + (1 — p)·U(–20 000).
Две точки функции полезности выбирались произвольно, третья — из полученного соотношения.
4.1.4. Парадигма анализа решения
Анализ задачи принятия решения на основе теории полезности
предполагает выполнение следующих основных этапов [3].
1. Предварительный анализ.
Включает постановку задачи, выявление возможных альтернатив.
2. Структурный анализ.
Включает качественную структуризацию проблемы. На этом
этапе необходимо получить ответы на вопросы: что ЛПР должен
выбрать сейчас, а выбор чего можно отложить? Каким образом
можно построить свой выбор, основываясь на информации, получаемой в процессе анализа проблемы? Какие эксперименты нужно
произвести?
Эти вопросы располагаются по порядку на дереве решений —
см. рис. 4.6.
...
Начало
1
2
...
...
...
...
4
...
3
...
...
x
...
...
Рис. 4.6. Структуризация задачи в виде дерева решений
94
На дереве решений имеется два типа вершин:
• вершины-решения (обозначаются квадратиками), в которых
выбор полностью осуществляется ЛПР;
• вершины-случаи (обозначаются кружками), в которых выбор не находится под полным контролем со стороны ЛПР.
3. Анализ неопределенности.
Включает установление определенных значений вероятностей для
тех ветвей, которые начинаются в вершинах-случаях. Выполняется
с помощью совокупности совместно используемых методов и процедур, основывающихся на прошлых эмпирических данных, допущениях и результатах стохастических, динамических моделей,
мнениях экспертов, субъективных суждениях ЛПР.
4. Анализ полезности.
Включает установление численных значений полезности последствий, связанных с реализацией того или иного пути на дереве
решений (например, на рис. 4.6 один из возможных путей — от начала до точки x). Это позволяет
— упорядочить (ранжировать) различные последствия с точки
зрения предпочтений ЛПР;
— описать предпочтения ЛПР относительно лотерей, построенных
на этих последствиях.
Например: выбор между действиями A' и A'' (рис. 4.7) сводится
к выбору между лотереями l' и l''.
Последствия
l'
A'
x'1
p'1
... p'
... x'i
i
p'm
x'm
x''1
p''1
A''
... p''
... x''j
j
l''
p''n
x''n
Полезности
...
u'1
...
u'i
...
...
u'm
u''1
u''j
u''n
Рис. 4.7. Анализ задачи выбора с помощью лотерей
95
При этом
n
⎛ m
⎞
⎜ ∑ p′i ⋅u′i > ∑ p′′j ⋅u′′j ⎟ − выбор оптимального дейст( A′ A′′) ⇔ ⎜
⎟
⎝ i=1
⎠
j=1
вия соответствует максимизации ожидаемой полезности.
5. Процедуры оптимизации.
Оптимальная стратегия действий (оптимальная альтернатива) —
это стратегия, для которой ожидаемая полезность максимальна.
Оптимальная стратегия указывает, какой выбор следует сделать в
начале дерева и в каждом узле-решении при движении по дереву
решений.
Правила выбора оптимальной стратегии:
1) двигаться от листьев дерева к его корню;
2) в узлах, где выбор случаен (кружок), вычислять среднее значение полезности;
3) в узлах, где есть этап принятия решения (квадратик), выбирать ветвь с наибольшей ожидаемой полезностью (остальные
ветви отсекаются двумя черточками).
Эта процедура нахождения оптимального пути на дереве решений называется «сворачиванием» дерева решений.
Пример 4.2
Руководство инвестиционной компании при выборе большого
земельного участка для вложения своих (и привлеченных) средств
решает:
• создавать ли на нем крупный торгово-развлекательный
комплекс с магазинами и предприятиями бытового обслуживания (проект «ТРЦ»);
• вложить деньги в гаражное строительство (проект «Гараж»);
• отказаться от проекта вообще и использовать другие формы
вложения денег (проект «Депозит»).
Размер дохода от инвестиций зависит от благоприятного или неблагоприятного состояния рынка городских услуг. Принята гипотеза, что вероятность каждого из этих состояний равна 0,5. Возможные выигрыши компании приведены в таблице 4.1.
96
Таблица 4.1
Стратегия
Действия
компании
А1
А2
А3
Проект «ТРЦ»
Проект «Гараж»
Проект «Депозит»
Величина дохода, тыс. д. е.
Благоприятное
Неблагоприятное
состояние
состояние
230
–140
100
–20
10
10
Определим оптимальную стратегию
1) исходя из реальной стоимости денег (полезность каждого
исхода равнозначна величине денежного дохода) — позиция
ЛПР, безразличного к риску;
2) основываясь на функции полезности различных денежных
сумм ЛПР, не склонного к риску
U(x) = — 263,31 + 22,093·ln(x+150 000)
(получена Грейсоном для одного из предпринимателей), без дополнительного исследования конъюнктуры рынка.
Дерево решений для первого случая изображено на рис. 4.8.
А1
2 благоприятное состояние, р = 0,5
неблагоприятное состояние, р = 0,5
1
А2
3 благоприятное состояние, р = 0,5
неблагоприятное состояние, р = 0,5
А3
230 000
–140 000
100 000
–20 000
10 000
Рис. 4.8. Дерево решений в задаче выбора инвестиционного проекта
исходя из реальной стоимости денег
В узле 2 (результат выбора стратегии А1) среднее значение дохода равно 230 000·0,5 + (–140 000)·0,5 = 45 000; в узле 3 (результат
выбора стратегии А2) среднее значение дохода равно 100 000·0,5 +
(–20 000)·0,5 = 40 000; при выборе стратегии А3 доход равен 10 000.
В узле 1 следует выбрать стратегию с наибольшим ожидаемым доходом, т. е. стратегию А1.
97
Вывод: исходя из реальной стоимости денег, оптимальной стратегией является выбор проекта «ТРЦ» с ожидаемой прибылью,
равной 45 000 д. е.
Во втором случае следует рассчитать полезности доходов, получаемых от реализации проектов, в соответствии с функцией полезности ЛПР.
U(230 000) ≈ 20,54; U(–140 000) ≈ –59,83;
U(100 000) ≈ 11,29; U(–20 000) ≈ –3,16; U(10 000) ≈ 1,43.
В этом случае получится дерево решений, изображенное на
рис. 4.9.
В узле 2 (результат выбора стратегии А1) среднее значение полезности дохода равно 20,54·0,5 + (–59,83)·0,5 = –19,65; в узле 3 (результат выбора стратегии А2) среднее значение полезности дохода
равно 11,29·0,5 + (–3,16)·0,5 = 4,07; при выборе стратегии А3 значение полезности дохода равно 1,43. В узле 1 следует выбрать стратегию с наибольшей ожидаемой полезностью, т. е. стратегию А2.
Вывод: исходя из имеющейся функции полезности ЛПР, оптимальной стратегией является выбор проекта «Гараж» с ожидаемой
полезностью прибыли, равной 4,07.
А1
2 благоприятное состояние, р = 0,5
неблагоприятное состояние, р = 0,5
1
А2
3 благоприятное состояние, р = 0,5
неблагоприятное состояние, р = 0,5
А3
20,54
–59,83
11,29
–3,16
1,43
Рис. 4.9. Дерево решений в задаче выбора инвестиционного проекта
исходя из имеющейся функции полезности ЛПР
Оценки конъюнктуры рынка (вероятности состояний экономической среды) могут быть уточнены путем проведения дополнительного исследования. Предположим, что стоимость исследования
составляет 8 000 д. е. Перед принятием решения о строительстве
(или об отказе от него) руководство компании должно определить,
проводить ли это исследование.
Маркетинговая фирма, выполняющая исследование, может дать
верный прогноз с определенной вероятностью. Предположим, что
98
эти вероятности известны и равны: 0,78 в случае благоприятного
состояния и 0,73 в случае неблагоприятного (если фирма утверждает, что рынок благоприятный, то этот прогноз оправдывается с вероятностью 0,78 и не оправдывается с вероятностью 0,22; неблагоприятный прогноз оправдывается с вероятностью 0,73 и не
оправдывается с вероятностью 0,27). Предположим, что маркетинговая фирма сделала следующий прогноз: ситуация будет благоприятной с вероятностью 0,45 и неблагоприятной с вероятностью 0,55.
Новое дерево решений должно быть выстроено с учетом того, что
принятие решения теперь включает два этапа: на первом этапе —
проводить или не проводить дополнительное исследование, на втором — собственно выбор проекта с учетом дополнительно полученной информации (в случае проведения дополнительного исследования). Дерево решения, построенное исходя из реальной
стоимости денег, представлено на рис. 4.10.
А1
Не проводить
исследование
6 благоприятное состояние, р = 0,5
неблагоприятное состояние, р = 0,5
3
А2
7 благоприятное состояние, р = 0,5
неблагоприятное состояние, р = 0,5
45 000
А3
А1
1
Благоприятный
прогноз,
4
р = 0,45
65 690
8 благоприятное состояние, р = 0,78
9 благоприятное состояние, р = 0,78
неблагоприятное состояние, р = 0,22
148 600
А3
2
А1
Проводить
исследование
Неблагоприятный
5
прогноз,
р = 0,55
А2
100 000
–20 000
230 000
–140 000
100 000
–20 000
10 000
10 благоприятное состояние, р = 0,27
неблагоприятное состояние, р = 0,73
12 400
–140 000
10 000
неблагоприятное состояние, р = 0,22
А2
230 000
11 благоприятное состояние, р = 0,27
неблагоприятное состояние, р = 0,73
А3
230 000
–140 000
100 000
–20 000
10 000
Рис. 4.10. Дерево решений с учетом дополнительного исследования
на основе реальной стоимости денег
99
Как было показано выше, в узле 3 следует выбрать стратегию А1.
В узле 8 ожидаемый доход равен 230 000·0,78 + (–140 000)·0,22 =
= 148 600; в узле 9 ожидаемый доход равен 100 000·0,78 +
+(–20 000)·0,22 = 73 600; в узле 4 следует выбрать ветвь с наибольшим ожидаемым доходом, т. е. ветвь, соответствующую выбору А1.
В узле 10 ожидаемый доход равен 230 000·0,27 + (–140 000)·0,73 =
= –40 100; в узле 11 ожидаемый доход равен 100 000·0,27 +
+(–20 000)·0,73 = 12 400; в узле 5 следует выбрать стратегию А2.
В узле 2 ожидаемый доход равен 148 600·0,45 + 12 400·0,55 =
= 73 690. С учетом стоимости дополнительного исследования последнее значение следует уменьшить на 8 000 д. е. Итоговое значение — 65 690.
В узле 1 следует выбрать ветвь с наибольшим ожидаемым доходом (сравниваются значения 65 690 в узле 2 и 45 000 в узле 3),
т. е. стратегию, предусматривающую проведение дополнительного
исследования.
Выводы: если исходить из реальной стоимости денег, то
• следует провести дополнительное исследование конъюнктуры рынка;
• в случае благоприятного прогноза следует выбрать проект
«ТРЦ» (ожидаемая прибыль равна 148 600 д. е.); в случае неблагоприятного — проект «Гараж» (ожидаемая прибыль равна 12 400 д. е.).
Если проводить анализ, исходя из имеющейся функции полезности денежных сумм, то сначала следует найти полезности различных исходов с учетом оплаты маркетингового исследования:
U(230 000 — 8 000) ≈ 20,07; U(–140 000 — 8 000) ≈ –95,38;
U(100 000 — 8 000) ≈ 10,57; U(–20 000 — 8 000) ≈ –4,56;
U(10 000 — 8 000) ≈ 0,30.
Соответствующее дерево решений представлено на рис. 4.11.
100
А1
Не проводить
исследование
6 благоприятное состояние, р = 0,5
неблагоприятное состояние, р = 0,5
3
А2
7 благоприятное состояние, р = 0,5
неблагоприятное состояние, р = 0,5
4,07
А3
А1
1
Благоприятный
прогноз,
4
р = 0,45
3,42
8 благоприятное состояние, р = 0,78
9 благоприятное состояние, р = 0,78
неблагоприятное состояние, р = 0,22
7,24
А3
2
А1
Проводить
исследование
Неблагоприятный
5
прогноз,
р = 0,55
А2
11,29
–3,16
20,07
–95,38
10,57
–4,56
0,30
10 благоприятное состояние, р = 0,27
неблагоприятное состояние, р = 0,73
0,30
–59,83
1,43
неблагоприятное состояние, р = 0,22
А2
20,54
11 благоприятное состояние, р = 0,27
неблагоприятное состояние, р = 0,73
А3
20,07
–95,38
10,57
–4,56
0,30
Рис. 4.11. Дерево решений с учетом дополнительного исследования
на основе функции полезности ЛПР, не склонного к риску
Выводы: если исходить из имеющейся функции полезности
ЛПР, то
• не следует проводить дополнительное исследование конъюнктуры рынка;
• следует выбрать проект «Гараж» (ожидаемая полезность
равна 4,07).
4.2. åçéÉéäêàíÖêàÄãúçÄü íÖéêàü èéãÖáçéëíà
4.2.1. Постановка задачи
ЛПР должен выбрать одну из нескольких альтернатив (способов действий) А1, А2, … , Аm, каждая из которых в конечном итоге
будет иметь результатом некоторый исход. Но исходы (последствия выбора) не могут быть адекватно описаны с помощью одного
101
критерия; последствие с номером i описывается набором n чисел
xi1, xi2, …, xin. Вопрос: как сравнивать последствия по предпочтительности? Формально проблема может быть решена путем введения функции полезности U, которая каждому набору величин xi =
(xi1, xi2, …, xin) ставит в соответствие одномерную величину (число).
4.2.2. Подходы к построению
многомерных функций полезности
1. Непосредственная (прямая) оценка.
Этот подход реализует следующую идею: значения полезности
для некоторых двух последствий задаются непосредственно; значения полезности остальных последствий устанавливаются в соответствии с заданными. Например, если установлено, что
x0 = (x01, x02, …, x0n) — наименее предпочтительное,
x* = (х*1, х*2, …, х*n) — наиболее предпочтительное
последствие из {x1, x2, …, xR}, то можно произвольно задать U(x0) =
= 0, U(x*) = 1 и для каждого xi эмпирически оценить вероятность
pi, такую что исход xi равноценен лотерее (x*, pi, x0). Тогда U(xi) = pi.
Отличие от процедуры построения одномерной функции полезности состоит в том, что предметы оценки xi — векторы, а не скаляры.
При большом количестве последствий данный подход может
использоваться для оценки полезности небольшой их части. Оценка полезности остальных последствий производится, например, при
помощи процедур интерполяции. Эти процедуры имеют ряд существенных недостатков. Так, например, они не позволяют учесть
основную структуру предпочтений ЛПР; получаемые результаты
неудобны для вычисления ожидаемой полезности и проведения
анализа чувствительности.
2. Качественная структуризация предпочтений.
Включает в себя установление некоторых допущений о системе
основных предпочтений ЛПР и нахождение функционального вида
функции полезности, удовлетворяющего этим допущениям. Это
означает построение функции полезности, имеющей аксиоматическое обоснование.
102
При определении функции полезности учитывается система
предпочтений ЛПР (аналогично тому, как это делается в случае
построения одномерных функций полезности). Цель — получение
функции полезности в виде
U(x1, x2, …, xn) = φ(u1(х1), u2(х2), …, un(хn)),
где ui — функция только одного критерия fi, i = 1, 2, …, n,
φ имеет, по возможности, простую форму.
Развитие данного подхода — в рамках научного направления
MAUT (Multi-Attribute Utility Theory), многокритериальной теории
полезности.
Основные этапы подхода MAUT.
1. Разработка перечня критериев.
2. Построение функции полезности по каждому из критериев.
3. Проверка условий, определяющих вид общей функции полезности.
4. Построение зависимости между оценками альтернатив по критериям и общим качеством альтернативы (многокритериальной
функции полезности).
5. Оценка имеющихся альтернатив и выбор наилучшей.
4.2.3. Основы многокритериальной теории полезности
Будем рассматривать множество критериев F = {f1, f2, … , fn}.
Если два множества критериев F1 и F2 являются разбиением
множества F, т. е. F1 ∪ F2 = F , F1 ∩ F2 = ∅ , то F1 и F2 будем называть дополняющими друг друга. Обозначение: F1 − дополнение F1.
Предположения о системе предпочтений ЛПР
• Предполагается, что условия, обеспечивающие существование функции полезности (аксиомы рационального выбора),
выполняются.
• Предполагается, что функция полезности U непрерывна по
каждому хj и ограничена.
• Предполагается выполнение дополнительных условий, связанных с независимостью критериев fi.
103
Множество критериев F1 ⊂ F называется независимым по
предпочтению от своего дополнения, если порядок предпочтения
альтернатив, различающихся лишь оценками по критериям из F1,
не зависит от фиксированных значений по критериям из F1 . Это
понятие касается предпочтений ЛПР, не связанных с неопределенностью.
Множество критериев F1 ⊂ F называется независимым по полезности от своего дополнения, если порядок предпочтения лотерей, исходы которых отличаются лишь оценками по критериям из
F1, не зависит от фиксированных значений по критериям из F1 .
Использование данного понятия предполагает наличие неопределенности.
Детерминированный исход х может быть представлен с помощью вырожденной лотереи (х, 1, у), поэтому из выполнения условия независимости по полезности следует выполнение условия независимости по предпочтению, но обратное не всегда верно.
Можно показать, что если каждый из критериев f1, f2, … , fn не
зависит по полезности от дополняющего его множества критериев,
то условные функции полезности каждого критерия ui(хi), i = 1, 2,
…, n, вычисленные при некоторых фиксированных значениях
x j = x j , j ≠ i , в стратегическом отношении не зависят от значений x j (т. е. одинаково упорядочивают по предпочтительности
любые две лотереи).
Критерии f1, f2, … , fn называются взаимонезависимыми по полезности, если каждое подмножество множества критериев F = {f1,
f2, … , fn} не зависит по полезности от своего дополнения.
Основная теорема многокритериальной теории полезности
Теорема 4.5 (Кини, 1974).
Если критерии f1, f2, … , fn являются взаимонезависимыми по
полезности, то
104
n
n
i=1
i=1 j>i
U ( x1 , x2 , … , xn ) = ∑ ki ui ( xi ) + k ∑∑ ki k j ui ( xi ) u j ( x j ) +
n
+ k 2 ∑∑∑ ki k j kl ui ( xi ) u j ( x j ) ul ( xl ) + … +
(4.8)
i=1 j>i l> j
+k
n−1
k1k2 ⋅…⋅ kn ⋅u1 ( x1 ) u2 ( x2 )⋅…⋅un ( xn ) ,
где
U(x01, x02, …, x0n) = 0, U(х*1, х*2, …, х*n) = 1;
ui(хi) — условная функция полезности для критерия fi,
ui(х0i) = 0, ui(х*i)= 1, i = 1, 2, …, n;
ki = U(x01, x02, …, х0i–1, х*i, х0i+1, …, х0n);
n
k — константа, определяемая из уравнения 1+ k = ∏ (1+ k ⋅ ki ) .
i=1
Замечание.
n
Если ∑ ki =1 , то k = 0, и функция (4.8) сводится к аддитивной
i=1
функции полезности вида
n
U ( x1 , x2 , … , xn ) = ∑ ki ui ( xi ) .
(4.9)
i=1
n
Если ∑ ki ≠1 , то k ≠ 0, обе части равенства (4.8) можно умноi=1
жить на k и прибавить 1 к обеим частям. После вынесения за скобки общих множителей в правой части получим мультипликативную функцию
n
kU ( x1 , x2 , … , xn ) +1 = ∏ ( kki ui ( xi ) +1) .
(4.10)
i=1
Проверка условия взаимной независимости критериев может
оказаться очень громоздкой: для множества F = {f1, f2, … , fn} требуется проверка независимости по полезности для 2n — 2 подмно-
105
жеств F (при n = 10 необходимо проверить выполнение 1022 условий). Установлены наборы более слабых условий, выполнение которых влечет взаимную независимость по полезности.
Теорема 4.6
Следующие условия являются эквивалентными:
1) Критерии f1, f2, … , fn взаимонезависимы по полезности.
2) Множества критериев {fi, fi+1} независимы по полезности от
своих дополнений, i = 1, 2, …, n — 1, n ≥ 3.
3) Критерий f1 не зависит по полезности от своего дополнения,
и множества критериев {f1, fi} независимы по предпочтению от
своих дополнений, i = 1, 2, …, n, n ≥ 3. В качестве f1 можно
взять любой из критериев.
Процедуры проверки условий независимости
Разобьем множество F = {f1, f2, …, fn} на подмножества F1 и F1 .
• Проверка независимости по предпочтению F1 от F1 .
1) Установить х−1 − некоторые фиксированные, относительно
нежелательные для ЛПР значения критериев из F1 .
2) Выбрать значения х'1 и х''1 критериев из F1, такие, что последствие ( x′1 , x−1 ) равноценно последствию ( x′1′, x1− ) .
3) Установить х1+ − относительно желательные для ЛПР значения критериев из F1 . Вопрос ЛПР: равноценны ли последствия ( x′1 , x1+ ) и ( x′1′, x1+ ) ?
4) В случае положительного ответа повторить процедуру при
других значениях х1 .
5) В случае положительных ответов — вопрос ЛПР: если последствия ( x′1 , x1 ) и ( x′1′, x1 ) равноценны при некотором конкретном х1 , то означает ли это, что указанная равноценность
сохраняется при любом выбранном х1 ?
6) В случае положительного ответа дополнительно проверить
ориентацию предпочтений относительно критериев из F1: если
106
( x′1 , x1 )
( x′1′, x1 ) при некотором х1 , то порядок предпочтений
не должен изменяться для любого другого фиксированного х1 .
Выполнение последних двух условий позволяет установить независимость F1 от F1 по предпочтению.
• Проверка независимости по полезности F1 от F1 .
Выполняется аналогично проверке независимости по предпочтению, но вместо сравнений детерминированных последствий требуется сравнение лотерей с равновероятными исходами либо с другими лотереями (также с равновероятными исходами), либо с
детерминированными исходами.
По данным [3], в практических ситуациях для обоснованного
подтверждения гипотезы о независимости по полезности F1 от F1
достаточно выполнить проверку примерно для четырех значений
х1 , охватывающих диапазон изменения F1 .
Определение весовых коэффициентов критериев
Из (4.8)
U ( x1 , x2 , … , xn ) =
= f (u1 ( x1 ) , u2 ( x2 ) , … ,un ( xn ) , k1 , k2 , … , kn ) .
Для определения значений весовых коэффициентов требуется
получить n независимых уравнений с n неизвестными k1, k2, … , kn.
Эти уравнения могут быть получены путем рассмотрения детерминированных исходов, лотерей и их комбинаций.
• Если последствия x = (х1, х2, …, хn) и у = (у1, у2, …, уn) одинаково
предпочтительны для ЛПР, то U(х1, х2, …, хn) = U(у1, у2, …, уn) и
f (u1 ( x1 ) ,u2 ( x2 ) , … , un ( xn ) , k1 , k2 , … , kn ) =
= f (u1 ( у1 ) , u2 ( у2 ) , … , un ( уn ) , k1 , k2 , … , kn ) .
Одномерные функции полезности уже построены, поэтому значения ui(хi) и ui(уi), i = 1, 2, …, n, известны. Следовательно, получено уравнение относительно неизвестных k1, k2, … , kn.
107
• Если исход х является детерминированным эквивалентом
лотереи (y, p, z), то U(x) = p·U(y) + (1 — p)·U(z).
Из последнего равенства можно получить уравнение относительно неизвестных k1, k2, … , kn.
Если полученная система уравнений оказалась несовместной,
то причина этого — несогласованность в ответах ЛПР. Необходимо
(с помощью консультанта) устранить несогласованность.
Рекомендуемая процедура [3] предполагает следующий порядок действий при нахождении значений весовых коэффициентов.
1) Ранжирование коэффициентов.
Следует задавать ЛПР вопросы типа:
верно ли, что ( x1∗ , x10 )
( x ∗2 , x 02 ) ?
В случае положительного ответа k1 > k2.
Если ( x1∗ , x10 ) ≺ ( x ∗2 , x 02 ) , то k1 < k2.
Если указанные исходы равноценны для ЛПР, то k1 = k2.
Таким образом можно получить полное упорядочение коэффициентов k1, k2, … , kn.
2) Нахождение значения наибольшего из коэффициентов.
Следует задать ЛПР вопросы типа:
при каком значении вероятности р равноценны лотерея <х*, p,
х0> и детерминированный исход (x01, x02, …, х0i–1, х*i, х0i+1, …, х0n)?
Если ЛПР дает ответ, что это значение равно pi, то
U(<х*, pi, х0>) = U(x*)·pi + U(x0)·(1 — pi ) = 1·pi + 0·(1 — pi ) = pi;
U(x01, x02, …, х0i–1, х*i, х0i+1, …, х0n) = ki,
откуда ki = pi.
3) Нахождение остальных значений ki путем выражения их через найденное значение наибольшего коэффициента.
Следует задать ЛПР вопросы типа:
выберите такие значения критериев fi и fj (например, х'i и х'j соответственно), что при любых установленных значениях всех остальных критериев будут равноценны
последствие х1, содержащее х'i и х0j (при любых установленных значениях остальных критериев);
и последствие х2, содержащее х0i и х'j.
108
Тогда U(х1) = U(х2), откуда kj·uj(х'j) = ki·ui(х'i).
Если положить х'i = х*i, то kj·uj(х'j) = ki.
4.2.4. Пример практического применения
многокритериальной теории полезности
(анализ проблемы развития аэропорта) [3]
В [3] описан анализ проблемы развития аэропорта, который
выполнялся в 1971 г. в г. Мехико. Проблема состояла в следующем: быстрый рост воздушных перевозок с одной стороны, и растущие трудности, связанные с обеспечением нормальных условий
работы существующего аэропорта с другой стороны, обусловили
необходимость решения вопроса: как следует развивать аэропорт,
чтобы обеспечить качественное обслуживание района до 2000 г.?
Владельцем проблемы являлось правительство Мексики. На
этапе предварительных исследований рассматривались два основных варианта:
1) значительное расширение существующего аэропорта;
2) строительство нового аэропорта в 25 милях севернее города.
Альтернативы.
Сформулированные альтернативы конкретизировали типы самолетов, которые будут обслуживаться на каждом из возможных аэродромов до 2000 г. Все типы самолетов были разбиты на 4 класса:
1) самолеты, обслуживающие международные авиалинии;
2) самолеты, обслуживающие внутренние авиалинии;
3) самолеты общего назначения;
4) военные самолеты.
Было принято допущение: в любой момент времени каждый
класс самолетов может обслуживаться только в одном из аэропортов. Предстоящий 30-летний период был условно разбит на временные отрезки (для учета изменений в классах самолетов, принимаемых каждым аэропортом). Таким образом, одна из возможных
альтернатив может выглядеть следующим образом:
построить новый аэропорт и перевести туда
самолеты общего назначения в 1975 г.;
109
самолеты международных авиалиний — в 1985 г.;
все классы самолетов — в 1995 г.
На практике сроки перехода не должны были быть очень жесткими.
На основе данной модели формально могло быть построено
(24)3 = 4096 альтернатив. После объединения сходных по природе и
отбрасывания не имеющих смысла альтернатив (например: перевод
всех самолетов из старого аэропорта в новый в 1975 г. и возвращение их обратно в 1985 г.) для дальнейшей оценки было оставлено
около 100 альтернатив.
Критерии.
При формулировании критериев главной целью являлось полное описание последствий принятия каждой из альтернатив с позиций трех групп, заинтересованных в решении проблемы. Этими
группами являлись:
I. Правительство (орган, являющийся заказчиком при строительстве нового и реконструкции старого аэропортов).
II. Лица, пользующиеся воздушными перевозками.
III. Лица, не пользующиеся воздушными перевозками.
На основе данных предварительных исследований было отобрано шесть частных целей:
1) Минимизировать общую стоимость строительства и эксплуатации.
2) Обеспечить достаточную пропускную способность для
удовлетворения потребности в воздушных перевозках.
3) Минимизировать продолжительность поездки в аэропорт.
4) Максимизировать безопасность системы.
5) Минимизировать общественное недовольство, вызванное
появлением нового аэропорта.
6) Минимизировать воздействие шума от пролетающих самолетов.
Цели 1) и 2) отражали позиции группы I, цели 2) — 4) — позиции группы II, цели 4) — 6) — позиции группы III.
На основе целей 1) — 6) были сформированы критерии:
110
1) f1 – общие затраты (млн. песо) с использованием «подходящего» дисконтирования;
2) f2 – фактическая пропускная способность аэропорта (количество операций по обслуживанию самолетов в час);
3) f3 – продолжительность поездки в аэропорт / из аэропорта
(мин.), усредненная по числу пассажиров из каждого района
Мехико;
4) f4 – число людей (включая пассажиров), получаюших серьезные ранения или погибших, отнесенное к числу авиакатастроф;
5) f5 – число людей, переселяемых при расширении аэропорта;
6) f6 – число людей, подвергшихся воздействию высокого
уровня шумов — до 90 CNR и более (стандартный индекс шума, который учитывает уровень шума в децибелах и частоту
достижения этого уровня).
Основная модель принятия решения.
Основная модель была построена в виде дерева решений — см.
рис. 4.12. Кружками обозначены случайные события, связанные с
возможными изменениями в потребностях, технологическими изменениями и т. д.
…
С – 1),2),3),4)
…
1975
…
…
Н – 1),2),3),4)
…
Н – 1),2),3),4)
Н – 1),2),3),4)
…
1985
…
…
Н – 1),3)
С – 2),4)
Н – 1),3)
С – 2),4)
…
Н – 1),3)
С – 2),4)
…
р(х1, х2, … , х6)
(х1, х2, … , х6)
…
1995
Рис. 4.12. Дерево решений в анализе проблемы развития аэропорта
Определение вероятностных распределений производилось на
основе профессионального опыта представителей правительства,
связанных со строительством аэропорта и его эксплуатацией, а
также на основе результатов предварительных исследований (данные о будущих воздушных перевозках, о механике грунта, инже111
нерных службах в местах строительства аэропорта, о загрязнении
среды, воздействии шума, анализ наземного транспорта и подъездов к аэропорту, оценки стоимости и т. п.).
Построение многомерной функции полезности.
Построение многомерной функции полезности проводилось на
основе суждений наиболее квалифицированных специалистов: директора аэропортов министерства общественных работ, директора
центра математических и статистических исследований и их сотрудников.
— Проверка условий независимости.
Было выдвинуто предположение о взаимной независимости критериев по полезности. Чтобы подтвердить или опровергнуть это
предположение, проверялось выполнение условия 3) теоремы 4.6.
Примеры.
1) Проверка независимости критериев f4 (безопасность) и f6
(шум) по предпочтению от остальных критериев.
• Значения остальных критериев были зафиксированы на желательном уровне.
• ЛПР был задан вопрос: каким должно быть значение критерия
безопасности х4, чтобы исход (х4, 2500) — х4 человек погибает
или получает тяжелые ранения в случае авиакатастрофы и 2500
человек подвергаются воздействию шумов высокой интенсивности, был равноценен исходу (1, 1 500 000) — 1 человек погибает или получает тяжелые ранения в случае авиакатастрофы и 1 500 000 человек подвергаются воздействию шумов
высокой интенсивности?
• После процедуры схождения был получен ответ: х4 = 300.
• Значения всех критериев, кроме f4 и f6, были зафиксированы
на нежелательном уровне и ЛПР был задан тот же вопрос.
• Был получен ответ: х4 = 300.
• ЛПР был задан вопрос: будет ли это значение х4 сохраняться для любых значений остальных четырех критериев?
• Был получен положительный ответ.
• Аналогичные вопросы задавались ЛПР для других пар значений (х4, х6). Ответы также были аналогичны.
112
• Вывод: критерии f4 и f6, независимы по предпочтению от
остальных критериев.
2) Проверка независимости критерия f3 (продолжительность
поездки) по полезности от остальных критериев.
• Значения остальных критериев были зафиксированы на желательном уровне.
• Была построена условная функция полезности продолжительности поездок от 12 до 90 мин. (диапазон был указан министерством общественных работ на основе предварительного исследования).
• Из ответов ЛПР было установлено: продолжительность,
равная 62 мин., является детерминированным эквивалентом
лотереи (12 мин.; 0,5; 90 мин.).
• Значения остальных критериев были заменены на менее
желательные.
• Из ответов ЛПР было установлено: продолжительность,
равная 62 мин., по-прежнему является детерминированным
эквивалентом лотереи (12 мин.; 0,5; 90 мин.).
• Из ответов ЛПР также установлено: это утверждение справедливо для любых фиксированных значений остальных критериев.
• Вывод: критерий f3 не зависит по полезности от остальных
критериев.
Аналогичные проверки выполнялись и для других критериев.
— Построение одномерных функций полезности.
Пример: построение одномерной функции полезности продолжительности поездки.
• Согласно данным министерства общественных работ,
х03 = 90 мин., х*3 = 12 мин.
Поэтому u3(90) = 0, u3(12) = 1.
• Из ответов опрашиваемых лиц, полученных при проверке
независимости по полезности, следует:
u3(62) = u3((12; 0,5; 90)) = 0,5·u3(12) + 0.5·u3(90) = 0,5.
• Эквивалент определенности лотереи (12; 0,5; 90), равный 62
мин., больше ожидаемого выигрыша этой лотереи, равного
113
51 мин. Поэтому можно предположить, что функция u3
должна отражать несклонность к риску. Тогда должно выx′ + x′3′
для
полняться условие: ожидаемое значение х3 = 3
2
любой лотереи (х'3; 0,5; х''3) предпочтительнее, чем сама лотерея. Это было подтверждено ответами ЛПР.
• На основании ответов опрашиваемых лиц были получены
детерминированные эквиваленты для ряда дополнительных
лотерей, следовательно, еще несколько точек для определения функции полезности:
u3(40) = u3((12; 0,5; 62)) = 0,5·u3(12) + 0.5·u3(62) = 0,75;
u3(78) = u3((62; 0,5; 90)) = 0,5·u3(62) + 0.5·u3(90) = 0,25.
• Для эмпирически найденных точек подобрана аппроксимирующая их экспоненциальная функция. Эта функция была
принята в качестве функции полезности u3(х3) — см. рис. 4.13.
Построение других одномерных функций полезности выполнялось аналогично.
u3
1
0,8
0,6
0,4
0,2
12 20
40
60
80
90
х3
Рис. 4.13. Одномерная функция полезности продолжительности поездки
в аэропорт/из аэропорта
— Нахождение значений коэффициентов ki.
Пример: определение k1 (коэффициента критерия затрат).
• ЛПР было предложено сравнить с точки зрения предпочтительности
1) детерминированное последствие, характеризующееся параметрами: затраты зафиксированы на наиболее предпочтитель114
ном уровне, а значения всех остальных критериев — на наименее предпочтительных уровнях и
2) лотерею (х*, р, х0).
Задача — указать такое значение р, при котором исходы 1) и 2)
были одинаково предпочтительны.
• На основе ответов опрашиваемых лиц были получены исходные оценки значений ki.
• Для проверки согласованности задавались дополнительные
вопросы к ЛПР, не связанные с вероятностями.
Например: значения всех критериев зафиксированы на наименее желательном уровне; задается вопрос ЛПР: в этой ситуации что
предпочтительнее иметь на самом желательном уровне — затраты
или пропускную способность?
Был получен ответ ЛПР: пропускную способность.
Вывод: k2 > k1.
Далее, на основании ответов ЛПР найдено значение пропускной способности хI2, равноценное наилучшему уровню затрат х*1.
Тогда k1 = k2·u2(хI2). Т. к. функция u2(х2) уже построена, то получено
соотношение между k1 и k2.
Итогом стала многократная проверка согласованности и уточнение значений ki. Полученные значения коэффициентов представлены в таблице 4.2.
Критерии fi
Коэффициенты ki
f1
0,48
f2
0,60
f3
0,10
f4
0,35
Таблица 4.2
f5
f6
0,18
0,18
6
∑ k = 1,89 ≠1 , поэтому функция полезности является мультиплиi
i=1
кативной.
— Нахождение значения параметра k.
Значение k может быть найдено из уравнения
6
1+ k = ∏ (1+ k ⋅ ki ) =
i=1
= (1+ k ⋅ k1 )(1+ k ⋅ k2 )(1+ k ⋅ k3 )(1+ k ⋅ k4 ) (1+ k ⋅ k5 )(1+ k ⋅ k6 ) ,
которое получено из (4.10), записанного для последствия х*.
115
В качестве решения этого уравнения было найдено значение
k = –0,877.
В итоге получена вся необходимая информация для определения многомерной функции полезности. Остается подставить найденные значения коэффициентов ki и параметра k в (4.10).
Проведение анализа.
Все имеющиеся альтернативы были оценены по их ожидаемой
полезности (шкала была преобразована к значениям от 0 до 100). В
таблице 4.3 представлены 5 лучших (по ожидаемой полезности) альтернатив. По результатам проведенного анализа был сделан следующий основной вывод: эффективными являются два типа стратегий:
1) «перенести все в новый аэропорт»; при этом осуществить
строительство нового аэропорта как можно скорее;
2) развитие нового аэропорта «по фазам» (обслуживание самолетов международных и внутренних авиалиний в новом аэропорту уже в 1985 г.)
Таблица 4.3
Ранг
Ожидаемая
полезность
1
2
3
4
5
91,23
90,90
90,79
89,30
88,10
Альтернатива
1975
1985
Н
С
Н
С
2)
1),3),4)
1),2)
3),4)
1),2),3),4)
1),2),3),4)
1)
2),3),4)
1),2)
3),4)
1),2)
3),4)
1),2)
3),4)
1),2)
3),4) 1),2),3),4)
-
1995
Н
С
1),2)
3),4)
1),2),3),4)
1),2)
3),4)
1),2)
3),4)
1),2),3),4)
-
Все стратегии, предусматривающие обслуживание самолетов
международных и внутренних авиалиний в старом аэропорту до
1985 г., имели намного меньшую (в разы) ожидаемую полезность.
По результатам дополнительно проведенного анализа с учетом
политических соображений, гибкости предполагаемых мероприятий, внешних факторов было принято, что развитие нового аэропорта «по фазам» является более предпочтительным, чем «перенести все сразу в новый аэропорт».
116
4.3. áÄÑÄçàü Ñãü ëÄåéëíéüíÖãúçéÉé ÇõèéãçÖçàü
Задание 4.1
Инвестиция в 10 000 д. е. в предприятие с высоким уровнем
риска с вероятностью 0,5 может либо увеличить эту сумму до
14 000 д. е. на протяжении следующего года (чистый доход 4 000 д. е.),
либо уменьшить ее до 8 000 д. е. (чистый доход –2 000 д. е.).
1. Принимая позицию безразличного к риску инвестора и шкалу
полезности от 0 до 1, определить
— полезность 0 д. е. чистого дохода;
— значения вероятностей р, при которых детерминированными эквивалентами лотереи (4 000, р, –2 000) являются исходы 0 д. е.,
1 000 д. е., 2 000 д. е. чистого дохода.
2. Пусть два инвестора А и В определили значения вероятностей р,
при которых тот или иной исход является детерминированным
эквивалентом лотереи (4 000, р, –2 000) — см. таблицу 4.4. Используя данные этой таблицы и применяя линейную интерполяцию эмпирически найденных точек, построить функции полезностей денежных сумм для инвесторов А и В. Построить
графики полученных функций и охарактеризовать отношение
инвесторов А и В к риску.
Таблица 4.4
Чистый доход (д. е.)
–2 000
–1 000
0
1 000
2 000
3 000
4 000
Вероятность р
Инвестор А
Инвестор В
0
0
0,6
0,1
0,8
0,2
0,85
0,3
0,9
0,45
0,95
0,7
1
1
3. Пусть каждый из инвесторов может вложить деньги в одно из
рискованных предприятий: I и II. Инвестиция в предприятие I
117
может принести прибыль в сумме 3 500 д. е. с вероятностью 0,4
или убыток в 1 500 д. е. с вероятностью 0,6. Инвестиция в
предприятие II может принести прибыль в сумме 1 500 д. е. с
вероятностью 0,6 или не принести никакой прибыли с вероятностью 0,4. Используя функции полезностей инвесторов А и В,
полученные в п. 2, и критерий ожидаемой полезности, определить предприятие, которое следует выбрать каждому инвестору. Каково ожидаемое значение полезности, соответствующее
выбранному предприятию, для каждого из инвесторов?
4. Оформить отчет. Содержание отчета:
1) Значения, указанные в п. 1 (с обоснованием).
2) Функции полезности денежных сумм для инвесторов А и В
и их графики. Характеристика отношения к риску каждого из
инвесторов (с обоснованием).
3) Деревья решений задачи выбора инвестиционного проекта
(п. 3) для каждого из инвесторов и обоснование выбора с точки
зрения критерия ожидаемого значения.
Задание 4.2
Фермер может выращивать либо кукурузу, либо соевые бобы.
Вероятность того, что цены на будущий урожай этих культур будут
высокими, средними или низкими, оцениваются, соответственно,
как 0,45; 0,3 и 0,25. Если цены будут высокими, то урожай кукурузы даст 3 000 д. е. чистого дохода, а урожай соевых бобов — 1 000
д. е. Если цены будут на среднем уровне, то это позволит только
покрыть расходы. Если цены будут низкими, то выращивание кукурузы и соевых бобов приведет к потерям в 2 000 и 500 д. е. соответственно. Кроме того, фермер имеет дополнительный выбор, связанный с использованием земли как пастбища, что гарантированно
принесет ему прибыль в 450 д. е.
1. Построить дерево решений и определить, какую культуру следует выращивать фермеру
— исходя из реальной стоимости денег (с позиций безразличного
к риску инвестора);
— исходя из функции полезности, полученной в задании 4.1 для
инвестора А.
2. Предположим, что фермер может получить дополнительную
информацию от брокера в виде общей оценки степени стабиль-
118
ности будущих цен на продукцию (прогноз «благоприятныйнеблагоприятный»):
— при высоком уровне цен брокер дает благоприятный прогноз с
вероятностью 0,85 и неблагоприятный — с вероятностью 0,15;
— при среднем уровне цен прогноз будет благоприятным или неблагоприятным с вероятностью 0,5;
— при условии низких цен прогноз будет благоприятным с вероятностью 0,15 и неблагоприятным с вероятностью 0,85.
Переоценить вероятности высокого, среднего и низкого уровня
цен с учетом прогноза брокера, построить соответствующее дерево
решений и определить оптимальную стратегию использования
земли
— исходя из реальной стоимости денег (с позиций безразличного
к риску инвестора);
— исходя из функции полезности, полученной в задании 4.1 для
инвестора А.
3. Оформить отчет. Содержание отчета: деревья решений и обоснование оптимальной стратегии для ситуаций, описанных в
п. 1 и 2. Привести все необходимые расчеты.
Задание 4.3
Ежедневный спрос на булочки в продовольственном магазине
задается распределением вероятностей, представленным в таблице
4.5. Магазин покупает булочку по 0,55 д. е., а продает по 1,20 д. е.
Если булочка не продана в тот же день, то в конце дня она может
быть реализована за 0,25 д.е. Величина запаса булочек может принимать одно из возможных значений спроса, которые перечислены
в таблице 4.5.
Таблица 4.5
n
рn
100
0,20
150
0,25
200
0,30
250
0,15
300
0,10
1. Построить дерево решений и определить оптимальный объем
ежедневного заказа исходя из реальной стоимости денег.
2. Пусть временной интервал, для которого необходимо решить
задачу, составляет два дня. Альтернативы для второго дня зави119
сят от объема реализации булочек в первый день. Если реализован в точности весь запас первого дня, магазин закажет такое
же количество булочек и на второй день. Если потребность в
булочках в первый день превышает имеющийся запас, то для
второго дня магазин может заказать любой из объемов спроса
на булочки, который превышает запас первого дня. И, наконец,
если в первый день реализовано меньше булочек, чем было закуплено, то для второго дня магазин может заказать любой из
объемов спроса на булочки, который меньше запаса первого
дня. Построить соответствующее дерево решений и определить
оптимальную стратегию заказа.
3. Оформить отчет. Содержание отчета: деревья решений и обоснование оптимальной стратегии в случае одно- и двухдневного
интервала планирования. Привести все необходимые расчеты.
Задание 4.4
Рассмотрим ситуацию, подобную описанной в п. 4.2.4.
В силу роста потребностей города в воздушных перевозках и
ограниченных возможностей существующего аэропорта по удовлетворению этих потребностей возникла проблема развития аэропорта путем расширения существующего и/или строительства нового
аэропорта. В ходе специально проведенных исследований было
проанализировано множество различных способов решения проблемы. Экспертная комиссия приняла решение оценивать все
имеющиеся альтернативы по 4 критериям:
— f1 – общие затраты на строительство и эксплуатацию в течение заданного периода времени (млн. д. е.),
— f2 – фактическая пропускная способность (количество взлетно-посадочных операций в час),
— f3 – число людей, которые могут получить серьезные ранения
или погибнуть, отнесенное к числу авиакатастроф,
— f4 – число людей, переселяемых при расширении/строительстве аэропорта;
а также установила возможный разброс значений по каждому критерию. Результаты представлены в таблице 4.6.
120
Таблица 4.6.
Критерий
Наихудшее значение
Наилучшее значение
f1
f2
f3
f4
400
80
1 000
200 000
50
250
1
3 000
1. Выступая одновременно в роли аналитика и опрашиваемого
лица, чьи предпочтения должны быть учтены, провести все
процедуры, необходимые для
• построения одномерных функций полезности, позволяющих оценить качество альтернатив по каждому из критериев,
• обоснования вида и определения параметров функции полезности, позволяющей оценить качество каждой альтернативы в целом
и построить многокритериальную функцию полезности.
2. Предположим, что после объединения сходных по природе и
отбрасывания заведомо «худших» альтернатив для дальнейшего оценивания оставлено три стратегии. Оценки этих стратегий
по критериям f1 — f4 представлены в таблице 4.7. Используя
функцию полезности, построенную в п. 1, оценить качество каждой альтернативы в целом и определить лучшую из представленных альтернатив.
Таблица 4.7
Альтернатива
х1
х2
х3
f1
340
270
320
Оценки по критериям
f2
f3
210
300
190
450
230
670
f4
25 000
140 000
85 000
3. Предположим, что за счет различных причин (возможных технологических изменений, изменения цен, миграции населения,
изменения потребности в воздушных перевозках и т. п.) по121
следствия выбора каждой из альтернатив не могут быть определены однозначно. При некоторых упрощающих предположениях были получены оценки распределения вероятностей тех
или иных последствий, представленные в таблице 4.8.
Таблица 4.8
Альтернатива
Распределения вероятностей последствий
х1
(330, 210,
(350, 220,
(360, 210,
(х11, х12, х13, (320, 200,
300, 30 000) 350, 25 000) 270, 35 000) 250, 20 000)
х14)
р(х11, х12, х13,
0,1
0,3
0,4
0,2
х14)
х2
х3
(х21, х22, х23, (250, 180,
(260, 190,
(280, 190,
(290, 190,
х24)
500, 120 000) 520, 100 000) 450, 130 000) 400, 120 000)
р(х21, х22, х23,
0,2
0,3
0,3
0,2
х24)
(х31, х32, х33, (300, 210,
(310, 210,
(320, 230,
(340, 230,
х34)
700, 90 000) 650, 95 000) 680, 90 000) 500, 80 000)
р(х31, х32, х33,
0,1
0,4
0,3
0,2
х34)
Построить дерево решений и определить альтернативу с наибольшей ожидаемой полезностью.
4. Оформить отчет. Содержание отчета:
1) Одномерные функции полезности для каждого из критериев
(описать все процедуры, выполненные для их построения).
2) Проверка условий независимости критериев.
3) Обоснование вида многокритериальной функции полезности, полученная функция полезности (описать все процедуры,
выполненные для ее построения).
4) Оценки качества альтернатив, представленных в таблице 4.7,
с указанием наилучшей и наихудшей альтернативы.
5) Дерево решений для анализа ситуации, описанной в п. 3. задания и обоснование выбора наилучшей альтернативы.
122
5. èêàçüíàÖ êÖòÖçàâ
çÄ éëçéÇÖ ëìÅöÖäíàÇçõï åéÑÖãÖâ. åÖíéÑ
ÄçÄãàáÄ àÖêÄêïàâ
Подход аналитической иерархии (Analytic Hierarchy Process —
АНР) широко известен в настоящее время. Основной метод был
разработан Т. Саати; целью являлась «разработка теории и методологии для моделирования неструктурированных задач в экономике,
науке управления и социальных науках» [9].
5.1. éÅôÄü ïÄêÄäíÖêàëíàäÄ èéÑïéÑÄ Äçê
Метод АНР разработан для решения задач, в которых все альтернативы определены заранее. Усилия ЛПР (в отличие от методов,
рассмотренных в предыдущем разделе) направляются на сравнение
только заданных альтернатив. Основная идея метода состоит в воспроизведении в модели «естественного хода человеческого мышления»: объединение множества элементов, отражающих сложную
ситуацию (контролируемых или неконтролируемых), в группы в
соответствии с распределением между ними некоторых свойств;
общие свойства, определяющие группы, рассматриваются как элементы более высокого уровня системы и т. д., пока не будет достигнут единственный элемент — вершина, отождествляемая с целью процедуры принятия решения. Этот процесс фактически
означает построение иерархии.
При анализе иерархии центральным вопросом является следующий: насколько сильно влияют отдельные факторы самого
низкого уровня иерархии на вершину (общую цель)? Неравномерность влияния различных факторов характеризуется количественными показателями интенсивности влияния — приоритетами факторов. Определение приоритетов факторов низшего уровня
относительно цели сводится к последовательности задач определения приоритетов для каждого уровня, а каждая такая задача — к последовательности попарных сравнений элементов данного уровня.
123
Основные этапы метода АНР.
1. Структуризация задачи — построение иерархической структуры с несколькими уровнями. В простейшем случае — структуры с уровнями: цели — критерии — альтернативы.
2. Попарные сравнения элементов каждого уровня, которые выполняет ЛПР. Результаты сравнений представляются в числовой форме.
3. Вычисление приоритетов (коэффициентов важности) для элементов каждого уровня. При этом производится проверка согласованности суждений ЛПР.
4. Определение количественного индикатора качества (коэффициента важности относительно цели) для каждого элемента низшего уровня (альтернативы) и определение наилучшей альтернативы.
5.2. ïÄêÄäíÖêàëíàäÄ éëçéÇçõï ùíÄèéÇ åÖíéÑÄ Äçê
5.2.1. Построение иерархии
Иерархия в АНР — это определенный тип системы, характеризующийся признаками: элементы системы могут группироваться в
несвязанные множества (группы); элементы каждой группы находятся под влиянием элементов некоторой вполне определенной
группы и, в свою очередь, оказывают влияние на элементы другой
группы; элементы в каждой группе (уровне, кластере, страте) независимы.
Не существует установленной процедуры генерирования целей,
критериев и видов деятельности для включения в иерархию. Она
зависит от целей декомпозиции сложной системы. В [9] предложена общая форма иерархий, связанных с решением задач различных
типов. Примеры представлены на рис. 5.1.
124
Иерархии, связанные
с планированием:
Иерархии, связанные с анализом
стоимость-эффективность:
основные цели
основные цели
подцели
подцели
возможные организационные
действия в настоящее время
критерии
подкритерии
другие действующие
лица (акторы)
собственные цели акторов
цели других акторов
возможные действия
акторов
возможные действия
других акторов
возможные исходы
(альтернативы, сценарии)
возможные исходы
(альтернативы, сценарии)
Рис. 5.1. Примеры иерархий [9]
5.2.2. Определение приоритетов в иерархии
Для определения «степени важности» (приоритетов) элементов
низшего уровня иерархии (альтернатив) относительно главной цели требуется последовательное решение цепочки задач определения приоритетов элементов уровня i относительно их влияния на
каждый элемент уровня i — 1. Пусть заданы c1, c2, … , cn — элементы уровня i иерархии и один элемент е уровня i — 1. Процедура
определения приоритетов элементов c1, c2, … , cn относительно е
включает следующие действия:
• сравнить элементы уровня i попарно по силе их влияния на
е; результаты сравнений выразить в числовой форме;
• из полученных чисел составить матрицу сравнений;
• на основе зафиксированных суждений элементам c1, c2, … , cn
поставить в соответствие множество числовых весов w1, w2, … ,
wn.
Рассмотрим эти действия подробнее.
• Попарное сравнение элементов уровня i.
Сравнение производит ЛПР. Для сравнения используется шкала
словесных определений уровня важности, каждому из которых со125
поставляется число по 9-балльной шкале. Соответствие шкальных
значений показано в таблице 5.1.
Таблица 5.1
Количественное
значение
Уровень важности
Одинаковая важность
1
Умеренное (незначительное) превосходство
3
Существенное (значительное) превосходство
5
Явное (большое) превосходство
7
Абсолютное (очень большое) превосходство
9
Для фиксации результатов сравнений могут также использоваться промежуточные значения: 2, 4, 6, 8. В [9] приведено обоснование применения именно 9-балльной шкалы, построенное на основе анализа результатов психофизических исследований.
• Формирование матрицы сравнений.
Количественные результаты сравнений пар объектов (ci, cj), i, j =
= 1, 2, …, n, представляются в виде матрицы сравнений — матрицы А размерности n×n. При определении элементов aij, i, j = 1, 2,
…, n, используется соглашение: сравнение всегда производится
для действия или объекта сi по отношению к действию или объекту сj.
Элементы aij, i, j = 1, 2, …, n, определяются в соответствии с
правилами:
1) если aij = α, то aji = 1/α, α ≠ 0;
2) если суждения таковы, что сi имеет одинаковую с сj относительную важность, то aij = aji = 1; в частности, aii = 1 для всех i.
Таким образом, матрица А является положительной обратносимметричной и имеет вид
126
⎛ 1
a12
a13
⎜
a23
1
⎜1 a12
1
А = ⎜1 a13 1 a23
⎜
⎜
⎜
⎝1 a1n 1 a2 n 1 a3n
a1n ⎞
⎟
a2 n ⎟
a3n ⎟.
⎟
⎟
⎟
1 ⎠
• Определение приоритетов (весов) w1, w2, … , wn.
Для обоснования метода определения весов сначала рассмотрим гипотетический случай, когда «степень важности» объектов c1,
c2, … , cn может быть измерена точно (некоторым прибором).
В этом случае:
значения wi и wj — показания прибора;
w
w
суждение «ci в i раз важнее cj», записывается в виде aij = i ;
wj
wj
матрица А имеет вид
⎛ w1 w1
⎜
⎜ w2 w1
А = ⎜ w3 w1
⎜
⎜
⎜
⎝ wn w1
w1 w2
w2 w2
w3 w2
w1 w3
w2 w3
w3 w3
wn w2
wn w3
w1 wn ⎞
⎟
w2 wn ⎟
w3 wn ⎟.
⎟
⎟
⎟
wn wn ⎠
В идеальном случае точных измерений
aij ⋅ a jk =
wi w j wi
⋅ = = aik , i, j, k =1, 2 , … , n .
w j wk wk
Условие aij ⋅ a jk = aik , i, j, k =1, 2 , … , n , называется условием
согласованности матрицы A. Согласованность означает, что при
наличии (n−1) суждений о парных сравнениях объектов все остальные суждения могут быть выведены из имеющихся. Для идеального случая
127
⎛ w1 ⎞ ⎛ 1
⎜ ⎟ ⎜
⎜ w2 ⎟ ⎜ w2 w1
А ⋅⎜ ⎟= ⎜
⎜ ⎟ ⎜
⎝ wn ⎠ ⎝ wn w1
w1 w2
1
wn w2
⎛ w1 ⎞
w1 wn ⎞ ⎛ w1 ⎞ ⎛ nw1 ⎞
⎟⎜ ⎟ ⎜
⎟
⎜ ⎟
w2 wn ⎟ ⎜ w2 ⎟ ⎜ nw2 ⎟
⎜ w2 ⎟
⎟⋅⎜ ⎟ = ⎜
⎟ = n⋅⎜ ⎟,
⎟⎜ ⎟ ⎜
⎟
⎜ ⎟
1 ⎠ ⎝ wn ⎠ ⎝ nwn ⎠
⎝ wn ⎠
что означает: число n является собственным значением матрицы А,
а вектор (w1, w2, … , wn)Т — собственным вектором, отвечающим
этому собственному значению.
Обозначим наибольшее по модулю собственное значение матрицы А через λmax. Для положительных обратно-симметричных
матриц доказано следующее утверждение.
Теорема 5.1
Положительная обратно-симметричная матрица согласована
тогда и только тогда, когда λmax = n. В общем случае λmax ≥ n.
В общем случае неидеальных измерений необходимо учесть
отклонения, связанные с ошибками в суждениях ЛПР. Если в
идеальном случае для каждого фиксированного i имеет место
wi = aij · wj, j = 1, 2, … , n (одно и то же значение wi при всех j),
то в общем случае (при наличии отклонений) получим n значений, статистически рассеянных вокруг wi. Поэтому реалистичное
требование состоит в том, чтобы положить wi равным среднему
значению из aij · wj, j = 1, 2, … , n:
n
1
wi = ∑ aij ⋅ w j , i =1, 2 , … , n .
n j=1
(5.1)
Тогда возникает вопрос: гарантировано ли существование решения задачи по определению весов wi, удовлетворяющих (5.1) при
заданных aij и, в случае существования, является ли это решение
единственным?
Учитывая, что матрицы, полученные в результате парных сравнений элементов c1, c2, … , cn, не являются согласованными (в силу
имеющихся ошибок в суждениях), необходимо установить количественную меру и «уровень допустимости» степени несогласован-
128
ности, а также учесть эту несогласованность при решении задачи
определения весов.
w
В случае несогласованности вместо aij = i имеет место
wj
aij =
wi
(1+ δij ) , δij >−1 .
wj
λmax − n
.
n −1
Для положительных обратно-симметричных матриц доказано, что
Обозначим μ =
μ=
⎛
δij2 ⎞
λmax − n
1
2
⎜
⎟.
=
δ
−
∑
ij
n −1
n ( n −1) 1≤i< j≤n⎜
1+δij ⎟
⎝
⎠
Отсюда следует, что при малых δij значение μ близко к нулю (то
же, что λmax близко к n), т. е. малые возмущения элементов положительной обратно-симметричной матрицы вызывают малые возмущения в собственных значениях. Поэтому при небольших значениях отклонений δij решение задачи (5.1) может быть заменено на
wi =
1
n
∑ a ⋅ w , i =1, 2, … , n .
λmax j=1 ij j
(5.2)
Это задача о нахождении собственного вектора w, соответствующего собственному значению λmax:
(5.3)
А·w = λmax·w,
где
⎛ 1
⎛ w1 ⎞
a12
a1n ⎞
⎜
⎟
⎜ ⎟
1
a2 n ⎟
⎜1 a12
⎜ w2 ⎟
А =⎜
,
w
=
⎟
⎜ ⎟,
⎜
⎟
⎜ ⎟
1 ⎠
⎝1 a1n 1 a2 n
⎝ wn ⎠
которая имеет единственное решение с точностью до постоянного
множителя. Единственность решения задачи нахождения вектора w
n
можно обеспечить, добавив требование ∑ wi = 1 .
i=1
129
Таким образом, для нахождения вектора весов w требуется
1) найти вектор, удовлетворяющий (5.3)
2) нормализовать полученный вектор (разделить каждую компоненту на сумму всех компонент).
Для получения точного решения уравнения (5.3) в общем случае требуются серьезные вычисления. Поэтому разработаны процедуры, позволяющие получить оценки нормализованного вектора,
удовлетворяющего (5.3). Далее представлены две такие процедуры.
Результаты применения этих процедур для несогласованных матриц могут отличаться. В этом случае вторая процедура дает более
точную оценку вектора w.
1. Усреднение по нормализованным столбцам: нормализация каждого столбца матрицы А (деление всех элементов столбца на
сумму элементов этого столбца) и вычисление среднего арифметического для каждой полученной строки.
2. Нахождение среднего геометрического каждой строки (вычисление корня n-й степени из произведения всех элементов строки) и нормализация полученного вектора.
Пример 5.1
Пусть сравниваются элементы c1, c2, c3, c4 уровня i относительно элемента е уровня i — 1. По результатам парных сравнений составлена матрица
⎛ 1
5
6
⎜
15
1
4
А =⎜
⎜1 / 6 1 / 4 1
⎜
⎝1 7 1 6 1/ 4
7⎞
⎟
6⎟
.
4⎟
⎟
1⎠
Значения элементов первой строки показывают, что по своему
влиянию на е элемент c1 существенно превосходит c2, а также явно
(сильно) превосходит c4; степень превосходства c1 над c3 оценивается как промежуточная между существенным и большим превосходством. Значения элементов второй строки показывают, что степень превосходства c2 над c3 оценивается как промежуточная
между умеренным и существенным превосходством; степень пре-
130
восходства c2 над c4 — как промежуточная между существенным и
большим превосходством. Из третьей строки видно, что степень
превосходства c3 над c4 оценивается как промежуточная между
умеренным и существенным превосходством. Найдем веса (приоритеты) элементов c1, c2, c3, c4 относительно е в соответствии с
процедурами 1 и 2.
Процедура 1. Нормализуем каждый столбец матрицы А (разделим элементы каждого столбца на сумму элементов этого столбца).
Получим нормализованную матрицу
⎛ 0,662
⎜
⎜ 0 ,132
⎜ 0 ,110
⎜
⎝ 0 ,095
0 ,779
0,156
0 ,039
0 ,026
0,533
0 ,356
0,089
0,022
0 ,389 ⎞
⎟
0,333⎟
.
0 ,222⎟
⎟
0,056⎠
Для каждой строки найдем среднее арифметическое ее элементов, в результате чего получим вектор
T
w = (0 ,591 0 ,244 0,115 0,050) .
Процедура 2. Найдем среднее геометрическое каждой строки
путем вычисления корня 4-й степени из произведения всех элементов данной строки. В результате получим вектор
(3,807 1,480 0,639 0,278)T .
Нормализация этого вектора (деление каждого элемента на
сумму всех элементов, равную 6,204), дает
T
w = (0 ,614 0 , 239 0 ,103 0 ,045) .
Для сравнения: собственный вектор матрицы А, отвечающий
собственному значению λmax, компоненты которого найдены с точностью до третьего знака после запятой, имеет вид
(0,618 0,235 0,101 0,045)T .
131
5.2.3. Оценка согласованности суждений
λmax − n
может служить количественной мерой
n −1
степени несогласованности матрицы парных сравнений и называется индексом согласованности матрицы А. Обозначим его CI.
Среднее значение индекса согласованности для большой выборки сгенерированных случайным образом по шкале от 1 до 9 обратно-симметричных матриц называется стохастическим коэффициентом согласованности. Обозначим его RI.
Величины RI для матриц различной размерности неоднократно
оценивались экспериментально.
— В Национальной лаборатории Окриджа (США) были сгенерированы выборки по 100 матриц размерностей от 3 до 15:
• главная диагональ заполнялась 1;
• для любого элемента aij, j > i (над диагональю) в качестве
значения выбиралось случайно любое из целых чисел 1 — 9
или обратная ему величина;
• при j < i aij = 1/aji.
Для каждой выборки было вычислено среднее значение величины μ.
— Вычисления были повторены в школе Уортона (США) для случайных выборок объема 500 матриц порядка от 1 до 11; для n =
12, 13, 14, 15 использовались предыдущие результаты. Полученные результаты представлены в таблице 5.2.
Величина μ =
Таблица 5.2
Порядок
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
матрицы
Значе0,00 0,00 0,580,901,121,241,321,411,451,491,511,481,561,571,59
ние RI
В [11] для определения коэффициента RI предлагается эмпири1,98 ( n − 2)
ческая формула RI =
.
n
132
CI
, где коэффициенты CI и RI вычислены для
RI
матриц одного и того же порядка, называется отношением согласованности.
Значение CR, меньшее или равное 0,10; обычно считается приемлемым (приемлемой считается соответствующая степень несогласованности).
Пример 5.2
Для матрицы
⎛ 1
5
6 7⎞
⎜
⎟
1
4 6⎟
⎜1 5
А =⎜
1/ 6 1/ 4 1
4⎟
⎜
⎟
⎝ 1 7 1 6 1 / 4 1⎠
Величина CR =
из примера 5.1 используем оценку вектора w, найденную с помощью процедуры 2: (0,614; 0,239; 0,103; 0,045)Т.
В соответствии с (5.3),
⎛ 1
5
6
⎜
15
1
4
А⋅ w = ⎜
⎜1 / 6 1 / 4 1
⎜
⎝1 7 1 6 1/ 4
⎛ 0,614⎞
7⎞⎛ 0,614⎞ ⎛ 2,742⎞
⎟⎜
⎟ ⎜
⎟
⎜
⎟
6⎟⎜0, 239⎟ ⎜1,044 ⎟
0,239⎟
⎜
⋅
=
= λmax ⋅ w = λmax ⋅⎜
,
4⎟⎜ 0,103 ⎟ ⎜ 0,445⎟
0,103 ⎟
⎟⎜
⎟ ⎜
⎟
⎜
⎟
1⎠⎝ 0,045⎠ ⎝ 0,198 ⎠
⎝ 0,045⎠
поэтому в качестве оценки значения λmax можно взять среднее
⎧ 2 ,742 1,044 0 ,445 0 ,198 ⎫
⎬ . Полу;
;
;
арифметическое значений ⎨
⎩ 0 ,614 0 , 239 0 ,103 0 ,045⎭
чим λmax = 4,390.
λ −n
4 ,39 − 4
=
= 0,130 .
Тогда CI = max
n −1
3
Т. к. при n = 4 RI = 0,90; получим отношение согласованности
CR =
CI
0,13
=
= 0 ,14 ;
RI
0 ,90
которое нельзя считать приемлемым.
133
Вывод: матрица сравнений плохо согласована.
Замечание.
Для получения оценки λmax может быть использована другая
процедура, которая основана на следующих соображениях: из (5.3)
для любого i = 1, … , n
n
∑ a ⋅w = λ
ij
j
max
⋅ wi ,
j=1
тогда
n
⎛ n
i=1
⎝ j=1
⎞
n
⎠
i=1
∑⎜⎜∑ a ⋅ w ⎟⎟ = ∑ λ
ij
j
n
max ⋅ wi = λ max ∑ wi = λ max .
i=1
Для матрицы А из примера 5.2 получим следующую оценку:
λmax = 2,742 + 1,044 + 0,445 + 0,198 = 4,429.
5.2.4. Формализация понятий «иерархия» и «приоритеты»
Упорядоченным множеством называется множество S, на котором задано бинарное отношение ≤ обладающее свойствами рефлексивности, антисимметричности и транзитивности:
• для любого x ∈ S x ≤ x;
• из x ≤ y и y ≤ x следует x = y;
• для любых x, y, z ∈ S из x ≤ y и y ≤ z следует x ≤ z.
Для любого отношения ≤ обладающего указанными свойствами, можно определить отношение < следующим образом: x < y, если x ≤ y и x ≠ y.
Элемент y называется покрывающим (доминирующим) для элемента x, если x < y и если x < t < y невозможно ни для какого t.
Упорядоченное множество S с дополнительным свойством:
если x, y ∈ S , то или x ≤ y , или y ≤ x,
называется вполне упорядоченным. Если указанное свойство не
имеет места, то множество S называется частично упорядоченным.
134
Введем обозначения:
x− = { y x покрывает y} , x+ = { y y покрывает x}
для любого элемента х в упорядоченном множестве.
Пусть H — конечное частично упорядоченное множество с
наибольшим элементом b. H называется иерархией, если выполняются следующие условия.
1) Существует разбиение H на подмножества Lk, k = 1, 2, … , h,
где L1 = {b}.
2) Из x ∈ Lk следует, что x− ⊂ Lk+1 , k =1, 2 , … , h −1.
3) Из x ∈ Lk следует, что x+ ⊂ Lk−1 , k = 2, 3, … , h .
Для каждого x ∈ H существует весовая функция (сущность ее
зависит от явления, для которого строится иерархия)
wx : x− → [ 0 ,1] ,
такая что ∑ wx ( y ) = 1.
y ∈ x−
Множества Li называются уровнями иерархии, а функция wх –
функцией приоритета элемента некоторого уровня относительно x.
Замечание.
Даже если для некоторого уровня Lk x− ⊄ Lk+1 , то wх может
быть определена для всех Lk, если приравнять к нулю ее значения
для всех элементов Lk+1, не принадлежащих x−.
Иерархия называется полной, если для всех x ∈ Lk верно
x+ = Lk−1 , k = 2 , 3, … , h .
5.2.5. Определение приоритетов факторов низшего уровня
относительно цели
Основная задача может быть сформулирована следующим образом. Имеется социальная или экономическая система с главной
целью b и множеством основных видов действий (альтернатив) Lh.
Пусть эту систему можно представить как иерархию с первым
135
(высшим) уровнем b и нижним уровнем Lh. Требуется определить
приоритеты (коэффициенты относительной важности) элементов
уровня Lh по отношению к b.
Метод решения этой задачи состоит в следующем.
Пусть Lk+1 = Х = {x1, x2, … , xnk+1}, Lk = Y = {у1, у2, … , уnk}.
Предположим, что существует z ∈ Lk−1 , такой что y ∈ z− для
некоторого у, и заданы весовые функции приоритетов:
wyj : X → [0, 1], j = 1, 2, … , nk, —
для каждого элемента уровня k+1 определяет вес (приоритет)
относительно его влияния на j-й элемент уровня k;
wz : Y → [0, 1], —
для каждого элемента уровня k определяет вес (приоритет)
относительно его влияния на элемент z уровня k–1.
Обозначим w : X → [0, 1] функцию приоритета элементов из X
относительно z. Зададим ее следующим образом:
nk
w ( xi ) = ∑ wy j ( xi )⋅ wz ( y j ) , i =1, 2, … , nk+1 .
(5.4)
j=1
Для упрощения построений можно использовать матричную
форму записи. Обозначим:
V — матрица приоритетов (k+1)-го уровня, vij = wyj(xi);
W' — столбец приоритетов Y относительно z, w'j = wz(yj);
W — столбец приоритетов X относительно z, wi = w(xi).
Тогда правило (5.4) можно записать в матричной форме: W = V·W'.
Правило (5.4) может быть обобщено следующим образом.
Пусть H — полная иерархия с наибольшим элементом b и h уровнями, Vk — матрица приоритетов k-го уровня, k = 2, 3, … , h. Если
W' — вектор приоритетов p-го уровня относительно некоторого
элемента z, принадлежащего (p−1)-му уровню, то вектор приоритетов W q-го уровня (p < q) относительно z определяется как
W = Vq·Vq–1· …·Vp+1·W'.
В частности, вектор приоритетов элементов низшего уровня
относительно элемента b равен
136
W = Vh·Vh–1· …·V2· W'.
(5.5)
Обычно уровень L1 состоит из единственного элемента, в этом
случае вектор W' — просто скаляр (как правило, полагают W' = 1).
Пример 5.3 Распределение энергии [9].
Найдем веса (приоритеты) распределения энергии для нескольких крупных потребителей в соответствии с их общим вкладом в
различные цели общества. Имеются три крупных потребителя
энергии (США):
с1 — бытовое потребление,
с2 — транспорт,
с3 — промышленность.
Они составляют третий (низший) уровень иерархии.
Критериями, по которым оцениваются потребители, являются:
вклад в развитие экономики, вклад в качество окружающей среды и
вклад в национальную безопасность. Критерии составляют второй
уровень иерархии.
Общая цель (первый уровень) — достижение благоприятного
социального и политического положения. Иерархия представлена
на рис. 5.2.
Уровень 1
цель
Благоприятное социальное
и политическое положение
Уровень 2
критерии
Развитие
экономики
Качество
окружающей среды
Национальная
безопасность
Уровень 3
потребители
с1
бытовое
потребление
с2
транспорт
с3
промышленность
Рис. 5.2. Иерархия в задаче распределения энергии
При построении матрицы парных сравнений трех элементов
второго уровня относительно общей цели навязывалась согласованность: после заполнения первой строки остальные строки за137
полнялись исходя из требований согласованности. Для заполнения
первой строки производилось сравнение степени важности вклада
в экономику с качеством окружающей среды и вкладом в национальную безопасность относительно достижения общей цели. Были
зафиксированы суждения ЛПР: вклад в экономику имеет сильное
превосходство в первом случае и слабое превосходство во втором.
Результатом парных сравнений элементов второго уровня является
матрица
⎛ 1
5
3 ⎞
⎜
⎟
1
3 / 5⎟.
⎜1 / 5
⎜
⎟
⎝1 / 3 5 / 3 1 ⎠
Матрица сравнений идеально согласована (по построению), поэтому в данном случае λmax = 3, CI = 0. Вектор приоритетов, найденный в соответствии с процедурой 2, имеет вид
T
w = V2 = (0 ,65 0 ,13 0 , 22) .
Это значит, что по социально-политическому влиянию экономика получает приоритет 0,65; окружающая среда — 0,13; национальная безопасность — 0,22.
Далее ЛПР проводит оценку относительной важности каждого
потребителя (элемента третьего уровня) с точки зрения экономики,
окружающей среды и национальной безопасности (относительно
каждого элемента второго уровня) отдельно. Матрицы, представляющие суждения ЛПР, представлены далее. Поскольку при составлении этих матриц согласованность не навязывалась принудительно, то для каждой матрицы вычислялся коэффициент
согласованности.
Сравнение потребителей относительно их вклада в экономику:
⎛ 1
3 5⎞
⎜
⎟
2⎟, λmax = 3,00 ; CI = CR = 0 ,00 .
⎜1 / 3 1
⎜
⎟
⎝1 / 5 1 / 2 1 ⎠
138
Сравнение потребителей относительно качества окружающей
среды:
⎛ 1
2 7⎞
⎜
⎟
⎜1 / 2 1 5⎟, λmax = 3,01; CI = 0 ,01; CR = 0 ,02 .
⎜
⎟
⎝1 / 7 1 / 5 1 ⎠
Сравнение потребителей относительно их вклада в национальную безопасность:
⎛ 1
2
3⎞
⎜
⎟
2⎟, λmax = 3,01; CI = 0,01; CR = 0,02 .
⎜1 / 2 1
⎜
⎟
⎝1 / 3 1 / 2 1 ⎠
Поскольку уровень согласованности можно считать приемлемым, для каждой матрицы был найден вектор весов (приоритетов)
в соответствии с процедурой 2:
экономика:
окружающая среда: национальная безопасность:
⎛0 ,65⎞
⎜
⎟
⎜0 ,23⎟
⎜
⎟
⎝ 0,12 ⎠
⎛0,59⎞
⎜
⎟
⎜ 0,33⎟
⎜
⎟
⎝0,08⎠
⎛0 ,54⎞
⎜
⎟
⎜0 ,30⎟.
⎜
⎟
⎝ 0,16 ⎠
Эти вектора являются столбцами матрицы приоритетов третье⎛0 ,65 0,59 0,54⎞
⎜
⎟
го уровня. Таким образом, V3 = ⎜0 ,23 0 ,33 0,30⎟.
⎜
⎟
⎝ 0,12 0,08 0 ,16 ⎠
В соответствии с (5.5), приоритеты потребителей относительно
главной цели равны
W = V3·V2·W'.
Положим W' = 1, тогда
⎛0 ,65 0,59 0,54⎞⎛ 0,65⎞
⎛ 0 ,62⎞
⎜
⎟⎜
⎟
⎜
⎟
⋅ 0,13 ⎟⋅1 = ⎜ 0, 26⎟.
W = ⎜0 ,23 0 ,33 0,30⎟⎜
⎜
⎟⎜
⎟
⎜
⎟
⎝ 0,12 0,08 0 ,16 ⎠⎝ 0, 22⎠
⎝ 0,12 ⎠
139
По своему влиянию на достижение главной цели потребители
получают приоритеты:
c1 (бытовое потребление) — 0,62;
c2 (транспорт) — 0,26;
c3 (промышленность) — 0,12.
5.3. èêàåÖê èêÄäíàóÖëäéÉé èêàåÖçÖçàü
ÄçÄãàáÄ àÖêÄêïàâ (ÄçÄãàá ÄãúíÖêçÄíàÇ éêÉÄçàáÄñàà
èÖêÖèêÄÇõ óÖêÖá êÖäì)
Рассматриваемую далее ситуацию можно представить как частный случай задачи размещения ресурсов. В общем случае размещение ресурсов приводит к трансформации системы из одного состояния в другое (например, построение моста изменяет состояние
транспортных перевозок). При решении таких задач часто используется метод стоимость-эффективность, в соответствии с которым
лучшей признается альтернатива, имеющая наибольшее значение
отношения эффективности к стоимости. Для нахождения этого
значения необходимо определить приоритеты альтернатив относительно их эффективности и стоимости.
Приоритеты альтернатив относительно их эффективности можно получить с помощью анализа иерархии, включающей цели и
характеристики альтернатив, а также сами альтернативы. Следующий этап — рассмотрение иерархии для издержек реализации альтернатив. Таким образом, для решения исходной задачи может
быть использована комбинация метода анализа иерархий и метода
стоимость-эффективность. Рассмотрим этот подход на примере задачи анализа альтернатив организации переправы через реку [9].
Постановка задачи.
Правительственное агентство, обладающее полномочиями на
строительство мостов, туннелей и т. д. в определенном районе,
должно решить: строить или не строить туннель и/или мост через
реку, которую в настоящее время обслуживает частный паром.
Факторы, влияющие на эффективность и стоимость переправы че140
рез реку, относятся к трем категориям: экономической, социальной
и окружающей среды. Для определения приоритетов имеющихся
альтернатив относительно их эффективности и стоимости рассматривалось две иерархии: иерархия относительно эффективности и
иерархия относительно стоимости.
1. Эффективность (выгоды).
Анализ альтернатив выявил основные факторы, влияющие на
выбор.
1) Экономические факторы определяются выгодой, получаемой в результате
• экономии времени от пользования новым мостом или туннелем по сравнению с паромом;
• предполагаемого увеличения притока транспорта из-за пределов района, что дает возможность введения пошлины, и,
как следствие, увеличение общего дохода местных властей;
• оживления торговли, вызванного увеличением интенсивности движения, а также развития сопутствующей торговли
(бензозаправочные станции, рестораны и т. д.);
• экономической выгоды от проведения строительных работ.
2) Социальные факторы определяются выгодой, которую общество в целом получит от наличия моста или туннеля. Они
включают
• обеспечение большей безопасности и надежности, чем паром;
• возможность большего числа поездок через реку для посещения родственников, друзей, музеев и т. д. при наличии
моста или туннеля;
• предмет гордости общины, которая не достигает той же
степени при использовании парома.
3) Факторы окружающей среды рассматриваются с точки зрения их вклада в персональные выгоды (которые менее абстрактны, чем выгоды общества в целом). Факторы окружающей
среды, представляющие интерес для индивидуума, включают
• удобство пользования мостом, туннелем или паромом;
• доступность одного по сравнению с другим;
• эстетику.
141
С учетом всех этих факторов получена иерархия относительно
эффективности, представленная на рис. 5.3.
А
Выгоды переправы через реку
В1
Экономические
С1
Время
С2
Доход
С4
Торговля (в
окрестностях)
В2
Социальные
С3
Торговля
(вдоль)
С6
Безопасность
и надежность
С5
Работа по
строительству
D1
Мост
С7
Связи
С8
Гордость
общины
D2
Тоннель
В3
Окружающей среды
С9
Комфорт
С11
Эстетика
С10
Доступность
D3
Существующий паром
Рис. 5.3. Иерархия относительно эффективности
2. Стоимость (издержки).
1) Экономические факторы определяются расходами, связанными с
• капитальными вложениями в реализацию альтернатив;
• эксплуатацией и текущим ремонтом;
• экономическими следствиями закрытия паромного бизнеса.
2) Социальные факторы представляют собой затраты общества
в целом. Они включают
• изменение стиля жизни в зависимости от принятой альтернативы;
• возможную перегруженность выбранного средства переправы;
• перемещение людей в соответствии с выбранной альтернативой.
3) Факторы окружающей среды рассматриваются с точки зрения вреда, причиняемого экосистеме различными альтернативами. Они включают
• увеличение загазованности в районе;
• загрязнение воды;
• общее разрушение экологии.
142
С учетом всех этих факторов получена иерархия относительно
стоимости (издержек), представленная на рис. 5.4. Обе иерархии
включают 4 уровня.
А
Издержки пересечения реки
В1
Экономические
С1
Капитало
вложения
С2
В2
Социальные
С4
Эксплуатация Изменение
и ремонт
стиля жизни
С3
Прекращение
паромного бизнеса
D1
Мост
В3
Окружающей среды
С5
Перегруженность
С6
Перемещение
людей
D2
Тоннель
С7
С8
Увеличение
Загрязнение
загазованности
воды
С9
Разрушение
экологии
D3
Существующий паром
Рис. 5.4. Иерархия относительно стоимости
На основе суждений ЛПР были сформированы матрицы сравнений.
1. Оценка эффективности.
• Определение приоритетов второго уровня.
Результаты сравнений элементов В1, В2, В3 относительно элемента А:
⎛ 1
3 6⎞
⎜
⎟
матрица сравнений ⎜1 / 3 1
2⎟, CI = 0,00 ; вектор весов
⎜
⎟
⎝1 / 6 1 / 2 1 ⎠
⎛0 ,67 ⎞
⎜
⎟
V2 =⎜0 ,22⎟.
⎜
⎟
⎝ 0,11 ⎠
143
• Определение приоритетов третьего уровня.
Результаты сравнений элементов С1, С2, … , С5 относительно
элемента В1:
⎛1 1 / 3
⎜
⎜3 1
матрица сравнений ⎜7 4
⎜
⎜5 2
⎜
⎝6 2
1 / 7 1 / 5 1 / 6⎞
⎟
1 / 4 1 / 2 1 / 2⎟
1
7
5 ⎟, CI = 0 ,16 ; CR = 0,14 ;
⎟
1/ 7
1 1 / 5⎟
⎟
1/ 5
5
1 ⎠
T
вектор весов (0 ,04 0 ,09 0 ,54 0,11 0 ,23) .
Результаты сравнений элементов С6, С7, С8 относительно элемента В2:
⎛ 1
6
9⎞
⎜
⎟
матрица сравнений ⎜1 / 6 1 4⎟, CI = 0,05 ; CR = 0,09 ;
⎜
⎟
⎝1 / 9 1 / 4 1 ⎠
T
вектор весов (0 ,76 0,18 0 ,06) .
Результаты сравнений элементов С9, С10, С11 относительно элемента В3:
⎛ 1
1 / 4 6⎞
⎟
1
8 ⎟, CI = 0,07 ; CR = 0 ,12 ;
⎜
⎟
⎝1 / 6 1 / 8 1 ⎠
матрица сравнений ⎜
⎜ 4
T
вектор весов (0 ,25 0 ,69 0 ,06) .
В соответствии с замечанием к определению весовой функции
приоритеты элементов С1, С2, С3, С4, С5 относительно В2 и В3, элементов С6, С7, С8 относительно В1 и В3, элементов С9, С10, С11 относительно В1 и В2 полагаются равными нулю. В итоге матрица приоритетов третьего уровня имеет вид
144
⎛ 0,04
0
0 ⎞
⎜
⎟
0
0 ⎟
⎜ 0,09
⎜ 0,54
0
0 ⎟
⎜
⎟
0
0 ⎟
⎜ 0,11
⎜ 0, 23
0
0 ⎟
⎜
⎟
0,76
0 ⎟.
V3 = ⎜ 0
⎜
⎟
0,18
0 ⎟
⎜ 0
⎜ 0
0,06
0 ⎟
⎜
⎟
0
0, 25⎟
⎜ 0
⎜ 0
0
0,69⎟
⎜
⎟
0
0,06⎠
⎝ 0
• Определение приоритетов четвертого уровня.
Результаты сравнений элементов D1, D2, D3 относительно элемента С1:
⎛ 1
2 7⎞
⎜
⎟
матрица сравнений ⎜1 / 2 1
6⎟, CI = 0,02 ; CR = 0,03 ;
⎜
⎟
⎝1 / 7 1 / 6 1 ⎠
T
вектор весов (0 ,58 0 ,35 0 ,07 ) .
Результаты сравнений элементов D1, D2, D3 относительно элемента С2:
⎛ 1 1 / 2 8⎞
⎜
⎟
матрица сравнений ⎜ 2
1 9⎟, CI = 0,02 ; CR = 0,03 ;
⎜
⎟
⎝1 / 8 1 / 9 1⎠
T
вектор весов (0 ,36 0,59 0,05) .
Результаты сравнений элементов D1, D2, D3 относительно элемента С3:
145
⎛ 1
4 8⎞
⎜
⎟
матрица сравнений ⎜1 / 4 1
6⎟, CI = 0,07 ; CR = 0,12 ;
⎜
⎟
⎝1 / 8 1 / 6 1⎠
T
вектор весов (0 ,69 0 ,25 0,06) .
Результаты сравнений элементов D1, D2, D3 относительно элемента С4:
⎛ 1
⎛ 0, 46⎞
1
6⎞
⎜
⎟
⎜
⎟
матрица сравнений ⎜ 1
1
6⎟, CI = 0,00 ; вектор весов ⎜ 0, 46⎟.
⎜
⎟
⎜
⎟
⎝1 / 6 1 / 6 1⎠
⎝ 0 ,08⎠
Результаты сравнений элементов D1, D2, D3 относительно элемента С5:
⎛ 1 1 / 4 9⎞
⎜
⎟
матрица сравнений ⎜ 4
1 9⎟, CI = 0 ,11; CR = 0 ,19 ;
⎜
⎟
⎝1 / 9 1 / 9 1⎠
T
вектор весов (0 ,28 0 ,66 0 ,05) .
Результаты сравнений элементов D1, D2, D3 относительно элемента С6:
⎛ 1
4 7⎞
⎜
⎟
матрица сравнений ⎜1 / 4 1
6⎟, CI = 0,09 ; CR = 0,15 ;
⎜
⎟
⎝1 / 7 1 / 6 1 ⎠
T
вектор весов (0 ,68 0, 26 0,06) .
Результаты сравнений элементов D1, D2, D3 относительно элемента С7:
⎛ 1
⎛ 0 ,46⎞
1 5⎞
⎜
⎟
⎜
⎟
матрица сравнений ⎜ 1
1 5⎟, CI = 0,00 ; вектор весов ⎜ 0 ,46⎟.
⎜
⎟
⎜
⎟
⎝1 / 5 1 / 5 1⎠
⎝ 0,09⎠
146
Результаты сравнений элементов D1, D2, D3 относительно элемента С8:
⎛ 1 5 3 ⎞
⎜
⎟
матрица сравнений ⎜1 / 5 1 1 / 3⎟, CI = 0,02 ; CR = 0,03;
⎜
⎟
⎝1 / 3 3 1 ⎠
T
вектор весов (0 ,64 0 ,11 0 , 26) .
Результаты сравнений элементов D1, D2, D3 относительно элемента С9:
⎛ 1
5 8⎞
⎜
⎟
матрица сравнений ⎜1 / 5 1 5⎟, CI = 0,08 ; CR = 0 ,13;
⎜
⎟
⎝1 / 8 1 / 5 1⎠
T
вектор весов (0 ,73 0 ,21 0 ,06) .
Результаты сравнений элементов D1, D2, D3 относительно элемента С10:
⎛ 1
3 7⎞
⎜
⎟
матрица сравнений ⎜1 / 3 1
6⎟, CI = 0,05 ; CR = 0 ,09;
⎜
⎟
⎝1 / 7 1 / 6 1 ⎠
T
вектор весов (0 ,64 0 ,29 0,07 ) .
Результаты сравнений элементов D1, D2, D3 относительно элемента С11:
⎛ 1
6 1 / 5⎞
⎜
⎟
матрица сравнений ⎜1 / 6 1 1 / 3⎟, CI = 0 ,31; CR = 0,53;
⎜
⎟
3 1 ⎠
⎝ 5
T
вектор весов (0 ,27 0 ,10 0 ,63) .
В связи с низким приоритетом элемента С11 можно высказать
предположение, что слабая согласованность последней матрицы не
147
повлияет на окончательный результат. Это предположение подтверждается после привлечения более тонких методов анализа [9].
В противном случае следовало бы обратить внимание ЛПР на
имеющуюся несогласованность и попросить его уточнить свои суждения.
В итоге получена матрица приоритетов четвертого уровня:
⎛ 0 ,58 0 ,36 0 ,69 0 ,46 0 , 28 0 ,68 0 ,46 0 ,64 0 ,73 0 ,64 0 ,27 ⎞
⎜
⎟
V4 = ⎜ 0 ,35 0 ,59 0 ,25 0 ,46 0 ,66 0 , 26 0 ,46 0 ,11 0 ,21 0 , 29 0 ,10 ⎟.
⎜
⎟
⎝ 0 ,07 0 ,05 0 ,06 0 ,08 0 ,05 0 ,06 0 ,09 0 , 26 0 ,06 0 ,07 0 ,63⎠
Вектор приоритетов элементов четвертого (низшего) уровня
относительно эффективности переправы определяется в соответствии с (5.5):
wA = V4·V3·V2· W', W' = 1.
Перемножение полученных выше матриц дает
T
w A = (0,57 0,36 0 ,07 ) .
2. Оценка стоимости.
Анализ иерархии издержек и определение вектора приоритетов
элементов четвертого уровня относительно издержек выполнялся
T
аналогично. Итоговый результат: w A = (0 ,36 0 ,58 0 ,05) .
В соответствии с методом стоимость-эффективность в качестве
лучшей следует выбрать альтернативу с номером i, для которого
wA
достигается max iA .
i
wi
В рассматриваемом примере:
мост
туннель
паром
w3A 0,07
w1A 0,57
w2A 0,36
=
=1, 4
=
=1,58
=
= 0,62
w3A 0 ,05
w1A 0 ,36
w2A 0,58
Итог: проведенный анализ требует отдать предпочтение строительству моста.
148
5.4. áÄÑÄçàü Ñãü ëÄåéëíéüíÖãúçéÉé ÇõèéãçÖçàü
Задание 5.1
Рассмотрим ситуацию, описанную в п. 5.3. Правительственное
агентство, обладающее полномочиями на строительство мостов, туннелей и т. д. в определенном районе, должно решить: строить или не
строить туннель и/или мост через реку, которую в настоящее время
обслуживает частный паром. Факторы, влияющие на эффективность и
стоимость переправы через реку, относятся к трем категориям: экономической, социальной и окружающей среды и могут быть представлены двумя иерархиями: относительно эффективности и стоимости.
Анализ иерархии относительно эффективности приведен в п. 5.3. Иерархия относительно стоимости представлена на рис. 5.4.
На основе суждений ЛПР были сформированы следующие матрицы сравнений:
A
B1
B2
B3
B1
1
5
7
B2
1/5
1
2
B3
1/7
1/2
1
B1
С1
С2
С3
B2
С4
С5
С6
B3
С7
С8
С9
С1
1
7
9
С4
1
1/3
1/5
С7
1
3
4
С2
1/7
1
5
С5
3
1
1/5
С8
1/3
1
1/3
С3
1/9
1/5
1
С6
5
5
1
С9
1/4
3
1
С1
D1
D2
D3
С2
D1
D2
D3
С3
D1
D2 D3
D1
1
1/3
8
D1
1
1/3
8
D1
1
1
9
D2
3
1
9
D2
3
1
9
D2
1
1
9
D3
1/8
1/9
1
D3
1/8
1/9
1
D3
1/9 1/9
1
149
С4
D1
D2
D3
С5
D1
D2
D3
С6
D1
D2
D3
D1
1
4
9
D1
1
1
9
D1
1
1
9
D2
1/4
1
8
D2
1
1
9
D2
1
1
9
D3
1/9
1/8
1
D3
1/9 1/9
1
D3
1/9 1/9
1
С7
D1
D2
D3
С8
D1
D2
D3
С9
D1
D2
D3
D1
1
3
8
D1
1
3
7
D1
1
1/6
7
D2
1/3
1
6
D2
1/3
1
5
D2
6
1
8
D3
1/8
1/6
1
D3
1/7
1/5
1
D3
1/7
1/8
1
1. Провести анализ иерархии относительно стоимости, в ходе которого выполнить следующие действия.
1) Оценить согласованность суждений ЛПР.
2) Определить приоритеты элементов каждого уровня иерархии.
3) Определить итоговые приоритеты альтернатив относительно
издержек.
4) Сравнить полученный результат с приведенным в п. 5.3 вектором приоритетов w A .
2. Оформить отчет. Содержание отчета:
1) Индексы и отношение согласованности для матриц сравнения; выводы относительно степени несогласованности суждений.
2) Матрицы приоритетов каждого уровня (показать метод их
получения).
3) Вектор приоритетов альтернатив относительно издержек
(показать метод его получения).
Задание 5.2
Рассмотрим ситуацию, описанную в задании 4.4.
В силу роста потребностей города в воздушных перевозках и
ограниченных возможностей существующего аэропорта по удовлетворению этих потребностей возникла проблема развития аэропор-
150
та путем расширения существующего и/или строительства нового
аэропорта. В ходе специально проведенных исследований было
проанализировано множество различных способов решения проблемы. Экспертная комиссия приняла решение оценивать все
имеющиеся альтернативы по 4 критериям:
— f1 — общие затраты на строительство и эксплуатацию в течение заданного периода времени (млн. д. е.),
— f2 — фактическая пропускная способность (количество взлетно-посадочных операций в час),
— f3 — число людей, которые могут получить серьезные ранения или погибнуть, отнесенное к числу авиакатастроф,
— f4 — число людей, переселяемых при расширении/строительстве аэропорта;
После объединения сходных по природе и отбрасывания заведомо «худших» альтернатив для дальнейшего оценивания оставлено три стратегии. Оценки этих стратегий по критериям f1 — f4
представлены в таблице 5.3.
Таблица 5.3
Альтернатива
х1
х2
х3
f1
340
270
320
Оценки по критериям
f2
f3
210
300
190
450
230
670
f4
25 000
140 000
85 000
1. Используя метод анализа иерархий, оценить качество каждой
альтернативы в целом и определить лучшую из представленных
альтернатив. При построении матриц сравнения ориентироваться на собственные предпочтения. Обязательно выполнить
оценку согласованности суждений (в случае необходимости —
уточнить суждения).
2. Оформить отчет. Содержание отчета:
1) Структуризация задачи в виде иерархии.
2) Матрицы парных сравнений для элементов каждого уровня.
151
3) Расчеты, необходимые для оценки согласованности суждений ЛПР и выводы относительно степени несогласованности.
4) Матрицы приоритетов каждого уровня (показать метод их
получения).
5) Вектор приоритетов альтернатив относительно цели (показать метод его получения) и обоснование выбора лучшей альтернативы.
6. èêàçüíàÖ êÖòÖçàâ
Ç ìëãéÇàüï çÖéèêÖÑÖãÖççéëíà à êàëäÄ.
åÖíéÑõ íÖéêàà àÉê
Реальная практика принятия управленческих решений показывает, что в большинстве случаев адекватное описание проблемы
содержит неопределенности различного типа. Это связано с неполнотой и/или неточностью информации об исследуемой системе.
В данном разделе рассматриваются задачи, содержащие неопределенности двух типов: неопределенность исходной информации
(неопределенность природы), связанная с воздействием на рассматриваемую систему неизвестных исследователю факторов; и
неопределенность действий противника (партнера), когда результаты принятого решения зависят от действий других лиц (партнеров, противников и т. п.), которые нельзя полностью контролировать и нельзя предсказать на момент принятия решения.
В обоих случаях ЛПР должен выбрать одну из нескольких альтернатив (способов действий) А1, А2, … , Аm, каждая из которых в
конечном итоге будет иметь результатом некоторый исход. Оценка
предпочтительности возможных исходов осуществляется с помощью одного критерия f. На момент принятия решения ЛПР не знает
точно, к какому именно исходу приведет любая из выбранных альтернатив.
152
6.1. çÖéèêÖÑÖãÖççéëíà èêéíàÇçàäÄ.
èêàçüíàÖ êÖòÖçàâ Ç ìëãéÇàüï äéçîãàäíÄ
6.1.1. Основные определения
Предположим, что решение принимается в условиях столкновения не менее двух сторон с различными (в частности, противоположными) интересами; каждая сторона для достижения своей цели
имеет возможность действовать различными способами, причем
выбор способа может осуществляться в зависимости от действий
противоборствующей стороны. Такие ситуации называются конфликтными. Математическая модель конфликтной ситуации называется игрой. Заинтересованные стороны (потребители, предприятия, финансовые союзы, индивидуумы) в игре называются
игроками. Если в игре участвуют два противника, то игра называется парной; если число противников более двух, то игра называется множественной.
При формализации конфликтной ситуации несущественные факторы отбрасываются, и ее протекание ограничивается определенными правилами. Правила игры — это система условий, описывающая
• возможные действия каждого из игроков;
• объем информации, которую может получить каждая сторона о действиях другой стороны;
• последовательность чередования «ходов» (отдельных решений, принятых в процессе игры);
• исход игры в результате каждой совокупности ходов противников.
Любое возможное в игре действие игрока называется его стратегией (чистой стратегией). Игра называется конечной, если
множество стратегий каждого игрока конечно, в противном случае
игра называется бесконечной.
Пусть имеется n субъектов (игроков). Обозначим:
Xi — множество стратегий i-го игрока;
x i ∈ X i − возможные стратегии i-го игрока, i = 1, 2, … , n.
153
Если в результате очередного хода игроки выбрали стратегии
х1, х2, … , хn соответственно, то упорядоченный набор (х1, х2, …, хn)
называется ситуацией после этого хода. Сравнение степеней
удовлетворения интересов каждого игрока в различных ситуациях
может осуществляться путем введения отношения предпочтения
данного игрока на множестве ситуаций. Обычно степень удовлетворения интересов i-го игрока характеризуется его функцией выигрыша fi : X 1 × X 2 × … × X n → R , которая каждой ситуации
(х1, х2, …, хn) ставит в соответствие некоторое число, называемое
выигрышем данного игрока в данной ситуации.
Игра (математическая модель конфликта) описывается совокупностью, включающей
• множество игроков,
• множества возможных стратегий игроков,
• множество функций выигрыша игроков.
Оптимальной называется стратегия, которая при многократно
повторяющейся игре обеспечивает игроку максимально возможный средний выигрыш (или, эквивалентно, минимально возможный средний проигрыш). Оптимальность стратегии может пониматься в различных смыслах в зависимости от выбранного
критерия оптимальности. Выбор оптимальной стратегии базируется на предположении, что все игроки «разумны» в одинаковой
степени: поведение каждого из них направлено на максимизацию
своей функции выигрыша (при абстрагировании от просчетов,
азарта и т. п.).
6.1.2. Матричные игры
Рассмотрим конечную парную игру с игроками А и В. Обозначим:
S A = { A1 , A2 , … , Am } − множество всех стратегий игрока А;
S B = { B1 , B2 , … , Bn } − множество всех стратегий игрока В;
fА(Аi, Bj) и fВ(Аi, Bj) — функции выигрышей игроков А и В.
Если f B ( Ai , B j ) =− f A ( Ai , B j ) , i =1, 2 , … , m, j =1, 2 , … , n,
то игра называется антагонистической или игрой с нулевой суммой
154
(интересы игроков противоположны). Антагонистическая игра
полностью определяется совокупностью {S A , S B , f A } .
Обозначим: aij = f A ( Ai , B j ) , i =1, 2, … , m, j =1, 2 , … , n − выигрыши игрока А в ситуации (Аi, Bj). Расположив эти значения в
виде матрицы А размерности m×n, получим матрицу выигрышей
игрока А.
Вj
Аi
А1
А2
…
Аm
B1
B2
…
Bn
a11
a21
…
am1
a12
a22
…
am2
…
…
…
…
a1n
a2n
…
amn
(6.1)
В конечной антагонистической игре матрица выигрышей игрока В однозначно определяется матрицей А, следовательно, игра
может быть охарактеризована только одной матрицей выигрышей.
Поэтому такая игра называется матричной. В этом случае матрица
А называется также матрицей игры или платежной матрицей, а ее
элементы aij — платежами.
Пример 6.1
На каждой из двух торговых баз ассортиментный минимум составляет один и тот же набор из n видов товара. Каждая база поставляет в свой магазин только один из этих видов товара, причем
один и тот же вид товара продается в обоих магазинах по одной и
той же цене. Магазины А и В конкурируют между собой. Магазин
В имеет более выгодное местоположение. Если магазин А завезет с
базы товар i-го вида, отличный от товара j-го вида, завезенного в
магазин В, то товар i-го вида будет пользоваться спросом, и магазин получит прибыль от его реализации в размере ci д. е. Если в
магазины А и В завезены товары одного и того же вида i = j, то магазин А понесет убытки (стоимость транспортировки, хранения и,
возможно, порча товара) в размере di д. е. Формализуем конфликтную ситуацию и построим матрицу игры при n = 3.
155
В качестве игроков А и В выступают магазины А и В.
Игрок А с целью достижения прибыли может выбрать одну из
стратегий:
A1, A2, …, An — завезти со своей базы товар i-го вида, i = 1, 2, …, n;
игрок В обладает стратегиями
B1, B2, …, Bn — завезти со своей базы товар j-го вида, j = 1, 2, …, n.
В ситуации (Аi, Bj) при i ≠ j игрок А получает выигрыш aij = ci;
при i = j игрок А получает выигрыш aij = — di (проигрыш), поэтому
функция выигрыша игрока А имеет вид
⎧сi при i ≠ j,
fA = ⎨
i, j =1, 2 , … , n .
⎩−d i при i = j,
Матрица игры при n = 3:
Вj
Аi
А1
А2
А3
B1
B2
B3
–d1
c2
c3
c1
–d2
c3
c1
c2
–d3
Рассмотрим матричную игру с матрицей (6.1). Поставим задачу
определить оптимальную стратегию игрока А. При выборе стратегии Ai игрок А может получить один из выигрышей ai1, ai2, … , ain в
зависимости от стратегии, выбранной игроком B. Считая, что игрок
В также выбирает оптимальную для себя стратегию, будем предполагать, что он выберет ту стратегию, при которой выигрыш игрока
А минимален. Обозначим:
αi = min aij , i =1, 2, … , m − показатель эффективности стра1≤ j≤n
тегии Ai.
Один из «разумных» способов выбора стратегии игроком А —
выбор стратегии, имеющей максимальный показатель эффективности. Обозначим этот максимальный показатель через α: α= max αi
1≤i≤m
или
α= max min aij .
1≤i≤m 1≤ j≤n
156
(6.2)
Принцип выбора игроком А стратегии в соответствии с (6.2) называется максиминным принципом, а выигрыш α — максимином.
Стратегия Ai0, соответствующая максимину α, называется максиминной стратегией игрока А. Это наиболее осторожная («перестраховочная») стратегия: если игрок А будет следовать этой стратегии, то при любом ходе игрока В игроку А гарантирован
выигрыш не менее α. Максимин α, определенный в соответствии с
(6.2), называется нижней ценой игры в чистых стратегиях.
Аналогичное рассуждение можно провести в отношении игрока
В, который стремится минимизировать выигрыш игрока А, исходя
из посылки, что А играет наилучшим для себя и наихудшим для В
образом. Обозначим:
β j = max aij , j = 1, 2 , … , n − показатель неэффективности стра1≤i≤m
тегии Вj,
β = min β j
1≤ j≤n
или β = min max aij .
(6.3)
1≤ j≤n 1≤i≤m
Критерий выбора стратегии игрока В в соответствии с (6.3) называется минимаксным принципом, а выигрыш β — минимаксом или
верхней ценой игры. Стратегия Вj0, соответствующая минимаксу β,
называется минимаксной стратегией игрока В. Если игрок В будет
придерживаться наиболее острожной минимаксной стратегии, то
при любых действиях игрока А проигрыш В будет не более β.
Для нахождения нижней и верхней цены игры удобно к матрице игры (6.1) дописывать столбец показателей эффективности αi
стратегий Ai и строку показателей неэффективности βj стратегий Вj:
Вj
B1
B2
…
Bn
αi
А1
А2
…
Аm
a11
a21
…
am1
a12
a22
…
am2
…
…
…
…
a1n
a2n
…
amn
α1
α2
βj
β1
β2
Аi
βn
157
(6.4)
αm
α
β
Теорема 6.1
Для элементов матрицы (6.4) имеют место следующие соотношения:
αi ≤ aij ≤ β j , i =1, 2 , … , m, j =1, 2, … , n ,
следовательно, α ≤ β.
Осторожное поведение игроков, выражающееся в выборе соответствующих максиминных и минимаксных стратегий, называется
принципом минимакса, а выбираемые игроками максиминные и
минимаксные стратегии — общим термином «минимаксные стратегии».
Замечание.
Максиминных стратегий игрока А, также как и минимаксных
стратегий игрока В, может быть несколько.
Пример 6.2
Найдем нижнюю и верхнюю цену игры, максиминные стратегии игрока А и минимаксные стратегии игрока В в условиях примера
6.1 при c1 = c3 = 4, c2 = = 1, d1 = 3, d2 = d3 = 2. Матрица игры, полученная в примере 6.1, при заданных значениях параметров имеет вид
Вj
B1
B2
B3
αi
А1
А2
А3
–3
1
4
4
–2
4
4
1
–2
–3
–2
–2
βj
4
4
4
Аi
–2
4
Нижняя цена игры α= max {−3,− 2 ,− 2} =−2 ;
верхняя цена игры β = min {4, 4 , 4} = 4 ;
стратегии А2 и А3 игрока А являются максиминными;
каждая из стратегий игрока В является минимаксной.
В данном случае это означает, что, придерживаясь стратегий А2
или А3, игрок А проиграет не более 2 д. е.; игрок В при выборе любой стратегии проигрывает не более 4 д. е.
158
Важное свойство минимаксных стратегий — их неустойчивость.
Пример 6.3
Вернемся к примеру 6.2. Пусть игрок А придерживается одной
из своих максиминных стратегий, например, А2. Предположим, что
это стало известно игроку В. Тогда В, желая получить наибольший
выигрыш (соответствует наибольшему проигрышу А — минимум по
второй строке), выберет стратегию В2. Ответный выбор игрока А —
одна из стратегий А1 или А3 (максимум по второму столбцу).
Пусть выбрана стратегия А3. Тогда игрок В выбирает стратегию
В3 (отклонившись от своей предыдущей стратегии). В этом случае
игрок А должен выбрать стратегию А1 (также отклонившись от выбранной ранее стратегии).
И т. д.: (A2, B2) → (A3, B2) → (A3, B3) → (A1, B3) → (A1, B1) → …
После первых ходов противников возникает ситуация (A2, B2),
которая устраивает В (получает максимальный выигрыш), но не
устраивает А (получает минимальный выигрыш). После второго
хода А — ситуация (A3, B2), которая устраивает А, но не устраивает
В. И т. д.
Вывод: положение, при котором оба игрока пользуются своими
минимаксными стратегиями, неустойчиво, и может быть нарушено
поступившими сведениями о стратегии противной стороны.
Ситуация (Ai0, Вj0), сложившаяся в результате выбора игроками
А и В стратегий Ai0 и Вj0 соответственно, называется удовлетворительной (приемлемой, допустимой) для игрока А, если aij0 ≤ ai0 j0 ,
i = 1, 2, …, m, и удовлетворительной для игрока В, если ai0 j0 ≤ ai0 j ,
j = 1, 2, …, n.
Теорема 6.2
Ситуация (Ai0, Вj0) будет удовлетворительной для игрока А тогда и только тогда, когда его выигрыш аi0j0 совпадает с показателем
неэффективности βj0 стратегии Вj0 игрока В: ai0 j0 = β j0 (максимум
в j0-м столбце матрицы игры); ситуация (Ai0, Вj0) будет удовлетворительной для игрока В тогда и только тогда, когда его проигрыш
159
аi0 j0 совпадает с показателем эффективности αi0 стратегии Ai0 игрока А: ai0 j0 = αi0 (минимум в i0-й строке матрицы игры).
Ситуация (Ai0, Вj0) называется равновесной или ситуацией равновесия, если она удовлетворительна для каждого из игроков А и В.
Из теоремы 6.2 следует: (Ai0, Вj0) является ситуацией равновесия в
том и только в том случае, когда αi0 = ai0 j0 = β j0 .
Выигрыш аi0j0, соответствующий ситуации равновесия (Ai0, Вj0),
называется седловой точкой матрицы игры. Игра, матрица которой
содержит хотя бы одну седловую точку, называется игрой с седловой точкой.
В примере 6.2:
• удовлетворительными для игрока А являются ситуации (A3,
B1), (A1, B2), (A3, B2) и (A1, B3);
• удовлетворительными для игрока В — ситуации (A1, B1),
(A2, B2) и (A3, B3);
• не существует ситуации, удовлетворительной для обоих игроков, следовательно, не существует равновесной ситуации.
Поэтому данная игра является игрой без седловых точек.
Матрица игры может обладать несколькими седловыми точками. Например, платежная матрица, представленная ниже, имеет 6
седловых точек. Соответствующие им платежи обозначены кружками.
Вj
B1
B2
B3
B4
B5
B6
αi
А1
2
3
2
6
2
4
2
А2
1
2
0
0
1
1
0
А3
2
6
2
3
2
7
2
А4
0
5
1
7
1
4
0
βj
2
6
2
7
2
7
Аi
160
2
2
Свойства седловых точек.
Теорема 6.3 (свойство равнозначности седловых точек).
Если аi1j1 и аi2j2, i1 ,i2 ∈ {1, 2 , … , m} , j1 , j2 ∈ {1, 2 , … , n} , − седловые точки, то аi1j1 = аi2j2.
Теорема 6.4 (свойство взаимозаменяемости седловых точек).
Если аi1j1 и аi2j2, i1 ,i2 ∈ {1, 2 , … , m} , j1 , j2 ∈ {1, 2 , … , n} , − седловые точки, то аi1j2 и аi2j1 — также седловые точки.
Теорема 6.5
Для существования у матрицы игры седловой точки необходимо и
достаточно, чтобы нижняя цена игры равнялась ее верхней цене:
α = β.
(6.5)
Если выполнено условие (6.5), то значение γ = α = β называется
ценой игры в чистых стратегиях (или просто ценой игры). Стратегии Ai0 и Вj0 соответственно игроков А и В, создающие равновесную ситуацию (Ai0, Вj0) (соответствующие седловой точке аi0j0), называются оптимальными, а их совокупность — решением игры.
Решение игры характеризуется свойством: ни одному из игроков, придерживающихся своей оптимальной стратегии, невыгодно
от нее отклоняться.
Цена игры в чистых стратегиях γ (если она существует) — это
• значение выигрыша игрока А, которое он не может увеличить,
если игрок В придерживается своей оптимальной стратегии; и
• значение проигрыша игрока В, которое он не может уменьшить, если игрок А придерживается своей оптимальной стратегии.
Пример 6.4
Финансовые компании А и В конкурируют между собой. Компания В ведет переговоры с организаторами трех инвестиционных
проектов B1, B2, B3 на предмет инвестирования. Компания А ставит своей задачей срыв переговоров, чтобы занять место компании В в инвестировании. Для достижения этой цели она может
применить одно из двух средств: А1 — предложить организаторам
проектов более выгодные для них условия инвестирования; А2 —
161
предоставить организаторам проектов материалы, компрометирующие компанию В. Действие А1 приводит к отрицательному
результату переговоров с организаторами проектов B1, B2, B3 с
вероятностями 0,7; 0,5 и 0,3 соответственно; действие А2 — с вероятностями 0,6; 0,9 и 0,4.
Формализуем эту конфликтную ситуацию.
Рассматриваемая ситуация является антагонистической. Игрок
А имеет две чистые стратегии: А1 и А2; игрок В — стратегии B1, B2,
B3 (выбор одного из трех проектов). Выигрыш игрока А — вероятность отрицательного результата переговоров компании В. Матрица игры имеет вид
Вj
B1
B2
B3
αi
А1
А2
0,7
0,6
0,5
0,9
0,3
0,4
0,3
0,4
βj
0,7
0,9
0,4
Аi
0,4
0,4
Нижняя и верхняя цена игры совпадают: α = β = 0,4. Это значение — цена игры в чистых стратегиях (седловая точка игры).
Ситуация (A2, B3) является равновесной.
Оптимальные стратегии: для игрока А — стратегия А2;
для игрока В — стратегия B3.
Соотношение между множествами минимаксных и оптимальных стратегий:
• каждая оптимальная стратегия игрока А является его максиминной стратегией; каждая оптимальная стратегия игрока
В является его минимаксной стратегией;
• в игре без седловых точек ни одна из максиминных и минимаксных стратегий не является оптимальной (в такой игре
вообще нет оптимальных стратегий);
• в игре с седловыми точками каждая максиминная и каждая
минимаксная стратегия является оптимальной.
162
Смешанные стратегии
Среди конечных игр, моделирующих практические конфликты,
сравнительно редко встречаются игры с седловой точкой; более
типичным является случай α < β. При многократном повторении
игры каждый из игроков с одной стороны, получает информацию о
предыдущих ходах противника, а с другой, хочет скрыть от противника свои намерения. Выходом является образ действий, не
сводящийся к выбору единственной чистой стратегии; цель — увеличение гарантированного среднего выигрыша (увеличение α и
уменьшение β). Фактически, речь идет о разделе разности β — α
между игроками с максимальной пользой для каждого из них.
Комбинированная стратегия игрока, состоящая в применении
нескольких чистых стратегий, чередующихся по случайному закону, называется смешанной стратегией. Смешанная стратегия игрока представляет собой дискретную случайную величину, возможными значениями которой являются номера его чистых
стратегий. Смешанная стратегия может быть задана законом распределения для игрока А
1
…
i
…
m
p1
…
pi
…
pm
где pi — вероятность применения игроком А чистой стратегии с
номером i, p1 + p2 + … + pm = 1;
для игрока В
1
…
j
…
n
q1
…
qj
…
qn
где qj — вероятность применения игроком B чистой стратегии с
номером j, q1 + q2 + … + qn = 1.
Если чистые стратегии игроков известны, то смешанную стратегию Р игрока А можно отождествить с m-мерным вектором
163
(р1, р2, …, рm), а смешанную стратегию Q игрока B — с n-мерным
вектором (q1, q2, …, qn).
Если игроки А и В независимо друг от друга выбрали смешанные стратегии Р = (р1, р2, …, рm) и Q = (q1, q2, …, qn), то упорядоченная пара (Р, Q) называется ситуацией в смешанных стратегиях.
Замечание.
• Каждую чистую стратегию Ai, i = 1, 2, …, m, игрока А можно
рассматривать как смешанную стратегию, в которой чистая
стратегия Ai выбирается с вероятностью 1, а все остальные чистые стратегии — с вероятностью 0: Ai = (0, … , 0, 1, 0, … , 0).
i –1
i
i +1
• Каждую смешанную стратегию можно представить в виде
линейной комбинации чистых стратегий с коэффициентами
pi:
m
P = ( p1 , p2 , … , pm ) = ∑ pi Ai .
i=1
Если игрок придерживается некоторой смешанной стратегии,
то для определения конкретной чистой стратегии в разыгрываемой
партии перед ее началом запускается какой-либо механизм случайного выбора, соответствующий данной смешанной стратегии. На⎛1 3 2⎞
пример: пусть P =⎜ , , ⎟− смешанная стратегия игрока А. Для
⎝6 6 6⎠
выбора одной из чистых стратегий А1, А2 или А3 можно воспользоваться компьютерной программой, выдающей с вероятностями 1/6,
3/6 и 2/6 соответственно числа 1, 2 или 3 (или с равными вероятностями один из элементов набора {1, 2, 2, 2, 3, 3} ).
В ситуации (Р, Q) в смешанных стратегиях чистые стратегии Ai
и Вj выбираются независимо друг от друга с вероятностями рi и qj
соответственно, поэтому вероятность совместного выбора чистых
стратегий (Ai, Вj) равна рi·qj. В ситуации (Ai, Вj) в чистых стратегиях
игрок А получает выигрыш aij. Следовательно, в ситуации (Р, Q) в
смешанных стратегиях выигрыш игрока А — дискретная случайная
величина, принимающая значения aij с вероятностями рi·qj. Средний
выигрыш игрока А в ситуации (Р, Q) в смешанных стратегиях —
164
математическое ожидание этой случайной величины, равное
m
n
∑∑ p a q .
i ij
j
i=1 j=1
Обозначим множество смешанных стратегий игрока А через
SА*, множество смешанных стратегий игрока В через SВ*. Очевидно, что множества SА* и SВ* бесконечны.
Функцией выигрыша игрока А в смешанных стратегиях называется функция hA : S *A × S *B → R , определяемая правилом
m
n
hA ( P,Q ) = ∑∑ pi aij q j ,
( P, Q ) ∈ S *A × S *B .
(6.6)
i=1 j=1
Совокупность {S *A , S *B , hA } называется смешанным расширением игры {S A , S B , f A } в чистых стратегиях.
Функция hA может быть записана в матричной форме:
hA ( P, Q ) = P ⋅ A⋅QT ,
(6.6')
где Р = (р1, р2, …, рm),
QТ = (q1, q2, …, qn)Т,
А — матрица выигрышей игрока А в чистых стратегиях.
Теорема 6.6
Для каждой смешанной (в частности, чистой) стратегии P ∈ S *A
игрока А существует (и достигается)
α ( P, S *B ) = min* hA ( P, Q ) .
Q∈ S B
(6.7)
Для каждой смешанной (в частности, чистой) стратегии Q ∈ S *B
игрока В существует (и достигается)
β (Q, S *A ) = max* hA ( P, Q ) .
P∈ S A
(6.8)
Величина α(Р, SВ*), определяемая равенством (6.7), называется
показателем эффективности смешанной стратегии Р игрока А
относительно множества смешанных стратегий SВ* игрока В.
165
Величина β(Q, SA*), определяемая равенством (6.8), называется
показателем неэффективности смешанной стратегии Q игрока В
относительно множества смешанных стратегий SА* игрока А.
В частности: при Р = Аi, α(Р, SВ*) = αi;
при Q = Bj, β(Q, SA*) = βj.
Если в приведенных выше определениях и равенствах (6.7) и
(6.8) заменить множества смешанных стратегий SA* и SВ* на множества чистых стратегий SА и SВ, то получим определения показателя эффективности смешанной стратегии Р игрока А относительно множества чистых стратегий SВ игрока В и показателя
неэффективности смешанной стратегии Q игрока В относительно множества чистых стратегий SА игрока А.
Теорема 6.7
Показатели эффективности любой смешанной (в частности,
чистой) стратегии Р игрока А относительно множеств SВ и SВ* чистых и смешанных стратегий игрока В равны: α ( P, S B ) = α ( P, S *B ) .
Показатели неэффективности любой смешанной (в частности,
чистой) стратегии Q игрока B относительно множеств SA и SА* чистых и смешанных стратегий игрока A равны: β (Q, S A ) = β (Q, S *A ) .
Из теоремы 6.7 следует, что нет необходимости в уточнении,
относительно какого множества (чистых или смешанных стратегий) определяются показатели эффективности стратегий игрока А и
неэффективности стратегий игрока В. Поэтому в дальнейшем будем использовать обозначения α(Р) и β(Q).
Нижней ценой (или максимином) матричной игры в смешанных
стратегиях называется величина
V = max* α ( P ) = max* min* hA ( P, Q ) .
P∈ S A
P ∈ S A Q∈ S B
(6.9)
Верхней ценой (или минимаксом) матричной игры в смешанных
стратегиях называется величина
V = min* β (Q ) = min* max* hA ( P,Q ) .
Q∈ S B
Q∈S B P∈ S A
(6.10)
В силу бесконечности множеств SА* и SВ* возникает вопрос о
существовании нижней и верхней цены игры в смешанных стратегиях (о достижимости максимума в (6.9) и минимума в (6.10)).
166
Теорема 6.8
Для любой конечной матричной игры существуют нижняя и
верхняя цены игры в смешанных стратегиях.
Теорема 6.9
Нижняя цена игры α и верхняя цена игры β в чистых стратегиях, нижняя цена игры V и верхняя цена игры V в смешанных стратегиях удовлетворяют неравенствам:
α≤ V ≤ V ≤ β .
(6.11)
Пример 6.5
Рассмотрим игру с платежной матрицей
Вj
Аi
А1
А2
B1
B2
B3
0
1
1/2
3/4
5/6
1/2
Найдем верхнюю и нижнюю цену игры в чистых стратегиях.
Вj
B1
B2
B3
αi
А1
А2
0
1
1/2
3/4
5/6
1/2
0
1/2
βj
1
3/4
5/6
Аi
1/2
5/6
Получим: α = 1/2, β = 5/6.
Рассмотрим смешанные стратегии Р0 = (3/8, 5/8) и Q0 = (1/4, 0, 3/4).
Определим hA ( P 0 , Q 0 ) , hA ( P 0 , B1 ) , hA ( P 0 , B2 ) , hA ( P 0 , B3 ) .
По формуле (6.6)
2
3
hA ( P 0 , Q 0 ) = ∑∑ pi0 aij q 0j =
i=1 j=1
3
1 3 1
3 5 3 5
1 5 3
5 1 3
5
= ⋅0⋅ + ⋅ ⋅0 + ⋅ ⋅ + ⋅1⋅ + ⋅ ⋅0 + ⋅ ⋅ = .
8
4 8 2
8 6 4 8
4 8 4
8 2 4
8
167
Эти же вычисления могут быть записаны в матричной форме
(формула (6.6') ):
T
hA ( P 0 , Q 0 ) = P 0 ⋅ A⋅(Q 0 ) =
⎛3
=⎜
⎝8
⎛
0
5 ⎞⎜
⎟⋅⎜
8 ⎠⎜
⎜1
⎝
1
2
3
4
⎛1⎞
5 ⎞⎜ ⎟
⎟ 4
6 ⎟⎜ ⎟ ⎛ 5
⋅⎜ 0 ⎟ = ⎜
1 ⎟⎜ ⎟ ⎝ 8
⎟ 3
2 ⎠⎜ ⎟
⎝4⎠
2
⎛1⎞
⎜ ⎟
4
5⎞⎜ ⎟ 5
⎟⋅⎜ 0 ⎟ = .
8⎠⎜ ⎟ 8
⎜3⎟
⎝4⎠
21
32
3
8
5
8
В1 = (1, 0, 0), поэтому hA ( P 0 , B1 ) = ∑ pi0 ai1 = ⋅0 + ⋅1 =
i=1
5
.
8
2
3 1 5 3
21
В2 = (0, 1, 0), поэтому hA ( P 0 , B2 ) = ∑ pi0 ai 2 = ⋅ + ⋅ =
.
8
2
8
4
32
i=1
2
3 5
8 6
5 1
5
= .
8 2
8
В3 = (0, 0, 1), поэтому hA ( P 0 , B3 ) = ∑ pi0 ai 3 = ⋅ + ⋅
i=1
Показатель эффективности стратегии Р0 равен
α ( P 0 ) = α ( P 0 , S *B ) = α ( P 0 , S B ) = min hA ( P 0 , B j ) =
1≤ j≤3
⎧ 5 21 5⎫
5
= min ⎨ ,
, ⎬= .
⎩8 32 8 ⎭
8
Определим hA ( A1 , Q 0 ) , hA ( A2 , Q 0 ) .
3
1
4
1
2
5 3
6 4
5
.
8
1
4
3
4
1 3
2 4
5
.
8
А1 = (1, 0), поэтому hA ( A1 , Q 0 ) = ∑ a1 j q 0j = 0⋅ + ⋅0 + ⋅ =
j=1
3
А2 = (0, 1), поэтому hA ( A2 , Q 0 ) = ∑ a2 j q 0j = 1⋅ + ⋅0 + ⋅ =
j=1
Показатель неэффективности стратегии Q0 равен
β (Q 0 ) = β (Q 0 , S *A ) = β (Q 0 , S A ) = max hA (Q 0 , Ai ) =
1≤i≤2
⎧ 5 5⎫
5
= max ⎨ , ⎬ = .
⎩8 8⎭
8
168
Найдем нижнюю и верхнюю цену игры в смешанных стратегиях.
5
5
V = max* α ( P ) ≥ α ( P 0 ) = ;
V = min* β (Q ) ≤ β (Q 0 ) = ;
P∈ S A
Q∈ S B
8
8
5
по тереме 6.9 V ≤ V , поэтому V = V = .
8
Если нижняя и верхняя цена игры в смешанных стратегиях совпадают, то их общее значение V = V = V называется ценой игры в
смешанных стратегиях, а стратегии Р0 и Q0, для которых
V = α ( P 0 ) = β (Q 0 )
называются оптимальными смешанными
стратегиями соответственно игроков А и В.
Из теремы 6.9 следует, что α≤ V ≤ β .
Совокупность пары оптимальных стратегий (Р0, Q0) и соответствующей цены игры V называется решением игры в смешанных
стратегиях.
Теорема 6.10 фон Неймана (основная теорема теории матричных
игр)
Любая матричная игра имеет решение в смешанных стратегиях,
т. е. существуют цена игры V в смешанных стратегиях и оптимальные смешанные стратегии Р0 и Q0 игроков А и В соответственно.
Пример 6.6
Рассмотрим платежную матрицу и смешанные стратегии Р0 и
0
Q из примера 6.5. В примере 6.5 было показано, что
V =V =
5
= α ( P 0 ) = β (Q 0 ) ,
8
поэтому
• цена игры в смешанных стратегиях V = 5/8;
0
0
• Р и Q — оптимальные стратегии игроков А и В.
При этом цена игры в чистых стратегиях не существует:
α = 1/2 ≠ β = 5/6.
Замечание.
Если существует цена игры в чистых стратегиях γ = α = β, то из
неравенства α≤ V ≤ β следует, что γ совпадает с ценой игры в
смешанных стратегиях (которая, по теореме фон Неймана, сущест169
вует всегда): γ = V. Поэтому вместо «цена игры в смешанных стратегиях» говорят просто «цена игры».
Теорема 6.11
Для того, чтобы стратегия Р0 игрока А была оптимальной, необходимо и достаточно, чтобы для любого Q ∈ S *B выполнялось
неравенство
hA ( P 0 ,Q ) ≥ V .
(6.12)
0
Для того, чтобы стратегия Q игрока В была оптимальной, необходимо и достаточно, чтобы для любого P ∈ S *A выполнялось
неравенство
hA ( P, Q 0 ) ≤ V .
(6.13)
Неравенство (6.12) означает, что выбор игроком А оптимальной
стратегии Р0 гарантирует ему выигрыш, не меньший цены игры V,
при любой стратегии Q игрока В. Неравенство (6.13) означает, что
выбор игроком В оптимальной стратегии Q0 гарантирует ему проигрыш, не больший цены игры V, при любой стратегии Р игрока А.
Теорема 6.12
Для того, чтобы V было ценой игры, а Р0 и Q0 — оптимальными
стратегиями соответственно игроков А и В, необходимо и достаточно, чтобы для любых i = 1, 2, …, m, j = 1, 2, …, n выполнялось
неравенство
hA ( Ai , Q 0 ) ≤ V ≤ hA ( P 0 , B j ) .
Пример 6.7
Рассмотрим платежную матрицу и смешанные стратегии Р0 и
0
Q из примера 6.5. Пусть заранее неизвестно, что цена игры равна
V = 5/8, а Р0 и Q0 — оптимальные стратегии игроков А и В.
В примере 6.5 было найдено
5
21
5
hA ( P 0 , B1 ) = , hA ( P 0 , B2 ) =
, hA ( P 0 , B3 ) = ,
8
32
8
5
hA ( A1 , Q 0 ) = hA ( A2 , Q 0 ) = .
8
170
5
≤ hA ( P 0 , B j ) , i =1, 2, j =1, 2 , 3 ,
8
поэтому по достаточной части теоремы 6.12 цена игры равна V = 5/8,
а Р0 и Q0 — оптимальные стратегии игроков А и В.
В общем случае не все чистые стратегии игрока входят в его
оптимальную смешанную стратегию с положительными вероятностями. Чистые стратегии, входящие в оптимальную смешанную
стратегию игрока с положительными вероятностями, называются
его активными стратегиями.
Теорема 6.13
Для любой активной стратегии Ak , k ∈ {1, 2 , … , m} игрока А
Ясно, что hA ( Ai , Q 0 ) ≤
выполняется равенство hA ( Ak , Q 0 ) = V .
Для любой активной стратегии Bl , l ∈ {1, 2, … , n} игрока В
выполняется равенство hA ( P 0 , Bl ) = V .
Из теоремы 6.13 следует, что если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры V, независимо от действий
другого игрока, если только этот игрок придерживается любой своей чистой активной стратегии.
Пример 6.8
Рассмотрим платежную матрицу и смешанные стратегии Р0 и
Q0 из примера 6.5. В примере 6.6 показано, что цена игры равна V =
5/8, а Р0 = (3/8, 5/8) и Q0 = (1/4, 0, 3/4) — оптимальные стратегии
игроков А и В. Отсюда следует, что чистые стратегии А1 и А2 являются активными стратегиями игрока А, а чистые стратегии В1 и В3 —
активными стратегиями игрока В.
В соответствии с теоремой 6.13
5
hA ( A1 , Q 0 ) = hA ( A2 , Q 0 ) = V = ,
8
5
hA ( P 0 , B1 ) = hA ( P 0 , B3 ) = V = .
8
171
В примере 6.5 это было подтверждено прямыми вычислениями.
При этом ни одна из активных стратегий не является оптимальной:
α(A1) = 0 < V; α(A2) = 1/2 < V;
β(В1) = 1 > V ; β(В3) = 5/6 > V.
Аффинные преобразования игр
Аффинное преобразование игры представляет собой аффинное
преобразование матрицы игры А в матрицу А', т. е. преобразование
элементов матрицы А по следующему правилу:
aij → a'ij = λ·aij + μ, i = 1, 2, …, m, j = 1, 2, …, n,
(6.14)
где λ > 0 и μ — действительные числа.
Теорема 6.14
При аффинном преобразовании (6.14) справедливы следующие
утверждения:
1. Если hA и h'A — функции выигрышей игрока А для игр с матрицами А и А', то h'A(P, Q) = λ·hA(P, Q) + μ, P ∈ S *A , Q ∈ S *B .
2. Для показателей эффективности смешанных стратегий P ∈ S *A
и показателей неэффективности смешанных стратегий Q ∈ S *B
имеют место равенства
α′( P ) = λα ( P ) + μ, P ∈ S *A ,
β′(Q ) = λβ (Q ) + μ, Q ∈ S *B .
3. Образы и прообразы оптимальных стратегий являются оптимальными.
4. Если V и V' — цены игр с матрицами соответственно А и А', то
V' = λ·V + μ.
Теорема 6.14 показывает, что с помощью аффинного преобразования в игре можно изменить масштаб измерения выигрышей.
Если матрица игры содержит дробные элементы, то преобразованием (6.14) ее можно привести к матрице с целыми элементами,
положив λ равным общему знаменателю дробных элементов, μ = 0;
если матрица игры содержит неположительные элементы, то преобразованием (6.14) ее можно привести к матрице с положительными элементами, положив λ = 1, μ > max{ |aij| : aij < 0}.
172
6.1.3. Сведение матричных игр
к задачам линейного программирования
Между матричными играми и линейным программированием
существует связь:
• решение любой матричной игры можно свести к решению
пары двойственных задач ЛП специального вида;
• любая задача ЛП, имеющая решение, может быть сведена к
матричной игре специального вида.
Теорема 6.15
Решение матричной игры m×n с матрицей А, элементы которой
положительны, эквивалентно решению следующей пары двойственных задач ЛП:
m
∑x
→ min
i
(6.15)
i=1
при ограничениях
m
∑ a x ≥1 ,
ij i
j =1, 2, … , n ,
i=1
(6.16)
i =1, 2 , … , m ;
xi ≥ 0 ,
и
n
∑y
j
→ max
(6.17)
j=1
при ограничениях
n
∑ a y ≤1 ,
ij
j
i =1, 2 , … , m ,
j=1
yj ≥0,
А именно:
если
x 0 = ( x10 , x20 , … , xm0 ) −
(6.18)
j =1, 2, … , n .
оптимальное решение задачи (6.15)-(6.16),
173
y 0 = ( y10 , y20 , … , yn0 ) −
оптимальное решение задачи (6.17)-(6.18),
то
−1
⎛ m 0 ⎞−1 ⎛ n 0 ⎞
⎟
V = ⎜ ∑ xi ⎟ = ⎜
⎜ ∑ y j ⎟ − цена игры с матрицей А;
⎝ i=1 ⎠
⎝ j=1 ⎠
P 0 = Vx 0 −
0
0
Q = Vy −
Обратно:
если
оптимальная стратегия игрока А;
оптимальная стратегия игрока В.
Р0 = (р01, р02, …, р0m) и Q0 = (q01, q02, …, q0n) —
оптимальные стратегии соответственно игроков А и В,
V — цена игры,
то
1
x 0 = P 0 − оптимальное решение задачи (6.15)-(6.16),
V
1
y 0 = Q 0 − оптимальное решение задачи (6.17)-(6.18).
V
Замечание.
Предположение о положительности элементов платежной матрицы не умаляет общности рассуждений, т. к. матрица с любыми
элементами может быть приведена к матрице с положительными
элементами с помощью аффинного преобразования (6.14) с λ = 1.
При этом оптимальные стратегии не изменятся, а цена игры увеличится на μ.
Пример 6.9
Рассмотрим ситуацию, описанную в примере 6.1: на каждой из
двух торговых баз ассортиментный минимум составляет один и тот
же набор из n видов товара. Каждая база поставляет в свой магазин
только один из этих видов товара, причем один и тот же вид товара
продается в обоих магазинах по одной и той же цене. Магазины А и
В конкурируют между собой. Если магазин А завезет с базы товар
i-го вида, отличный от товара j-го вида, завезенного в магазин В, то
товар i-го вида будет пользоваться спросом, и магазин получит
174
прибыль от его реализации в размере ci д. е. Если в магазины А и В
завезены товары одного и того же вида i = j, то магазин А понесет
убытки (стоимость транспортировки, хранения и, возможно, порча
товара) в размере di д. е.
В примере 6.1 эта конфликтная ситуация была формализована в
виде матричной игры; матрица игры при n = 3 имеет вид
Вj
Аi
А1
А2
А3
B1
B2
B3
–d1
c2
c3
c1
–d2
c3
c1
c2
–d3
Пусть c1 =1, c2 = 3, c3 = 2, d1 = d2 = 2, d3 = 1. Тогда
⎛−2 1
1⎞
⎜
⎟
A = ⎜ 3 −2 3 ⎟.
⎜
⎟
2 −1⎠
⎝ 2
Среди элементов платежной матрицы есть отрицательные, поэтому преобразуем ее с помощью аффинного преобразования
a'ij = aij + 3, i, j = 1, 2, 3.
⎛ 1 4 4⎞
⎜
⎟
Преобразованная платежная матрица имеет вид A′ = ⎜ 6 1 6⎟.
⎜
⎟
⎝ 5 5 2⎠
Решение игры с матрицей А' равносильно решению пары двойственных задач ЛП:
1) найти минимум f(x1, x2, x3) = x1 + x2 + x3
при ограничениях
⎧ x1 + 6 x2 + 5 x3 ≥1,
⎪
⎪4 x1 + x2 + 5 x3 ≥1,
⎨
⎪4 x1 + 6 x2 + 2 x3 ≥1,
⎪
⎩x ≥ 0, x ≥ 0, x ≥ 0 ;
1
2
175
3
2) найти максимум φ(у1, у2, у3) = у1 + у2 + у3
при ограничениях
⎧ y1 + 4 y2 + 4 y3 ≤1,
⎪
⎪6 y1 + y2 + 6 y3 ≤1,
⎨
⎪5 y1 + 5 y2 + 2 y3 ≤1,
⎪
⎩ y1 ≥ 0 , y2 ≥ 0 , y3 ≥ 0 .
Задача 1) может быть приведена к каноническому виду и решена симплекс-методом. Оптимальное решение имеет вид
5
1
5
5
1
5
13
x10 =
, x20 = , x30 = ;
f min =
+ +
= .
48
16
48
48 16 48 48
Тогда
⎛ 3
⎞−1
48
−1
цена игры с матрицей А' равна V ′ = ⎜ ∑ xi0 ⎟ = ( f min ) =
,
13
⎝ i=1 ⎠
оптимальная стратегия игрока А имеет вид
⎛5 3 5⎞
P′0 = V ′x 0 = (V ′x10 , V ′x20 , V ′x30 ) = ⎜ ,
, ⎟.
⎝13 13 13 ⎠
Для игры с матрицей А:
48
9
V = V ′− 3 =
−3 = ,
13
13
⎛5 3 5⎞
оптимальная стратегия игрока А та же — P 0 = ⎜ ,
, ⎟.
⎝13 13 13 ⎠
Для нахождения оптимальной стратегии игрока В можно, например, решить двойственную задачу 2). Результат имеет вид
⎛ 4 6 17 ⎞
Q 0 = Vy 0 = ⎜ ,
,
⎟.
⎝ 39 13 39 ⎠
Интерпретация полученных результатов:
• если магазин А будет завозить товары, выбирая случайным
образом товар первого, второго и третьего видов с вероятно⎛5 3 5⎞
стями P 0 = ⎜ ,
, ⎟ соответственно, то ему гарантиро⎝13 13 13 ⎠
176
вана средняя прибыль не менее 9/13 д. е. при любой системе
завоза товаров в магазин В;
• магазину В невыгодно отклоняться от своей оптимальной
стратегии, которая состоит в завозе тех же товаров с вероят⎛ 4 6 17 ⎞
ностями Q 0 = ⎜ ,
,
⎟; при этом ему гарантирован
⎝ 39 13 39 ⎠
убыток не более 9/13 д. е. при любой системе завоза товаров
в магазин А.
В этом примере все чистые стратегии каждого из игроков активны. Такая игра называется полностью усредненной.
6.2. àÉêõ ë èêàêéÑéâ
6.2.1. Основные понятия
В рассмотренных в п. 6.1 антагонистических играх неопределенность, связанная с тем, что ни один из игроков не обладал информацией о действиях противника, отчасти «компенсировалась»
предположением об осознанных действиях противоположной стороны. В то же время в задачах принятия управленческих решений
часто присутствует неопределенность, не связанная с сознательным противодействием: недостаточная информированность ЛПР
об объективных условиях, в которых будет приниматься решение.
Возможными причинами неопределенности этого типа могут являться нестабильность экономической ситуации, рыночная конъюнктура, выход из строя технического оборудования и т. д. В таких
задачах выбор зависит от объективной действительности, которая в
математической модели называется природой. Сама математическая модель подобных ситуаций называется игрой с природой.
В игре с природой осознанно действует только один игрок (ЛПР),
будем обозначать его А. Природа (П) — второй игрок, но не противник А (безразлична к результату игры и не оказывает систематического противодействия).
Предположим, что игрок А имеет m возможных стратегий A1,
A2, … , Am; природа может находиться в одном из n возможных со177
стояний П1, П2,… , Пn, которые условно рассматриваются как ее
«стратегии». Совокупность {П1, П2, …, Пn} обычно формируется на
основе имеющегося опыта анализа состояний природы или в результате предположений и интуиции экспертов.
Выигрыш игрока А при выбранной им стратегии Ai, i = 1, 2, … ,
m, и состоянии природы Пj, j = 1, 2, … , n, будем обозначать aij. Так
же как в матричной игре, можно сформировать матрицу выигрышей игрока А (матрицу игры, платежную матрицу). Отличие от
матрицы антагонистической игры состоит в том, что элементы платежной матрицы не являются проигрышами природы.
Пj
Аi
А1
А2
…
Аm
П1
П2
…
Пn
a11
a21
…
am1
a12
a22
…
am2
…
…
…
…
a1n
a2n
…
amn
(6.19)
Если у игрока А существует стратегия, доминирующая все остальные его стратегии, то эта доминирующая стратегия и должна
быть выбрана в качестве предпочтительной: выигрыш А в случае
выбора этой стратегии при любом состоянии природы не меньше
его выигрыша при выборе любой другой стратегии. Например, если платежная матрица имеет вид
Пj
Аi
А1
А2
А3
П1
П2
П3
П4
2
4
3
1
6
5
3
3
2
4
5
1
то должна быть выбрана стратегия А2.
При наличии у игрока А доминируемых или дублирующих
стратегий соответствующие строки платежной матрицы могут быть
удалены, и, тем самым, уменьшена размерность матрицы.
178
Пример 6.10
В платежной матрице
Пj
Аi
А1
А2
А3
А4
А5
А6
П1
П2
П3
П4
П5
2
9
2
4
9
4
6
4
3
8
4
7
4
5
1
3
5
4
3
1
4
0
1
8
2
3
2
1
3
2
стратегия А6 доминирует А1 и А3; стратегия А5 дублирует А2, поэтому матрица может быть преобразована к виду
Пj
Аi
А2
А4
А6
П1
П2
П3
П4
П5
9
4
4
4
8
7
5
3
4
1
0
8
3
1
2
Следует заметить, что принцип доминирования не может распространяться на состояния природы (для природы нет более эффективных или менее эффективных состояний).
Выбор возможной стратегии игрока А в игре с природой должен производиться с учетом не только значений выигрышей, но и
показателей «удачности»/«неудачности» выбора данной стратегии
при данном состоянии природы и благоприятности этого состояния
для увеличения выигрыша.
Показателем благоприятности состояния Пj природы для увеличения выигрыша называется наибольший выигрыш игрока А при
этом состоянии:
β j = max aij , j =1, 2, … , n .
(6.20)
1≤i≤m
В антагонистической матричной игре эта величина представляла собой показатель неэффективности стратегии Вj игрока В.
179
Для характеристики степени удачности применения игроком А
данной стратегии при данном состоянии природы вводится понятие риска.
Риском rij игрока А при выборе им стратегии Аi в условиях состояния Пj природы называется разность между показателем благоприятности βj состояния природы Пj и выигрышем αij:
rij = β j − aij , i =1, 2, … , m, j =1, 2, … , n .
(6.21)
Это разность между выигрышем, который игрок А получил бы,
если бы знал заранее, что природа примет состояние Пj, и выигрышем, который он получит при этом же состоянии природы, выбрав
стратегию Аi («упущенный выигрыш»). Величину риска можно интерпретировать как своего рода плату за отсутствие информации о
состояниях природы. Если aij = βj, т. е. rij = 0, то стратегия Аi при
состоянии Пj природы является безрисковой.
Матрица выигрышей А однозначно порождает матрицу рисков RA:
Пj
Аi
А1
А2
…
Аm
RA =
П1
П2
…
Пn
r11
r21
…
rm1
r12
r22
…
rm2
…
…
…
…
r1n
r2n
…
rmn
(6.22)
где риски rij определяются в соответствии с (6.21).
Пример 6.11
Рассмотрим платежную матрицу из примера 6.10, полученную
после исключения доминируемых и дублирующих стратегий. Для
удобства добавим строку показателей благоприятности состояний
природы.
Пj
Аi
А2
А4
А6
βj
П1
П2
П3
П4
П5
9
4
4
9
4
8
7
8
5
3
4
5
1
0
8
8
3
1
2
3
180
Матрица рисков имеет вид
Пj
Аi
RA =
А2
А4
А6
П1
П2
П3
П4
П5
0
5
5
4
0
1
0
2
1
7
8
0
0
2
1
Матрица рисков проясняет некоторые нюансы игры с природой. Так, если в примере 6.11 игрок А выбрал стратегию А6, то при
состояниях природы П1 и П3 он получит одинаковые выигрыши
а61 = а63 = 4. Но эти выигрыши не являются равноценными в смысле рисков: выбор стратегии А6 по отношению к состоянию природы
П3 более удачен, чем по отношению к состоянию П1 (приводит к
меньшим потерям по отношению к максимуму выигрыша при данном состоянии природы).
В теории игр с природой рассматривается две ситуации.
1. Известны вероятности, с которыми природа принимает каждое
из своих возможных состояний, либо могут быть получены
оценки этих вероятностей (на основе имеющихся статистических данных или экспертных оценок). В этом случае говорят о
принятии решения в условиях риска (в условиях стохастической неопределенности).
2. Вероятности возможных состояний природы неизвестны, и нет
никакой возможности получить о них какую-либо информацию. В этом случае говорят о принятии решения в условиях неопределенности (неопределенность природы).
6.2.2. Принятие решений в условиях риска
Пусть в игре с природой игрок А имеет m возможных стратегий
A1, A2, …, Am, природа может находиться в одном из n возможных
состояний П1, П2, … , Пn, а матрица выигрышей игрока А определяется (6.19).
Критерий Байеса выбора оптимальной стратегии «относительно выигрышей»
181
Предположим, что из имеющегося опыта известны не только
возможные состояния природы П1, П2, … , Пn, но и вероятности р1,
р2, …, рn, с которыми природа принимает каждое из этих состояний.
Показателем эффективности стратегии Аi по критерию Байеса относительно выигрышей называется среднее значение (математическое ожидание) выигрыша при применении этой стратегии с
учетом всех возможных состояний природы:
n
ai =∑ p j aij , i =1, 2, … , m .
(6.23)
j=1
Величина ai представляет собой средневзвешенное значение элементов i-й строки матрицы выигрышей с весами р1, р2, … , рn.
Критерий Байеса относительно выигрышей:
оптимальной среди чистых стратегий считается стратегия Ai0 с
максимальным показателем эффективности (6.23) (с максимальным
средним выигрышем)
ai = max ai .
0
1≤i≤m
Пример 6.12
Предприятие готовится к переходу на выпуск новых видов продукции. Возможны четыре стратегии A1, A2, A3, A4, каждой из которых
соответствует определенный ассортимент выпускаемой продукции.
Эффективность внедрения того или иного решения зависит от сочетания ряда факторов, определяющих конъюнктуру рынка. Число сочетаний факторов, определяющих основные возможные состояния, равно трем. Обозначим их как состояния природы П1, П2, П3. Получены
оценки вероятностей этих состояний: р1 = 0,5; р2 = 0,3; р3 = 0,2. Оценки эффективности реализации каждой из стратегий при том или ином
состоянии природы представлены в виде платежной матрицы
Пj
Аi
А1
А2
А3
А4
П1
П2
П3
0,25
0,70
0,35
0,80
0,35
0,20
0,85
0,10
0,40
0,30
0,20
0,35
182
Определим оптимальную стратегию выпуска продукции с помощью критерия Байеса относительно выигрышей. Для удобства
добавим к платежной матрице строку вероятностей состояний природы и столбец показателей эффективности стратегий игрока.
n
a1 = ∑ p j a1 j = 0 ,25⋅0,5 + 0 ,35⋅0,3 + 0 ,40⋅0 ,2 = 0,31;
j=1
n
a2 = ∑ p j a2 j = 0 ,70⋅0 ,5 + 0 , 20⋅0 ,3 + 0 ,30⋅0 , 2 = 0 , 47 ;
j=1
n
a3 = ∑ p j a3 j = 0,35⋅0,5 + 0,85⋅0,3 + 0, 20⋅0 , 2 = 0 , 47 ;
j=1
n
a4 = ∑ p j a4 j = 0 ,80⋅0 ,5 + 0,10⋅0 ,3 + 0 ,35⋅0,2 = 0 ,5 .
j=1
Пj
Аi
А1
А2
А3
А4
рi
П1
П2
П3
ai
0,25
0,70
0,35
0,80
0,5
0,35
0,20
0,85
0,10
0,3
0,40
0,30
0,20
0,35
0,2
0,31
0,47
0,47
0,5
Стратегия A4 имеет набольший показатель эффективности, следовательно, она является оптимальной по критерию Байеса относительно выигрышей.
Критерий Байеса выбора оптимальной стратегии «относительно рисков»
Показателем неэффективности стратегии Аi по критерию
Байеса относительно рисков называется среднее значение (математическое ожидание) риска при применении этой стратегии с учетом всех возможных состояний природы:
n
ri =∑ p j rij , i =1, 2 , … , m .
j=1
183
(6.24)
Величина ri представляет собой средневзвешенное значение
элементов i-й строки матрицы рисков с весами р1, р2, … , рn.
Критерий Байеса относительно рисков:
оптимальной среди чистых стратегий считается стратегия Ai0 с
минимальным показателем неэффективности (6.24) (с минимальным средним риском)
ri0 = min ri .
1≤i≤m
Пример 6.13
В условиях примера 6.12 определим оптимальную стратегию
выпуска продукции с помощью критерия Байеса относительно рисков. Составим матрицу рисков и добавим к этой матрице строку
вероятностей состояний природы и столбец показателей неэффективности стратегий игрока.
n
r1 = ∑ p j r1 j = 0,55⋅0 ,5 + 0,50⋅0,3 + 0⋅0 ,2 = 0 ,425 ;
j=1
n
r2 = ∑ p j r2 j = 0 ,10⋅0 ,5 + 0 ,65⋅0 ,3 + 0 ,10⋅0 ,2 = 0 ,265 ;
j=1
n
r3 = ∑ p j r3 j = 0, 45⋅0 ,5 + 0⋅0,3 + 0, 20⋅0, 2 = 0, 265 ;
j=1
n
r4 = ∑ p j r4 j = 0⋅0,5 + 0,75⋅0,3 + 0,05⋅0 ,2 = 0, 235 .
j=1
Пj
Аi
RA =
А1
А2
А3
А4
рi
П1
П2
П3
ri
0,55
0,10
0,45
0
0,5
0,50
0,65
0
0,75
0,3
0
0,10
0,20
0,05
0,2
0,425
0,265
0,265
0,235
184
Стратегия A4 имеет наименьший показатель неэффективности,
следовательно, она является оптимальной по критерию Байеса относительно рисков.
В примерах 6.12 и 6.13 одна и та же стратегия является оптимальной и по критерию Байеса относительно выигрышей, и по критерию Байеса относительно рисков. Это не случайность.
Теорема 6.16
Критерии Байеса относительно выигрышей и относительно
рисков эквивалентны: если стратегия Ai0 является оптимальной по
одному из этих критериев, то она является оптимальной и по второму критерию.
Критерии Лапласа выбора оптимальной стратегии
В некоторых случаях, когда вероятности состояний природы не
могут быть определены на основе объективной информации, значения этих вероятностей оцениваются субъективно. Существуют
различные способы субъективной оценки этих вероятностей. Наиболее известный из них опирается на «принцип недостаточного
основания» (впервые сформулирован Я. Бернулли): поскольку распределение вероятностей рj неизвестно, нет оснований считать эти
вероятности различными. Поэтому делается предположение, что р1
= р2 = … = рn = 1/n.
На принципе недостаточного основания построены критерии
Лапласа относительно выигрышей и относительно рисков. В силу
теоремы 6.16 эти критерии эквивалентны, поэтому сформулируем
только критерий относительно выигрышей.
Показателем эффективности стратегии Аi по критерию Лапласа относительно выигрышей называется среднее арифметическое выигрышей этой стратегии:
n
ai =
1
∑ a , i =1, 2, … , m .
n j=1 ij
(6.25)
Критерий Лапласа относительно выигрышей:
оптимальной среди чистых стратегий считается стратегия Ai0 с
максимальным показателем эффективности (6.25) ai0 =max ai .
1≤i≤m
185
6.2.3. Принятие решений в условиях неопределенности
Пусть в игре с природой игрок А имеет m возможных стратегий
A1, A2, …, Am, природа может находиться в одном из n возможных
состояний П1, П2, … , Пn, а матрица выигрышей игрока А определяется (6.19).
Критерии выбора оптимальной стратегии «относительно
выигрышей»
• Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами λ1, λ2, … , λn .
Переставим выигрыши при каждой стратегии Аi (элементы каждой строки матрицы (6.19)), расположив их в неубывающем порядке и обозначим полученную матрицу через В:
j
Вi
В=
В1
В2
…
Вm
1
2
…
n
b11
b21
…
bm1
b12
b22
…
bm2
…
…
…
…
b1n
b2n
…
bmn
(6.26)
bi1 ≤ bi2 ≤ … ≤ bin, i = 1, 2, …, m.
В матрице В в первом столбце стоят минимальные, в последнем
столбце — максимальные выигрыши при каждой стратегии:
bi1 = min aij , bin = max aij , i =1, 2, … , m .
1≤ j≤n
1≤ j≤n
Пусть числа λ1, λ2, …, λn удовлетворяют условиям
n
∑ λ =1 .
λj ≥0,
j
j=1
Показателем эффективности стратегии Аi по обобщенному
критерию Гурвица называется число
n
Gi ( λ1 , λ2 , … , λn ) =∑ λ j bij , i =1, 2 , … , m .
j=1
186
(6.27)
Показатель эффективности стратегии учитывает все выигрыши
при этой стратегии с весовыми коэффициентами λ1, λ2, … , λn.
Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами λ1, λ2, … , λn:
оптимальной среди чистых стратегий считается стратегия Ai0 с
максимальным показателем эффективности (6.27)
Gi0 ( λ1 , λ2 , … , λn ) =max Gi ( λ1 , λ2 , … , λn ) .
1≤i≤m
⎡n⎤
⎢
⎣2⎥
⎦
Числа λ p = ∑ λ j ,
j=1
n
λo = ∑ λ j =1− λ p
называются показа-
⎡n⎤
j=⎢ ⎥+1
⎣ 2⎦
⎡n⎤
телями соответственно пессимизма и оптимизма, ⎢ ⎥− целая
⎣2⎦
n
часть числа .
2
Коэффициенты λ1, λ2, … , λn выбираются из субъективных соображений: чем опаснее ситуация (больше желание подстраховаться),
тем ближе к 1 должен быть коэффициент пессимизма λр (соответственно, ближе к 0 коэффициент оптимизма λо). Если λо > 1/2 (соответственно, λр ≤ 1/2), то критерий более «оптимистический», чем
«пессимистический», и наоборот.
Если bij = aij, i = 1, 2, …, m, j = 1, 2, …, n (матрицы А и В совпадают), то коэффициенты λ1, λ2, … , λn можно формально интерпретировать как вероятности состояний природы. Тогда показатель
эффективности стратегии Ai по обобщенному критерию Гурвица
(6.27) превращается в показатель эффективности стратегии Ai по
критерию Байеса, а обобщенный критерий Гурвица — в критерий
Байеса.
• Критерий Вальда (критерий крайнего пессимизма)
Критерий Вальда есть частный случай обобщенного критерия
Гурвица относительно выигрышей с коэффициентами λ1 = 1, λ2 = …
= λn = 0.
187
Подставив эти значения коэффициентов в формулу (6.27), получим показатель эффективности стратегии Аi по критерию
Вальда:
Wi = Gi (1, 0 , … , 0) =bi1 = min aij , i =1, 2 , … , m .
1≤ j≤n
(6.28)
Это минимальный выигрыш игрока А при применении им стратегии Аi.
Оптимальной среди чистых стратегий по критерию Вальда является стратегия Ai0, имеющая максимальный показатель эффективности (6.28)
W = Wi0 = maxWi = max min aij .
1≤i≤m
1≤i≤m 1≤ j≤n
Это та чистая стратегия, при которой минимальный выигрыш
является максимальным среди минимальных выигрышей всех чистых стратегий. Она при любых состояниях природы гарантирует
игроку выигрыш, не меньший, чем максимин Wi0 .
Для критерия Вальда λр = 1, λо = 0 (отсюда название). Этот критерий ориентирует игрока на наихудшие для него состояния природы и, следовательно, крайне осторожное поведение при выборе
стратегии. Критерий уместен в случаях, когда игрок А хочет не
столько выиграть, сколько не проиграть.
• Критерий пессимизма-оптимизма Гурвица относительно
выигрышей с показателем пессимизма λ ∈ [ 0 ,1] .
Данный критерий представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей с коэффициентами
λ1 = λ, λ2 = … = λn — 1 = 0, λn = 1–λ.
Подставив эти значения коэффициентов в формулу (6.27), получим показатель эффективности стратегии Аi по критерию пессимизма-оптимизма Гурвица:
Gi ( λ) = Gi ( λ, 0, … , 0,1− λ) = λbi1 + (1− λ) bin =
= λ min aij + (1− λ) max aij ,
1≤ j≤n
1≤ j≤n
188
i =1, 2, … , m .
(6.29)
Оптимальной среди чистых стратегий по критерию пессимизма-оптимизма Гурвица является стратегия Ai0, имеющая максимальный показатель эффективности (6.29)
⎡
⎤
G ( λ) = Gi0 ( λ) = max Gi ( λ) = max⎢ λ min aij + (1− λ) max aij ⎥.
⎦
1≤i≤m
1≤i≤m⎣ 1≤ j≤n
1≤ j≤n
Для данного критерия λр = λ, λо = 1–λ. При λ = 1 получим критерий Вальда. Чем ближе λ к нулю, тем больше оптимизма и меньше
пессимизма.
При отсутствии ярко выраженной склонности ЛПР к пессимизму или оптимизму, разумным представляется значение λ = 0,5.
При λ = 0,5 показатель эффективности стратегии Аi примет вид
⎛ 1 ⎞ 1⎡
⎤
Gi⎜ ⎟= ⎢ min aij + max aij ⎥,
⎣
⎦
j
n
j
n
1
≤
≤
1
≤
≤
⎝2⎠ 2
i =1, 2, … , m ,
причем коэффициент 1/2 не зависит от i и поэтому может не учи⎛ ⎞
⎝2⎠
тываться, следовательно, Gi⎜ 1 ⎟= min aij + max aij ,
1≤ j≤n
1≤ j≤n
i =1, 2 , … , m .
Замечание.
Критерий Вальда и критерий пессимизма-оптимизма Гурвица
относительно выигрышей не учитывают все выигрыши игрока при
каждой его стратегии: критерий Вальда принимает во внимание
только минимальные выигрыши при каждой стратегии, а критерий
пессимизма-оптимизма Гурвица — минимальные и максимальные
выигрыши. В отличие от этих частных случаев, обобщенный критерий Гурвица учитывает все выигрыши при каждой стратегии игрока, используя тем самым полную информацию об игре.
Формализация выбора коэффициентов λ1, λ2, … , λn в обобщенном критерии Гурвица относительно выигрышей.
Обозначим:
m
1
b j = ∑ bij , j =1, 2 , … , n, − среднее значение выигрышей
m i=1
в j-м столбце матрицы В,
189
n
m
b = ∑∑ bij − сумма всех выигрышей матрицы В (или матрицы А).
j=1 i=1
Если игрок оценивает ситуацию как опасную, то выбор стратегии
должен быть осторожным, «направленным» в сторону убывания выигрышей — коэффициенты λj по мере убывания выигрышей должны
возрастать. Эти коэффициенты можно выбрать обратно пропорциональными средним выигрышам: λ1 : λ2 : … : λn = bn : bn−1 : … : b1 (принцип невозрастания средних выигрышей). Можно показать, что в соответствии с указанным принципом коэффициенты λ1, λ2, … , λn могут
быть определены по формулам
m
∑b
i ,n− j+1
i=1
(6.30)
, j =1, 2, … , n.
b
Если игрок оценивает ситуацию как безопасную, то коэффициенты λj по мере возрастания выигрышей также должны возрастать.
Эти коэффициенты можно выбрать прямо пропорциональными
средним выигрышам: λ1 : λ2 : … : λn = b1 : b2 : … : bn (принцип неубывания средних выигрышей). Можно показать, что в соответствии с указанным принципом коэффициенты λ1, λ2, … , λn могут быть
определены по формулам
λj =
m
∑b
ij
λ j = i=1 , j =1, 2 , … , n.
(6.31)
b
Пример 6.14 [14]
Инвестор может приобрести акции одной из трех компаний К1,
К2 и К3. Он намерен руководствоваться доходностью акций (доходность — это отношение дохода к цене акций, выраженное в
процентах; доход по акциям — это сумма дивидендов и разности
курсов акций). Имеются опубликованные данные о доходности в
процентах годовых: данные за январь, февраль, март и апрель.
В качестве математической модели ситуации рассмотрим игру с
природой, где роль сознательного игрока играет инвестор, а приро190
да — это ситуация на фондовом рынке. В распоряжении игрока
(инвестора) имеется три стратегии: Аi — покупка акций компании
Кi, i = 1, 2, 3. Возможные состояния природы: П1 — данные о доходности акций за январь, П2 — данные за февраль, П3 — за март и
П4 — за апрель. Из этих данных сформируем матрицу игры:
Пj
Аi
А1
А2
А3
П1
П2
П3
П4
8
7
6
4
7
12
6
7
8
20
7
10
Найдем оптимальные стратегии по каждому из критериев:
крайнего пессимизма Вальда, пессимизма-оптимизма Гурвица с
показателем оптимизма λ = 1/2 и с показателями пессимизма, выбранными в случае опасной и безопасной ситуации, а также по
обобщенному критерию Гурвица относительно выигрышей в опасной и безопасной ситуациях.
Упорядочим выигрыши по неубыванию.
j
1
2
3
4
А1
4
6
8
20
А2
7
7
7
7
А3
6
8
10
12
Вi
В=
Wi
• Критерий Вальда.
W = max {W1 ,W2 ,W3 } = max {4, 7 , 6} = 7 = W2 ,
поэтому по критерию Вальда оптимальной является стратегия А2
(инвестирование в акции компании К2). Это наиболее осторожное
решение: выбрана компания с минимальной средней доходностью,
но и с самым низким показателем колебания доходности.
191
• Критерий пессимизма-оптимизма Гурвица.
При λ = 1/2 (отсутствие явно выраженной склонности к песси-
⎛1⎞
⎝ 2⎠
⎛1⎞
⎝ 2⎠
мизму или оптимизму) G⎜ ⎟= max {4 + 20 , 7 + 7 , 6 +12} = 24 = G1⎜ ⎟,
поэтому оптимальной является стратегия А1 (инвестирование в акции компании К1).
Предположим теперь, что инвестор оценивает ситуацию на
фондовом рынке как опасную. Показатель пессимизма λ = λ1 выберем в соответствии с принципом (6.30). Т. к. в данном критерии
учитываются только минимальные и максимальные выигрыши, то
3
∑b
i4
λ= λ1 = 3
i=1
=
3
∑b + ∑b
i1
i=1
20 + 7 +12
39
= ,
4 + 7 + 6 + 20 + 7 +12 56
i4
i=1
39 17
= .
56 56
Показатели эффективности стратегий найдем в соответствии с
(6.29):
соответственно, показатель оптимизма 1− λ=1−
⎛ 39 ⎞ 39
⎛ 39 ⎞
496
≈ 8,86 ;
G1⎜ ⎟= ⋅ 4 +⎜1− ⎟⋅ 20 =
⎝ 56 ⎠ 56
⎝ 56 ⎠
56
⎛ 39 ⎞ 39
⎛ 39 ⎞
56
G2⎜ ⎟= ⋅7 +⎜1− ⎟⋅7 = ⋅7 = 7 ;
⎝ 56 ⎠ 56
⎝ 56 ⎠
56
⎛ 39 ⎞ 39
⎛ 39 ⎞
438
≈ 7 ,82 ;
G3⎜ ⎟= ⋅6 +⎜1− ⎟⋅12 =
⎝ 56 ⎠ 56
⎝ 56 ⎠
56
⎛ 39 ⎞
⎛ 39 ⎞
G⎜ ⎟= max {8,86; 7; 7 ,82} = 8,86 = G1⎜ ⎟.
⎝ 56 ⎠
⎝ 56 ⎠
Таким образом, в опасной ситуации оптимальной является
стратегия А1 (инвестирование в акции компании К1).
Предположим, что инвестор оценивает ситуацию на фондовом
рынке как безопасную. Показатель пессимизма λ = λ1 выберем в
192
соответствии с принципом (6.31). Т. к. в данном критерии учитываются только минимальные и максимальные выигрыши, то
3
∑b
i1
λ= λ1 = 3
i=1
=
3
∑b + ∑b
i1
i=1
4+7 +6
17
= ,
4 + 7 + 6 + 20 + 7 +12 56
i4
i=1
39
.
56
Показатели эффективности стратегий найдем в соответствии с
(6.29):
соответственно, показатель оптимизма 1− λ=
⎛ 17 ⎞ 17
⎛ 17 ⎞
848
G1⎜ ⎟= ⋅ 4 +⎜1− ⎟⋅ 20 =
≈ 15,14 ;
⎝ 56 ⎠ 56
⎝ 56 ⎠
56
⎛ 17 ⎞ 17
⎛ 17 ⎞
56
G2⎜ ⎟= ⋅7 +⎜1− ⎟⋅7 = ⋅7 = 7 ;
⎝ 56 ⎠ 56
⎝ 56 ⎠
56
⎛ 17 ⎞ 17
⎛ 17 ⎞
570
≈ 10,18 ;
G3⎜ ⎟= ⋅6 +⎜1− ⎟⋅12 =
⎝ 56 ⎠ 56
⎝ 56 ⎠
56
⎛ 39 ⎞
⎛ 39 ⎞
G⎜ ⎟= max {15,14; 7; 10,18} =15,14 = G1⎜ ⎟− оптимальной явля⎝ 56 ⎠
⎝ 56 ⎠
ется стратегия А1 (инвестирование в акции компании К1).
Выводы:
критерий Гурвица с показателями пессимизма λ = 1/2, λ = 17/56 и λ
= 39/56 рекомендует в качестве оптимальной одну и ту же стратегию А1. Это говорит о том, что в рассматриваемом примере данный
критерий не различает опасную и безопасную ситуации.
• Обобщенный критерий Гурвица.
Для опасной ситуации выберем коэффициенты λ1, λ2, λ3, λ4 в соответствии с принципом (6.30):
193
3
3
∑ bi 4
∑ bi 3 8 + 7 +10 25
20 + 7 +12 39
, λ2 = 3 i=1 4
,
λ1 = 3 4
=
=
=
=
102
102
102
102
∑∑ bij
∑∑ bij
i=1
i=1 j=1
i=1 j=1
3
3
i=1 j=1
i=1 j=1
∑ bi 2 6 + 7 +8 21
∑ bi1 4 + 7 + 6 17
λ3 = 3i=1 4
=
=
=
=
, λ4 = 3 i=1 4
.
102
102
102
102
∑∑ bij
∑∑ bij
Показатели эффективности стратегий вычислим в соответствии
с (6.27):
⎛ 39 25 21 17 ⎞ 39
25
21
17
814
G1⎜
,
,
,
⋅4 +
⋅6 +
⋅8 +
⋅ 20 =
≈ 7 ,98 ;
⎟=
⎝102 102 102 102 ⎠ 102
102
102
102
102
⎛ 39 25 21 17 ⎞ 39
25
21
17
102
G2⎜
,
,
,
⋅7 +
⋅7 +
⋅7 +
⋅7 =
⋅7 = 7 ;
⎟=
⎝102 102 102 102 ⎠ 102
102
102
102
102
⎛ 39 25 21 17 ⎞ 39
21
17
848
25
⋅10 +
⋅12 =
≈ 8,31 ;
G3⎜
,
,
,
⋅6 +
⋅8 +
⎟=
⎝102 102 102 102 ⎠ 102
102
102
102
102
⎛ 39 25 21 17 ⎞
G⎜
,
,
,
⎟= max {7 ,98; 7; 8,31} = 8,31=
⎝102 102 102 102 ⎠
⎛ 39 25 21 17 ⎞
= G3⎜
,
,
,
⎟.
⎝102 102 102 102 ⎠
Оптимальной является стратегия А3 (инвестирование в акции
компании К3). Показатели пессимизма и оптимизма соответственно
равны
2
λp =∑ λ j =
j=1
39 + 25 64 32
=
= ,
102
102 51
4
λo = ∑ λ j =
j=3
21+17 38 19
=
= .
102
102 51
Для безопасной ситуации выберем коэффициенты λ1, λ2, λ3, λ4 в
соответствии с принципом (6.31):
194
3
3
∑ bi1
∑ bi 2 6 + 7 +8 21
4 + 7 + 6 17
λ1 = 3 4
=
=
=
=
, λ2 = 3i=1 4
,
102
102
102
102
∑∑ bij
∑∑ bij
i=1
i=1 j=1
i=1 j=1
3
3
∑b
∑b
i3
λ3 = 3 i=1 4
=
∑∑b
8 + 7 +10 25
=
, λ4 = 3i=1 4
102
102
i4
=
∑∑b
ij
20 + 7 +12 39
=
.
102
102
ij
i=1 j=1
i=1 j=1
Показатели эффективности стратегий вычислим в соответствии
с (6.27):
⎛ 17 21 25 39 ⎞ 17
21
25
39
1174
G1⎜
,
,
,
⋅4 +
⋅6 +
⋅8 +
⋅ 20 =
≈ 11,51 ;
⎟=
⎝102 102 102 102 ⎠ 102
102
102
102
102
⎛ 17 21 25 39 ⎞ 17
21
25
39
102
G2⎜
,
,
,
⋅7 +
⋅7 +
⋅7 +
⋅7 =
⋅7 = 7 ;
⎟=
⎝102 102 102 102 ⎠ 102
102
102
102
102
⎛ 17 21 25 39 ⎞ 17
25
39
988
21
⋅6 +
⋅8 +
⋅10 +
⋅12 =
≈ 9,69 ;
G3⎜
,
,
,
⎟=
⎝102 102 102 102 ⎠ 102
102
102
102
102
⎛ 17 21 25 39 ⎞
G⎜
,
,
,
⎟= max {11,51; 7; 9 ,69} =11,51=
⎝102 102 102 102 ⎠
⎛ 17 21 25 39 ⎞
,
,
,
= G1⎜
⎟.
⎝102 102 102 102 ⎠
Оптимальной является стратегия А1 (инвестирование в акции
компании К1). Показатели пессимизма и оптимизма соответственно
равны
2
17 + 21 38 19
λp = ∑ λ j =
=
= ,
102
102 51
j=1
4
λo = ∑ λ j =
j=3
25 + 39 64 32
=
= .
102
102 51
Выводы:
в данном примере обобщенный критерий Гурвица при указанном
выборе коэффициентов делает различие между опасной и безопас195
ной ситуациями, в которых принимается решение о выборе оптимальной стратегии.
Критерии выбора оптимальной стратегии «относительно
рисков»
Обобщенный критерий Гурвица и его частные случаи учитывали выигрыши игрока и были сформулированы как критерии «относительно выигрышей». Аналогичные критерии можно сформулировать относительно рисков.
• Обобщенный критерий пессимизма-оптимизма Гурвица
относительно рисков с коэффициентами λ1, λ2, … , λn .
Пусть для матрицы выигрышей (6.19) составлена матрица рисков (6.22). В каждой строке матрицы (6.22) переставим риски, расположив их в невозрастающем порядке, и обозначим полученную
матрицу через D:
j
Di
D=
D1
D2
…
Dm
1
2
…
n
d11
d21
…
dm1
d12
d22
…
dm2
…
…
…
…
d1n
d2n
…
dmn
(6.32)
di1 ≥ di2 ≥ … ≥ din, i = 1, 2, …, m.
В матрице D в первом столбце стоят максимальные, а в последнем столбце — минимальные риски для каждой стратегии:
di1 = max rij , din = min rij , i =1, 2, … , m .
1≤ j≤n
1≤ j≤n
Пусть числа λ1, λ2, …, λn удовлетворяют условиям
n
λj ≥0,
∑ λ =1 .
j
j=1
Показателем неэффективности стратегии Аi по обобщенному
критерию Гурвица относительно рисков с коэффициентами λ1, λ2,
… , λn называется число
196
n
Ri ( λ1 , λ2 , … , λn ) =∑ λ j dij , i =1, 2, … , m .
(6.33)
j=1
Показатель неэффективности стратегии учитывает все риски при
выборе этой стратегии с весовыми коэффициентами λ1, λ2, … , λn.
Обобщенный критерий пессимизма-оптимизма Гурвица относительно рисков с коэффициентами λ1, λ2, … , λn:
оптимальной среди чистых стратегий считается стратегия Ai0 с минимальным показателем неэффективности (6.33)
Ri0 ( λ1 , λ2 , … , λn ) = min Ri ( λ1 , λ2 , … , λn ) .
1≤i≤m
Показатели пессимизма и оптимизма для этого критерия определяются так же, как в случае критерия относительно выигрышей.
Коэффициенты λ1, λ2, … , λn выбираются ЛПР субъективно, но
можно использовать и формализованную процедуру по аналогии с
критерием относительно выигрышей:
в опасной ситуации
m
∑d
ij
λ j = i=1
, j =1, 2 , … , n
d
(принцип невозрастания средних рисков);
в безопасной ситуации
(6.34)
m
∑d
i ,n− j+1
λ j = i=1
, j =1, 2, … , n.
d
(принцип неубывания средних рисков),
n
(6.35)
m
где d = ∑∑ dij .
j=1 i=1
• Критерий Сэвиджа (критерий крайнего пессимизма)
Критерий Сэвиджа есть частный случай обобщенного критерия Гурвица относительно рисков с коэффициентами λ1 = 1, λ2 =
… = λn = 0.
197
Подставив эти значения коэффициентов в формулу (6.33), получим показатель неэффективности стратегии Аi по критерию
Сэвиджа:
Ri (1, 0 , … , 0) =di1 = max rij , i =1, 2, … , m .
1≤ j≤n
(6.36)
Это максимальный риск игрока А при выборе им стратегии Аi.
Оптимальной среди чистых стратегий по критерию Сэвиджа
является стратегия Ai0, имеющая минимальный показатель неэффективности (6.36)
Ri0 (1, 0 , … , 0) = min Ri (1, 0, … , 0) = min max rij .
1≤i≤m
1≤i≤m 1≤ j≤n
Это та чистая стратегия, при выборе которой максимальный
риск является минимальным среди максимальных рисков всех чистых стратегий. Она при любых состояниях природы гарантирует
игроку риск, не больший, чем min max rij .
1≤i≤m 1≤ j≤n
Для критерия Сэвиджа λр = 1, λо = 0 (отсюда название). Этот критерий, как и критерий Вальда, ориентирует игрока на наихудшие для
него состояния природы и крайне осторожное поведение при выборе
стратегии. В то же время, указанные два критерия не являются эквивалентными: применение этих критериев к игре с одной и той же матрицей выигрышей может приводить к различным выводам относительно того, какая стратегия является оптимальной. Так, для игры,
описанной в примере 6.14, стратегия, оптимальная по критерию Вальда — это стратегия А2 (показано в примере 6.14), оптимальная по критерию Сэвиджа — стратегия А1 (показать самостоятельно).
• Критерий пессимизма-оптимизма Гурвица относительно
рисков с показателем пессимизма λ ∈ [ 0 ,1] .
Данный критерий представляет собой частный случай обобщенного критерия Гурвица относительно рисков с коэффициентами
λ1 = λ, λ2 = … = λn — 1 = 0, λn = 1–λ.
Подставив эти значения коэффициентов в формулу (6.33), получим показатель неэффективности стратегии Аi по критерию
пессимизма-оптимизма Гурвица:
198
Ri ( λ) = Ri ( λ , 0, … , 0,1− λ) = λdi1 +(1− λ) din =
= λ max rij + (1− λ) min rij ,
1≤ j≤n
1≤ j≤n
i =1, 2, … , m .
(6.37)
Оптимальной среди чистых стратегий по критерию пессимизма-оптимизма Гурвица является стратегия Ai0, имеющая минимальный показатель неэффективности (6.37)
⎡
⎤
Ri0 ( λ) = min Ri ( λ) = min⎢ λ max rij + (1− λ) min rij ⎥.
⎦
1≤i≤m
1≤i≤m⎣ 1≤ j≤n
1≤ j≤n
Для данного критерия λр = λ, λо = 1–λ. При λ = 1 получим критерий Сэвижда.
Замечание.
Обобщенные критерии Гурвица относительно выигрышей и относительно рисков (и соответствующие их частные случаи) не являются эквивалентными.
6.3. áÄÑÄçàü Ñãü ëÄåéëíéüíÖãúçéÉé ÇõèéãçÖçàü
Задание 6.1
Рассмотрим следующую конфликтную ситуацию [14]. Две
фирмы: А и В, проводят рекламную кампанию на предполагаемых
рынках сбыта, в каждом из двух соседних городов. У фирмы А
имеются средства, чтобы оплатить в двух городах четыре способа
проведения рекламной кампании, а у фирмы В — только три способа. Успех каждой фирмы в проведении кампании (для определенности — фирмы А) оценивается в условных единицах (очках)
следующим образом:
• если у фирмы А больше способов рекламы, чем у противника, то выигрыш фирмы А — это число очков, равное числу
способов рекламы, примененных противником в данном городе, плюс одно очко за победу;
• если у фирмы А меньше способов рекламы, чем у противника, то проигрыш фирмы А — это число очков, равное чис-
199
лу способов рекламы, примененных ею в данном городе, и
еще одно очко за проигрыш;
• если число способов рекламы в городе у обеих фирм одинаково, то каждая фирма получает ноль очков.
Общий выигрыш каждой фирмы — это сумма ее очков по двум
городам в различных ситуациях.
1. Формализовать конфликтную ситуацию и построить матрицу
игры.
2. Определить верхнюю и нижнюю цену игры, максиминные
стратегии игрока А и минимаксные стратегии игрока В.
3. Определить ситуации, удовлетворительные для игроков А и В.
4. Выяснить, существует ли решение игры в чистых стратегиях. В
случае положительного ответа найти это решение.
5. Оформить отчет. Содержание отчета:
1) Функция выигрыша игрока А.
2) Матрица игры.
3) Результаты исследований п. 2–4 (с обоснованием).
Задание 6.2
Предприниматель (игрок А) располагает двумя видами товаров,
которые он стремится реализовать на рынке, где возможна продажа
аналогичных товаров конкурентом (игроком В). Игроку А неизвестно, какой вид товаров будет продавать В, а В неизвестно, какие
товары будет продавать А. Игрок А обладает двумя возможными
стратегиями: Ai — продавать товар i-го вида, i = 1, 2; у игрока В —
также две стратегии: Вj — продавать товар j-го вида, j = 1, 2.
На основе предварительного анализа, проведенного игроком А,
получены оценки вероятностей того, что i-й товар будет продан
при наличии на рынке того или иного товара конкурента. Эти вероятности рассматриваются в качестве выигрыша игрока А. Матрица
игры имеет вид
Вj
Аi
А1
А2
B1
B2
0,2
0,7
0,8
0,3
200
1. Определить верхнюю и нижнюю цену игры в чистых стратегиях, максиминную стратегию игрока А и минимаксную стратегию игрока В.
2. Пусть даны смешанные стратегии Р0 = (0,4; 0,6) и Q0 = (0,5;
0,5). Определить следующие значения.
1) Выигрыши игрока А в ситуациях (Р0, Q0), (Р0, B1), (Р0, B2).
2) Показатель эффективности смешанной стратегии Р0 игрока
А и показатель неэффективности смешанной стратегии Q0 игрока В. Дать интерпретацию этих величин.
3) Определить нижнюю и верхнюю цену игры в смешанных
стратегиях.
3. Сформулировать условие игры в форме пары двойственных
задач ЛП.
4. Найти оптимальные смешанные стратегии игроков и цену игры,
используя методы ЛП. Дать интерпретацию полученных результатов.
5. Оформить отчет. Содержание отчета — результаты исследований п. 1–4. Привести все необходимые расчеты.
Задание 6.3
Руководство торгового центра заказывает товар определенного
вида. Известно, что спрос на товар данного вида варьируется в
пределах от 6 до 9 единиц. Если заказанного товара окажется недостаточно для удовлетворения спроса, то имеется возможность
срочно заказать и завезти недостающее количество товара. Если же
спрос будет меньше наличного количества, то нереализованный
товар придется хранить на складе торгового центра. Руководство
заинтересовано в минимизации дополнительных затрат, связанных
с хранением и срочным заказом и завозом товара.
Расходы на хранение единицы товара составляют 1 тыс. д. е., а
расходы, связанные со срочным завозом — 2 тыс. д. е.
1. Формализовать описанную ситуацию в виде игры с природой и
построить платежную матрицу.
2. Построить матрицу рисков.
3. Предполагая, что спрос на товар принимает значения, равные 6,
7, 8 и 9 ед. с вероятностями, равными соответственно р1 = 0,2;
201
4.
5.
6.
7.
р2 = 0,3; р3 = 0,1 и р4 = 0,4; определить чистую стратегию, оптимальную по критерию Байеса.
Предполагая, что вероятности указанных в п. 3 значений спроса
неизвестны, принять их субъективные оценки в соответствии с
принципом недостаточного основания и определить чистую
стратегию, оптимальную по критерию Лапласа.
Определить оптимальную чистую стратегию и оценить выигрыш
игрока, используя следующие критерии относительно выигрышей: Вальда, Гурвица в опасной и безопасной ситуации, обобщенный критерий Гурвица в опасной и безопасной ситуации.
Определить оптимальную чистую стратегию и оценить риск
игрока, используя следующие критерии относительно рисков:
Сэвиджа, обобщенный критерий Гурвица в опасной и безопасной ситуации.
Оформить отчет. Содержание отчета:
1) Функция выигрыша игрока А, платежная матрица.
2) Матрица рисков.
3) Результаты исследований п. 3–6. Привести все необходимые
расчеты.
7. åÖíéÑõ èéãìóÖçàü ùäëèÖêíçõï éñÖçéä
7.1. éÅôàÖ ëÇÖÑÖçàü é èêéÇÖÑÖçàà ùäëèÖêíàáõ
Под экспертизой обычно понимают проведение группой экспертов измерения некоторых характеристик исследуемых объектов, необходимое для подготовки принятия решения. Отличительная особенность экспертизы как процедуры измерения состоит в
том, что вместо приборов, дающих объективные показания, выступают люди (эксперты), которые высказывают свое субъективное
мнение. В задачи экспертной комиссии может входить не только
оценивание имеющихся объектов, но и построение самих объектов
или их характеристик. В данном разделе рассматриваются только
задачи первого типа — групповой выбор, связанный с получением
оценок имеющихся объектов.
202
Как правило, экспертиза включает в себя следующие основные
этапы.
— Формирование экспертной группы.
— Определение процедуры работы экспертной группы:
• разработка анкеты (опросного листа);
• выбор шкалы оценивания;
• определение условий выражения экспертами своих оценок
(степень анонимности, возможность обсуждения и т. п.).
— Проведение опроса экспертов и получение их индивидуальных
оценок.
— Обработка и анализ результатов экспертизы:
• оценка согласованности мнений экспертов;
• формирование групповой оценки.
В случае плохой согласованности индивидуальных оценок могут быть выполнены следующие действия: корректировка анкеты,
предоставление экспертам дополнительной информации, ознакомление их с мнениями друг друга, переформирование экспертной
группы и т. п., после чего проводится повторный опрос.
Для организации работы экспертной комиссии чаще всего применяется метод Делфи, который предполагает отказ от коллективных обсуждений. Цель этого отказа — снижение влияния психологических факторов (присоединение к мнению наиболее
авторитетного специалиста, нежелание отказаться от публично выраженного мнения, следование за мнением большинства и т. п.) на
результат экспертизы. Вместо обсуждения предусмотрен ряд последовательных индивидуальных опросов, причем в ходе опроса
контакты между экспертами исключаются. Ознакомление экспертов с мнениями других членов комиссии возможно в промежутке
между двумя турами опроса. Процедура может повторяться несколько раз до достижения приемлемой согласованности мнений
экспертов. По данным различных источников, на практике удовлетворительный результат обычно достигается после 3 — 5 итераций.
Схема проведения экспертизы в самом общем виде представлена
на рис. 7.1.
203
Формирование
экспертной группы
Определение
процедуры экспертизы
Получение независимых
оценок экспертов
Проверка согласованности
мнения экспертов
Оценки экспертов
согласованы
Корректировка анкеты,
предоставление экспертам
дополнительной информации,
ознакомление с мнениями
других экспертов
Переформирование
экспертной группы
Оценки экспертов
плохо согласованы
Формирование
групповой оценки
Рис. 7.1. Общая схема проведения экспертизы
На практике наиболее широко применяются два типа экспертных оценок:
1) сравнение по предпочтительности всех объектов одновременно; результатом является ранжирование объектов либо
оценки объектов в количественной или балльной шкале;
2) одновременное сравнение только двух объектов (парное
сравнение).
Ранжирование.
Пусть множество Х исследуемых объектов включает m элементов:
Х = {x1, x2, … , xm}.
Процедура ранжирования объектов состоит в том, что каждый из
экспертов упорядочивает объекты по убыванию важности, руководствуясь одним или несколькими показателями сравнения. Если
среди объектов x1, …, xm нет эквивалентных по сравниваемым показателям, то каждый эксперт устанавливает на множестве Х отношение строгого порядка, присваивая объектам числовые значения 1, 2,
…, m (ранги) в соответствии с позицией данного объекта в итоговом
упорядочении. Объект с рангом 1 является наиболее предпочтительным из всех, объект с рангом 2 менее предпочтителен, чем объект с
рангом 1, но предпочтительнее всех остальных и т. д.
204
При наличии среди x1, x2, … , xm эквивалентных объектов эксперт может построить отношение нестрогого порядка. При этом
эквивалентным объектам назначаются одинаковые значения (связанные ранги) по следующему правилу. Если с точки зрения данного эксперта объекты, занимающие в итоговом упорядочении позиции с номерами от p до p+q, являются эквивалентными, то всем
этим объектам присваивается ранг
p + ( p +1) + … + ( p + q )
rсв =
.
q +1
Важно, что сумма всех рангов, выставленных каждым экспер(
)
том, должна быть постоянной и равной 1+ 2 + … + m = m m +1 .
2
Результатом опроса n экспертов является матрица рангов
R = (rij), i = 1, 2, …, m, j = 1, 2, …, n,
где rij — ранг i-го объекта, выставленный j-м экспертом, причем
m
∑r =
ij
i=1
m ( m +1)
,
2
j =1, 2, … , n .
Непосредственное оценивание объектов.
Процедура непосредственного оценивания объектов состоит в
присваивании объектам числовых значений в одной из количественных шкал. Эксперт должен поставить в соответствие каждому
объекту точку на заданном отрезке числовой оси; при этом эквивалентным объектам должны быть поставлены в соответствие одинаковые числа (см. рис. 7.2).
Оцениваемые
объекты
х1
1,0
0,9
х2
0,8
0,7
х3
0,6
х4
0,5
х5
0,4
0,3
х6
0,2
0,1
х7
0,0
Рис. 7.2. Непосредственное оценивание объектов
205
Как правило, точное количественное измерение объектов связано с большими трудностями, поэтому на практике чаще применяется балльная оценка: исходный отрезок числовой оси разбивается на промежутки, каждому из которых приписывается
соответствующее количество баллов. Балльная оценка для каждого
объекта выставляется исходя из того, в каком из промежутков, по
мнению данного эксперта, находится точное количественное значение измеряемого показателя.
Балльные оценки занимают промежуточное положение между
ранжированием (измерением в порядковой шкале) и количественными оценками. Поэтому для их обработки могут применяться как
«качественные» методы анализа данных, представленных в порядковой шкале (имеющих ординальное представление), так и методы
анализа количественных данных (имеющих кардинальное представление). Наиболее широко применяются методы, в которых
балльные оценки рассматриваются как количественные.
Результатом опроса n экспертов является матрица
Ρ = (ρij), i = 1, 2, …, m, j = 1, 2, …, n,
где ρij — оценка i-го объекта, выставленная j-м экспертом.
Парное сравнение.
При попарном сравнении объектов измерение состоит в указании в каждой паре объектов более предпочтительного с точки зрения данного эксперта (или констатации того, что данные объекты
являются равноценными). Результаты парных сравнений могут
быть выражены как в качественном, так и в количественном виде.
В первом случае каждый эксперт выстраивает на множестве Х
бинарное отношение (отношение предпочтительности). В общем
случае это отношение может не обладать свойством транзитивности. Для представления результата обычно используется матричная
форма: k-й эксперт, k = 1, 2, …, n, формирует матрицу парных
сравнений B(k). Элементы этой матрицы в случае строгих предпочтений могут определяться, например, по правилу:
⎧1 , xi
bij(k ) = ⎨
⎩0 , x j
xj ,
xi ,
206
i, j =1, 2, … , m .
Количественные результаты парных сравнений могут отражать
а) балльную оценку степени предпочтительности xi над xj по мнению k-го эксперта;
б) во сколько раз xi превосходит xj по мнению k-го эксперта и т. п.
В таких случаях элементы матрицы B(k) определяются в соответствии с количественными оценками, выставленными k-м экспертом.
В [6] показано, что все перечисленные способы представления
результатов парных сравнений практически могут быть приведены
к виду б) (хотя теоретическое обоснование этой возможности требует принятия дополнительных предположений). Отсюда следует
возможность применения «количественных» методов обработки
результатов даже в тех случаях, когда экспертами фиксировались
только факты предпочтительности xi над xj.
7.2. éÅêÄÅéíäÄ à ÄçÄãàá ùäëèÖêíçõï éñÖçéä
7.2.1. Формирование групповой оценки
В данном разделе рассматриваются методы обработки результатов одновременного оценивания объектов. Методы анализа результатов в случае парного сравнения можно найти, например, в [6].
1. Непосредственное оценивание.
Простейший способ получения групповой оценки i-го объекта —
n
1
это вычисление среднего балла ρi = ∑ ρij , i =1, 2 , … , m . Эта
n j=1
формула означает, фактически, равноправие экспертов: оценки
всех экспертов входят в сумму с одним и тем же весовым коэффициентом, равным 1/n. Для отражения «неравенства» экспертов, связанного с различиями в их компетентности, информированности,
объективности и т. п. используются весовые показатели компетентности экспертов qj, j = 1, 2, …, n. Тогда групповая оценка i-го
объекта имеет вид
207
n
ρi = ∑ q j ρij , i =1, 2 , … , m .
(7.1)
j=1
Значения показателей qj могут определяться либо на основе само- и взаимооценок компетентности членов экспертной группы,
либо на основе анализа оценок, выставленных экспертами в данной
экспертизе. Далее рассматривается второй из указанных методов.
В литературе, посвященной экспертным измерениям, часто высказывается мнение, что компетентность эксперта следует оценивать по тому, насколько согласованы оценки данного эксперта с
мнением большинства. Рассмотрим процедуру оценки компетентности экспертов и построения результата группового оценивания,
реализующую данную точку зрения.
1) Нормирование матрицы Ρ.
Элементы нормированной матрицы оценок Х определяются в
соответствии с правилом
xij =
ρij
, i =1, 2 , … , m ,
m
j =1, 2, … , n .
∑ρ
ij
i=1
2) Вычисление вектора компетентности экспертов q = (q1, q2,
…, qn)T и групповых оценок объектов с учетом текущих показателей компетентности.
Используется итерационная процедура
x (t ) = X ⋅q(t−1) ,
1
q(t ) = m n
⋅ X T ⋅ x (t ) , t =1, 2 , … ,
∑∑ xi(t ) xij
(7.2)
i=1 j=1
T
⎛1 1
1⎞
где q(0) = ⎜ , , … , ⎟ , (первоначально эксперты считаются
⎝n n
n⎠
равнокомпетентными);
верхний индекс (t) означает номер итерации;
208
вектор x(t) интерпретируется как вектор средних оценок каждого
объекта, найденный с учетом текущих показателей компетентности
экспертов.
В курсе линейной алгебры доказано, что для неразложимой неотрицательной матрицы Х последовательность векторов q(t), получаемая в соответствии с (7.2), сходится к собственному вектору
матрицы Х, отвечающему максимальному собственному значению.
Поэтому на практике необходимо выполнять вычисления по формулам (7.2) до тех пор, пока не будет достигнута стабилизация результатов.
Пример 7.1
Пусть мнения трех экспертов относительно эффективности инвестиций в два альтернативных проекта представлены в виде оценок по десятибалльной шкале в таблице 7.1.
Таблица 7.1
Оценки экспертов
Проекты
1
8
2
1
2
2
6
9
Матрица экспертных оценок имеет вид
⎛8 6 7 ⎞
Ρ =⎜
⎟.
⎝ 2 9 3⎠
Нормируем матрицу Р:
⎛ 8
⎜
8+ 2
X =⎜
⎜ 2
⎜
⎝8+ 2
6
6+9
9
6+9
7 ⎞
⎟
7 + 3 ⎟ ⎛ 0,8 0, 4 0 ,7 ⎞
=⎜
⎟.
3 ⎟ ⎝ 0 ,2 0,6 0,3⎠
⎟
7 +3⎠
⎛ 1 1 1 ⎞T
Положим q = ⎜ , , ⎟ .
⎝ 3 3 3⎠
0
209
3
7
3
Первая итерация:
⎛1⎞
⎜ ⎟
⎜ 3⎟
⎛
⎞
0,8 0 ,4 0,7 ⎜ 1 ⎟ ⎛ 0,633⎞
x1 = X ⋅q 0 = ⎜
⎟⋅ ⎟ ≈ ⎜
⎟,
0,367 ⎠
3
⎝ 0, 2 0 ,6 0,3⎠ ⎜
⎜ ⎟ ⎝
⎜1⎟
⎜ ⎟
⎝ 3⎠
1
⋅ X T ⋅ x1 =
q1 = 2 3
∑∑ xi1 xij
i=1 j=1
⎛ 0,8 0,2⎞
⎛ 0 ,361⎞
⎜
⎟ ⎛ 0 ,633⎞ ⎜
⎟
1
=
⋅⎜ 0, 4 0 ,6⎟⋅⎜
⎟ ≈ ⎜ 0 ,295⎟.
(
)
(
)
0 ,633 0 ,8 + 0 ,4 + 0 ,7 + 0 ,367 0 ,2 + 0 ,6 + 0,3 ⎜
⎟ ⎝0,367 ⎠ ⎜
⎟
⎝0,7 0,3⎠
⎝ 0,344⎠
Больший вес получает тот эксперт, который дал бóльшую оценку проекту, набравшему бóльшее количество баллов.
Вторая итерация:
⎛ 0,361⎞
⎛0,8 0,4 0,7 ⎞ ⎜
⎟ ⎛0,648⎞
2
1
x = X ⋅q = ⎜
⎟⋅⎜ 0,295⎟ ≈ ⎜
⎟,
⎝ 0,2 0 ,6 0,3⎠ ⎜
⎟ ⎝0,352⎠
⎝ 0,344⎠
1
⋅ X T ⋅x 2 =
q2 = 2 3
∑∑ xi2 xij
i=1 j=1
⎛ 0 ,8 0 ,2⎞
⎛ 0 ,364⎞
⎜
⎟ ⎛ 0,648⎞ ⎜
⎟
1
=
⋅⎜ 0 ,4 0,6⎟⋅⎜
⎟ ≈ ⎜ 0 ,291⎟.
0,648 ( 0,8 + 0 ,4 + 0 ,7 ) + 0,352 ( 0,2 + 0,6 + 0,3) ⎜
⎟ ⎝ 0,352⎠ ⎜
⎟
⎝ 0 ,7 0 ,3⎠
⎝ 0 ,346⎠
Будем считать, что по результатам двух итераций достигнута
приемлемая стабилизация: все компоненты вектора q2 отличаются
от компонент q1 не более чем на 0,005, поэтому вектор х3 будет незначительно отличаться от вектора х2.
210
Таким образом, оценка показателей компетентности экспертов,
найденная на основе анализа результатов данной экспертизы, представлена вектором q2, а групповые оценки проектов (в нормированной балльной шкале) с учетом корректировки показателей компетентности — вектором х2.
2. Ранжирование.
Как и в случае непосредственной оценки, простейший способ
получения групповой оценки i-го объекта — это вычисление средn
1
него ранга ri = ∑ rij , i =1, 2 , … , m , которое выполняется на
n j=1
основе предположения о равноправии экспертов. Учет различной
степени их компетентности, объективности и т. п. может быть выполнен путем введения показателей компетентности qj, j = 1, 2, …,
n. Далее представлено описание процедуры определения показателей qj и построения групповой оценки на основе анализа индивидуальных оценок, выставленных в данной экспертизе. Эта процедура
реализует следующую идею. Ранжирование можно рассматривать
как результат попарного сравнения объектов, представленный в качественном виде. Как уже отмечалось в п. 7.1, этот результат может
быть преобразован к числовым значениям, допускающим обработку
«количественными» методами, аналогичными процедуре (7.2).
1) Нормирование матрицы R.
Элементы нормированной матрицы Х определяются в соответствии с правилом
m − rij
xij = m
, i =1, 2, … , m , j =1, 2 , … , n .
∑( m − rij )
i=1
m
m
i=1
i=1
Т. к. ∑ ( m − rij ) = m 2 − ∑ rij = m 2 −
то xij =
m − rij
, i =1, 2, … , m ,
m ( m −1)
2
211
m ( m +1)
m ( m −1)
=
,
2
2
j =1, 2, … , n .
2) Вычисление вектора компетентности экспертов q = (q1, q2,
…, qn)T и групповых оценок объектов с учетом текущих показателей компетентности.
Используется итерационная процедура (7.2).
Результатом применения описанной процедуры является нормированный вектор х, представляющий собой групповую оценку степени предпочтительности (весов) оцениваемых объектов. Для получения порядковых групповых предпочтений (групповых рангов)
необходимо упорядочить оцениваемые объекты по убыванию весов.
Пример 7.2
Пусть мнения четырех экспертов относительно предпочтительности пяти альтернативных проектов представлены в виде рангов в
таблице 7.2.
Таблица 7.2
Проекты
1
2
3
4
5
Оценки экспертов
1
3
2
4
1
5
2
5
3
2
1
4
3
5
3/2
3
3/2
4
4
3
1
3
3
5
Для третьего эксперта проекты № 2 и № 4 являются равноценными и более предпочтительными, чем все остальные. Для четвертого эксперта наиболее предпочтительным является проект № 2,
далее следуют равноценные проекты № 1, № 3 и № 4, и наименее
предпочтительным является проект №5.
⎛3 5
5
3⎞
⎜
⎟
⎜ 2 3 3 / 2 1⎟
3
3⎟.
Матрица рангов имеет вид R = ⎜ 4 2
⎜
⎟
⎜ 1 1 3 / 2 3⎟
⎜
⎟
4
5⎠
⎝5 4
212
Нормируем матрицу рангов:
⎛0,2 0
0
⎜
⎜ 0,3 0, 2 0,35
m ( m −1)
5⋅ 4
=
=10 , X = ⎜ 0,1 0,3 0, 2
⎜
2
2
⎜ 0, 4 0, 4 0,35
⎜
⎝ 0 0,1 0,1
0 ,2⎞
⎟
0 ,4⎟
0 ,2⎟.
⎟
0 ,2⎟
⎟
0 ⎠
⎛ 1 1 1 1 ⎞T
Положим q = ⎜ , , , ⎟ .
⎝ 4 4 4 4⎠
Для иллюстративных целей ограничимся выполнением только
одной итерации:
0
⎛0,2 0
0
⎜
⎜ 0 ,3 0 ,2 0 ,35
1
0
x = X ⋅q = ⎜ 0,1 0,3 0 ,2
⎜
⎜ 0, 4 0 ,4 0,35
⎜
⎝ 0 0 ,1 0 ,1
⎛ 0,1 ⎞
0 ,2⎞
⎟ ⎛ 0, 25⎞ ⎜
⎟
0 ,4⎟ ⎜
⎟ ⎜ 0 ,3125⎟
0, 25⎟ ⎜
0 ,2⎟⋅⎜
0 ,2 ⎟.
=
⎟ ⎜ 0, 25⎟ ⎜
⎟
⎟ ⎜ 0 ,3375⎟
0 ,2⎟ ⎜
⎟ ⎝ 0, 25⎠ ⎜
⎟
0 ⎠
⎝ 0,05 ⎠
Это дает групповую оценку предпочтительности проектов в
предположении о равноправии экспертов. Для получения групповых рангов остается упорядочить проекты по убыванию весов —
см. таблицу 7.3.
Таблица 7.3
Проекты
Веса
Групповые ранги
1
2
3
4
5
0,1
0,3125
0,2
0,3375
0,05
4
2
3
1
5
213
7.2.2. Оценка согласованности мнений экспертов
Распространенный подход к оценке степени согласованности
мнений экспертов основан на априорном предположении, что существуют некоторые «истинные» оценки объектов x1, x2, … , xm, а
индивидуальные оценки экспертов представляют собой флуктуации, обусловленные случайными отклонениями от «истинных»
оценок. В рамках данного подхода анализ выполняется с использованием методов теории вероятностей и математической статистики.
Например, наиболее традиционной оценкой степени согласованности мнений экспертов при ранжировании объектов является
коэффициент конкордации Кендалла. В данном методе степень
совпадения мнений экспертов оценивается с использованием велиm
2
чины s = ∑( Ri − R ) ,
i=1
n
где Ri = ∑ rij
сумма рангов, присвоенных i-му объекту
−
j=1
всеми экспертами, i = 1, 2, … , m;
m
1
R = ∑ Ri − среднее значение Ri по матрице рангов R.
m i=1
m
Т. к. ∑ rij =
i=1
m
то R =
m ( m +1)
,
2
j =1, 2, … , n ,
m
n
n
1
1
1
m ( m +1)
n ( m +1)
=
Ri = ∑∑ rij = ∑
.
∑
2
2
m i=1
m i=1 j=1
m j=1
Поэтому
2
⎛
n ( m +1) ⎞
s = ∑⎜ Ri −
⎟.
2
⎠
i=1 ⎝
m
Коэффициент конкордации w характеризует отношение величины s к величине smax, вычисленной для идеального случая комо-
214
нотонных ранжирований (когда все эксперты присвоили каждому
объекту одни и те же ранги). Если все предпочтения являются
строгими (отсутствуют связанные ранги), то в идеальном случае
матрица рангов имеет вид
⎛1
⎜
2
R =⎜
⎜
⎜
⎝m
1
2
m
1⎞
⎟
2⎟
⎟.
⎟
m⎠
Тогда R1 = n, R2 = 2n, … , Rm = mn, и
2
2
m
m
⎛
⎛
⎛ m +1⎞2
n ( m +1) ⎞
n ( m +1) ⎞
2
smax = ∑⎜ Ri −
⎟ = ∑⎜i ⋅ n −
⎟ = n ∑⎜i −
⎟.
⎝
2
2
2 ⎠
⎠
⎠
i=1 ⎝
i=1 ⎝
i=1
m
После преобразований получим: smax =
n2 3
(m − m) .
12
Коэффициент конкордации определяется как w =
s
, и в
smax
случае строгих предпочтений (отсутствия связанных рангов) равен
w=
12s
.
n ( m3 − m )
2
(7.3)
При наличии связанных рангов формула (7.3) может использоваться только для приближенной оценки коэффициента конкордации (значение smax определяется более громоздким выражением).
Величина коэффициента конкордации w может изменяться от 1
(в случае идеальной согласованности мнений) до значений, близких к нулю (в случае полной несогласованности).
Пример 7.3
Вернемся к экспертным оценкам пяти альтернативных проектов, представленным в таблице 7.2. Для получения предваритель-
215
ной оценки согласованности мнений экспертов вычислим значение
коэффициента конкордации.
R =
n ( m +1)
4⋅ 6
=
= 12 .
2
2
Для удобства вычислений добавим к таблице 7.2 два дополнительных столбца — см. таблицу 7.4.
Таблица 7.4
4
Оценки экспертов
Проекты
1
2
3
4
5
1
2
3
4
3
2
4
1
5
5
3
2
1
4
5
3/2
3
3/2
4
3
1
3
3
5
Ri = ∑ rij
Ri − R
16
15/2
12
13/2
18
4
–9/2
0
–11/2
6
j=1
Тогда
m
2
5
2
s = ∑ ( Ri − R ) = ∑ ( Ri −12) = 42 + ( 4 ,5) + 0 + (5,5) + 62 = 102 ,5 .
i=1
2
2
i=1
Т. к. среди индивидуальных оценок экспертов присутствуют
связанные ранги, формула (7.3) может дать только приближенное
значение коэффициента конкордации. Поэтому
w≈
12⋅102 ,5
≈ 0,64 .
16 (125 − 5)
Для выяснения, не является ли отличие найденного значения
коэффициента конкордации от нуля случайным, проверяется
гипотеза о значимости коэффициента конкордации. Значимость
этого коэффициента свидетельствует о том, что индивидуальные ранжирования являются зависимыми, т. е. согласованность
мнений экспертов не может быть отнесена за счет случайных
причин.
216
Процедура проверки гипотезы о значимости коэффициента
конкордации основана на следующих соображениях. В случае, когда n экспертов независимо друг от друга случайным образом присваивают ранги m объектам, случайная величина n(m–1)·W имеет
распределение, близкое к распределению χ2 (распределению Пирсона) с k = m–1 степенями свободы. Поэтому, если результаты экспертизы свидетельствуют о том, что распределение указанной случайной величины отлично от χ2, то следует сделать вывод:
согласованность экспертных оценок не может объясняться случайными причинами.
При заданном уровне значимости р0 проверка гипотезы о
том, что случайная величина Y имеет распределение χ2 с k степенями свободы, сводится к проверке выполнения неравенства
yнабл < χ2(р0, k), где yнабл — значение случайной величины Y, найденное по результатам наблюдений; значение χ2(р0, k) находится
по таблице критических точек распределения χ2 по заданным р0
и k. В случае yнабл ≥ χ2(р0, k) гипотеза о χ2-распределении Y должна быть отвергнута. Таким образом, для проверки значимости
коэффициента конкордации необходимо проверить выполнение
неравенства
(7.4)
n(m — 1)·w ≥ χ2(р0, m — 1)
при заданном уровне значимости р0. Выполнение этого неравенства свидетельствует о значимости коэффициента конкордации w (т. е. о неслучайности факта согласованности экспертных оценок).
Замечание.
Вычисление критических точек распределения χ2 реализовано в
MS Excel. Для получения значения χ2(р0, k) при заданных р0 и k
следует воспользоваться функцией ХИ2ОБР, задав в качестве ее
аргументов требуемые значения р0 и k.
Пример 7.4
Пусть мнения четырех экспертов относительно предпочтительности пяти альтернативных проектов представлены в виде рангов в
таблице 7.5.
217
Таблица 7.5
Оценки экспертов
Проекты
1
2
3
4
1
3
5
5
4
2
2
3
1
1
3
4
2
3
2
4
1
1
2
3
5
5
4
4
5
Для удобства вычислений составим вспомогательную таблицу 7.6.
Используя эту таблицу. Получим:
m
5
2
2
s = ∑ ( Ri − R ) = ∑ ( Ri −12) = 52 + (−5) + (−1) + (−5) + 62 = 112 ,
i=1
2
2
2
i=1
w=
12⋅112
= 0 ,7 .
16 (125 − 5)
Таблица 7.6
4
Оценки экспертов
Проекты
Ri = ∑ rij
Ri − R
1
2
3
4
1
3
5
5
4
17
5
2
2
3
1
1
7
–5
3
4
2
3
2
11
–1
4
1
1
2
3
7
–5
5
5
4
4
5
18
6
j=1
Проверим значимость коэффициента конкордации при р0 = 0,05.
В данном случае
n = 4, m = 5, n(m — 1)·w = 11,2;
218
χ2(0,05; 5 — 1) = 9,49.
Неравенство (7.4) выполняется, поэтому можно сделать вывод о
значимости коэффициента конкордации (вероятность ошибки равна 0,05).
На практике проверка значимости коэффициента конкордации
выполняется не всегда. В целях упрощения процедуры обработки
экспертных оценок часто руководствуются следующим правилом:
при w > 0,4–0,5 качество групповой оценки считается удовлетворительным;
при w ≥ 0,7–0,8 — высоким.
Анализ результатов экспертизы может включать также оценку
степени расхождения между индивидуальными предпочтениями.
Например, в задаче экспертного ранжирования объектов расстояние между индивидуальными ранжированиями k-го и l-го экспертов в случае строгих предпочтений может быть оценено коэффициентом корреляции Спирмена:
m
ρkl = 1−
6
(rik − ril )2 .
∑
3
m − m i=1
Величина этого коэффициента может изменяться от 1 (в случае
идеальной согласованности мнений) до –1 (в случае полной их
противоположности). Близость к нулю значения коэффициента ρkl
говорит о слабой согласованности мнений двух данных экспертов.
7.2. áÄÑÄçàÖ Ñãü ëÄåéëíéüíÖãúçéÉé ÇõèéãçÖçàü
Задание 7.1
Необходимо определить коллективную оценку (групповое ранжирование) различных форм обучения с точки зрения их влияния
на качество усвоения материала по специальным дисциплинам.
Для получения групповой оценки организовать экспертизу, привлекая в качестве экспертов студентов из своей учебной группы.
Опрос экспертов выполнить в форме анкетирования; форма анкеты
представлена в таблице 7.7.
219
Таблица 7.7
№ п/п
Форма обучения
1
2
3
4
5
6
6
7
8
Курсовое проектирование
Домашние задания
Самостоятельная работа с литературой
Лекции
Практические (лабораторные) занятия
Консультации у преподавателей
Факультативные занятия
Написание рефератов и подготовка сообщений
Производственная практика
Личный ранг
В ходе проведения экспертизы и обработки полученных индивидуальных оценок выполнить следующие действия.
1. Выставить собственные ранговые оценки в третьем столбце
анкеты (таблица 7.7). Опросить в качестве экспертов еще трех
студентов из своей учебной группы и зафиксировать полученные оценки.
2. Построить матрицу рангов.
3. Выполнить проверку согласованности мнений группы экспертов.
1) Определить коэффициент конкордации.
2) Оценить значимость коэффициента конкордации (выбрать
уровень значимости 0,05) и сделать вывод о согласованности
мнений в группе.
4. По имеющимся индивидуальным оценкам определить вектор
компетентности экспертов q = (q1, q2, q3, q4)T и построить групповое ранжирование объектов с учетом полученных показателей компетентности.
5. Выполнить оценку степени согласованности собственного и
группового ранжирования с помощью коэффициента корреляции Спирмена.
6. Оформить отчет. Содержание отчета:
1) Собственные ранговые оценки.
2) Матрица рангов.
220
3) Коэффициент конкордации и анализ его значимости. Привести все необходимые расчеты.
4) Веса компетентности экспертов и итоговое групповое ранжирование. Привести все расчеты, необходимые для их получения.
5) Оценка согласованности собственного и группового ранжирования.
6) Анализ результатов (возможные причины несогласованности мнений, если они имеются; предложения по использованию
результатов опроса; дополнительные факторы, которые следовало бы включить в анкету; другие предложения).
221
ëèàëéä ãàíÖêÄíìêõ
Основная литература
1. Петровский А.Б. Теория принятия решений. М.: Издательский
центр «Академия», 2009.
2. Ларичев О.И. Теория и методы принятия решений. М.: Логос,
2008.
Дополнительная литература
3. Кини Р.Л., Райфа Х. Принятие решений при многих критериях:
предпочтения и замещения. М.: Радио и связь, 1981.
4. Ларичев О.И. Объективные модели и субъективные решения.
М.: Наука, 1987.
5. Ларичев О.И., Мошкович Е.М. Качественные методы принятия
решений. Вербальный анализ решений. М.: Наука. Физматлит,
1996.
6. Миркин Б.Г. Проблема группового выбора. М.: Наука. Физматлит, 1984.
7. Моисеев Н.Н. Математические задачи системного анализа. М.:
Наука, 1981.
8. Соколов А.В., Токарев В. В. Методы оптимальных решений.
Том 1. Общие положения. Математическое программирование.
М.: Физматлит, 2011.
9. Саати Т. Принятие решений. Метод анализа иерархий. М.: Радио и связь, 1993.
10. Саати Т., Кернс К. Аналитическое планирование. Организация
систем. М.: Радио и связь, 1991.
11. Таха, Хемди А. Введение в исследование операций. М.: Издательский дом «Вильямс», 2005.
222
12. Токарев В. В. Методы оптимальных решений. Том 2. Многокритериальность. Динамика, Неопределенность. М.: Физматлит,
2012.
13. Черноморов Г.А. Теория принятия решений: учебное пособие/Юж.-Рос. гос. техн. ун-т. Новочеркасск: Ред. журн. «Известия Вузов. Электромеханика», 2002.
14. Экономико-математическое моделирование: учебник для студентов вузов /Под редакцией Дрогобыцкого И.Н. М.: Издательство «Экзамен», 2004.
223
Учебное издание
Мария Сергеевна ЦЫГАНОВА
МАТЕМАТИЧЕСКИЕ
И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ
ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ
Учебное пособие
В авторской редакции
Технический редактор
Компьютерная верстка
Компьютерный дизайн
обложки
Печать электрографическая
Н. Г. Яковенко
Н. С. Власова
И. А. Штоль
О. А. Булашов, И. А. Штоль
Подписано в печать 17.07.2013. Тираж 105 экз.
Объем 14,0 усл. печ. л. Формат 60×84/16. Заказ 587.
Издательство Тюменского государственного университета
625003, г. Тюмень, ул. Семакова, 10.
Тел./факс (3452) 45-56-60; 46-27-32
E-mail: [email protected]
224
Скачать