Теория принятия решений

advertisement
Первухин Михаил Александрович
Доцент кафедры
математики и моделирования
Список литературы
О.И. Ларичев «Теория и методы принятия решений»
А.И. Орлов «Теория принятия решений»
А.Т. Зуб «Принятие управленческих решений»
А.Г. Мадера «Моделирование и принятие решений в
менеджменте»
Основные понятия и определения
Теория принятия решений  область
исследования, использующая понятия и методы
математики,
статистики,
экономики,
менеджмента и психологии с целью изучения
закономерностей выбора людьми путей решения
разного рода задач, а также способов поиска
наиболее выгодных из возможных решений.
Принятие решений в профессиональном отношении представляет собой особый вид человеческой
деятельности, который состоит в обоснованном
выборе наилучшего в некотором смысле варианта
или нескольких предпочтительных вариантов из
имеющихся возможных.
Люди и их роли в
процессе принятия решений
Лицо, принимающее решения (ЛПР)  человек,
фактически осуществляющий выбор наилучшего
варианта действий.
Владелец проблемы — человек, который, по мнению
окружающих, должен решать данную проблему и несёт
ответственность за принятые решения.
Руководитель или участник активной группы —
группы людей, имеющих общие интересы и
старающихся оказать влияние на процесс выбора и
его результат.
Эксперт  профессионал в той или иной области, к
которому обращаются за оценками и рекомендациями все люди, вовлечённые в процесс принятия
решений.
Консультант по принятию решений. Его роль
сводится к разумной организации процесса
принятия решений: помощи ЛПР и владельцу проблемы в правильной постановке задачи, выявлении
позиций активных групп, организации работы с
экспертами.
Альтернативы
Альтернатива  вариант действия.
Альтернативы  неотъемлемая часть проблемы принятия решений: если не из чего выбирать, то нет и
выбора.
Альтернативы бывают зависимыми и независимыми.
Независимыми являются те альтернативы, любые
действия с которыми (удаление из рассмотрения,
выделение в качестве единственно лучшей) не
влияют на качество других альтернатив.
При зависимых альтернативах оценки одних из
них оказывают влияние на качество других.
Наиболее простым примером зависимости является
непосредственная групповая зависимость: если
решено рассматривать хотя бы одну альтернативу из
группы, то надо рассматривать и всю группу.
Критерии
Критерии
 показатели привлекательности
различных вариантов решений для ЛПР.
Критерии могут быть зависимыми и независимыми.
Предположим, что две сравниваемые альтернативы
имеют различные оценки по первой группе
критериев и одинаковые по второй группе.
Принято считать критерии зависимыми, если
предпочтения ЛПР при сравнении альтернатив
меняются в зависимости от значений одинаковых
оценок по второй группе критериев.
Шкалы оценок
Использование критериев для оценки альтернатив
требует определения градаций качества: лучших,
худших и промежуточных оценок. Иначе говоря,
существуют шкалы оценок по критериям.
В принятии решений принято различать шкалы
непрерывных и дискретных оценок, шкалы
количественных и качественных оценок.
Шкала порядка — оценки упорядочены по
возрастанию или убыванию качества. Примером
может служить шкала экологической чистоты
района около места жительства:
 очень чистый район;
 вполне удовлетворительный по чистоте;
 экологическое загрязнение велико.
Шкала равных интервалов — интервальная шкала.
Для этой шкалы имеются равные расстояния по
изменению качества между оценками.
Например, шкала дополнительной прибыли для
предпринимателя может быть следующей: 1 млн, 2
млн, 3 млн и т.д.
Для интервальной шкалы характерно, что начало
отсчёта выбирается произвольно, так же как и шаг
(расстояние между оценками ) шкалы.
Шкала пропорциональных оценок  идеальная
шкала. Примером является шкала оценок по
критерию стоимости, отсчёт в которой начинается с
установленного значения (например, с нулевой
стоимости).
Процесс принятия решений
Саймон выделяет три этапа процесса принятия
решений.
I этап Поиск информации. Собирается вся
доступная на момент принятия решения
информация: фактические данные, мнение экспертов. Если возможно, строятся математические модели; проводятся социологические
опросы; определяются взгляды на проблему со
стороны активных групп, влияющих на её решение.
II этап Поиск альтернатив. Заключается в
определении того, что можно, а чего нельзя делать в
имеющейся ситуации, т. е. с выделением вариантов
решений (альтернатив).
III этап Выбор лучшей альтернативы. Включает в
себя сравнение альтернатив и выбор наилучшего
варианта (или вариантов) решения.
Множество Эджворта-Парето
Назовём альтернативу А доминирующей по
отношению к альтернативе В, если по всем
критериям оценки альтернативы А не хуже, чем
альтернативы В, а хотя бы по одному критерию
оценка А лучше. При этом альтернатива В
называется доминируемой.
Пример. Предположим, что некоторый человек
выбирает автомобиль по двум критериям: стоимость
и вместительность
салона. Из множества
предложенных вариантов он остановился на трёх.
Альтернативы
Критерий
Стоимость
Вместительность
1. Газель
Небольшая
Большая
2. Лада
Небольшая
Малая
Большая
Большая
3. Тойота
Вместительность
Большая
3
1
2
Малая
Высокая
Небольшая
Стоимость
Предположим, что по какой-то причине покупка
Газели невозможна. Тогда альтернативы 2 и 3 не
находятся в отношении доминирования. По одному
из критериев лучше альтернатива 2, по другому –
альтернатива 3.
Предположим, что задана группа альтернатив.
Сравним попарно все альтернативы и исключим те
из них, которые доминируют хотя бы одной из
оставшихся альтернатив. Тогда оставшиеся
(недоминируемые) альтернативы принадлежат множеству Эджворта-Парето (Э-П).
Альтернативы, принадлежащие множеству Э-П,
невозможно сравнить непосредственно на основе
критериальных оценок. Но если решение должно
быть
принято,
то
сравнение
альтернатив,
принадлежащих множеству Э—П, возможно на
основе дополнительной информации
Типовые задачи принятия решений
Основные задачи принятия решений.
1. Упорядочение альтернатив. Для ряда задач
возникает потребность определить порядок на
множестве альтернатив.
2. Распределение альтернатив по классам решений.
3. Выделение лучшей альтернативы. Эта задача
традиционно считалась одной из основных в
принятии решений. Она часто встречается на
практике.
Аксиоматические теории
рационального поведения
Рациональный выбор в экономике
Основное допущение экономической теории состоит
в том, что человек делает рациональный выбор.
Рациональный выбор означает предположение, что
решение
человека
является
результатом
упорядоченного процесса мышления.
Кроме этого, водится ряд предположений о
поведении
человека,
которые
называются
аксиомами рационального поведения.
При условии, что эти аксиомы справедливы,
доказывается теорема о существовании некой
функции, устанавливающей человеческий выбор, —
функции полезности. Полезностью называют
величину,
которую
в
процессе
выбора
максимизирует
личность
с
рациональным
экономическим мышлением. Можно сказать, что
полезность — это воображаемая мера психологической и потребительской ценности различных благ.
Аксиомы рационального поведения
Обозначим через х, у, z различные исходы
(результаты) процесса выбора, а через р, q
вероятности тех или иных исходов.
Введём определение лотереи. Лотереей называется
игра с двумя исходами: исходом х, получаемым с
вероятностью р, и исходом у, получаемым с
вероятностью 1-р. Это записывается коротко (x, p , y).
p
x
1-p
y
Аксиома 1. Исходы х, у, z принадлежат множеству А
исходов.
Аксиома 2. Пусть Р означает строгое предпочтение
(похожее на отношение > в математике); R —
нестрогое предпочтение (похожее на отношение >); I
— безразличие (похожее на отношение =). Аксиома 2
требует выполнения двух условий:
 связанности: либо xRy, либо yRx, либо то и другое
вместе;
 транзитивности: из xRy и yRz следует xRz.
Аксиома 3. Две представленные на рисунке лотереи
находятся в отношении безразличия.
q
1-q
p
x
1-p
y
y
pq
x
1-pq
y
Справедливость этой аксиомы очевидна.
записывается в стандартном виде как
((х, р, y), q, у) I (х, pq, у).
Она
Аксиома 4. Если xIy, то (х, р, z) I (у, р, z).
Аксиома 5. Если хРу, то х Р(х, р, у) Р у.
Аксиома 6. Если x P y P z, то существует вероятность
р, такая что y I (x, р, z).
Теорема. Если аксиомы 1—6 выполняются, то
существует числовая функция U, определённая на
множестве исходов А и такая, что:
 xRy тогда и только тогда, когда U(x)> U(y);
 U(x, р, у) = pU(x)+(l-p)U(y).
Задачи с вазами
Ваза - это непрозрачный сосуд, в котором находится
определённое (известное лишь организатору
эксперимента) количество шаров различного цвета.
Задачи с вазами типичны для группы наиболее
простых задач принятия решений - задач
статистического типа.
Типовая задача
Перед испытуемым ставится ваза, которая может
быть вазой 1-го или 2-го типа. Даётся следующая
информация: сколько имеется у экспериментатора
ваз 1-го и 2-го типов; сколько черных и красных
шаров в вазах 1-го и 2-го типов; какие выигрыши
ожидают испытуемого, если он угадает, какого типа
ваза; какие проигрыши ожидают его, если он
ошибётся.
После получения такой информации испытуемый
должен сделать выбор: назвать, к какому типу
принадлежит поставленная перед ним ваза.
Пусть,
например,
экспериментатор случайно
выбирает вазу для испытуемого из множества,
содержащего 700 ваз 1-го типа и 300 ваз 2-го типа.
Пусть в вазе 1-го типа содержится 6 красных шаров и
4 черных. В вазе 2-го типа содержится 3 красных и 7
черных шаров.
Если перед испытуемым находится ваза 1-го типа и
он угадает это, то получит выигрыш 350 д. е., если не
угадает, его проигрыш составит 50 д. е.
Если перед ним ваза 2-го типа и он это угадает, то
получит выигрыш 500 д. е., если не угадает, его
проигрыш составит 100 д. е.
Испытуемый может предпринять одно из следующих
действий:
 d1 — сказать, что ваза 1-го типа;
 d2 — сказать, что ваза 2-го типа.
Тип вазы
Вероятность
выбора вазы
1
2
0,7
0,3
Действия и выигрыши
d1
d2
350
-100
-50
500
Теория полезности советует в данной ситуации
оценить среднюю (ожидаемую) полезность
каждого из действий и выбрать действие с
максимальной
ожидаемой
полезностью.
В
соответствии с этой рекомендацией мы можем
определить среднее значение выигрыша для каждого
из действий:
 U(d1)= 0,7 ∙350 - 0,3 ∙ 50=230 д.е;
 U(d2)= 0,3 ∙ 500 - 0,7 ∙ 100=80 д.е.
Деревья решений
Дерево решений – графическое представление
процесса принятия решения, в котором отображаются возможные варианты решений, состояний
природы, вероятности их наступления, а также
платежи (выигрыши или убытки) при различных
сочетаниях состояний природы и возможных
решениях.
Дерево решений состоит из узлов и ветвей. Узлы и
ветви могут быть трёх видов.
Узел решений соответствует моменту
времени, в котором ЛПР принимает
решение
Узел событий соответствует моменту
времени, в котором исходы решений
носят случайный характер
Конечный узел
 Ветви решений исходят из узла решений и
соответствуют возможным решения, возле ветвей
решений
проставляются
величины
затрат,
связанные с принятием данного решения.
 Ветви событий исходят из узла событий и
соответствуют случайным исходам решений, возле
каждой ветви событий проставляется вероятность
соответствующей неопределённости.
 Конечные ветви заканчивают дерево решений и
оканчиваются конечными узлами, возле которых
проставляются
соответствующие
значения
платежа.
Дерево решений задачи с вазами
0,7
350
d1
0,3
-50
d2
0,7
-100
0,3
500
Парадокс Алле
Возникает вопрос: нельзя ли заменить ЛПР
автоматом и сохраняются ли при этом какие-то
особенности человеческого поведения? Для ответа
на этот вопрос рассмотрим известный парадокс
Алле, представленный двумя лотереями.
1 млн
A
5 млн
0,1
B
0,89
1 млн
0,01
0
0,1
5 млн
C
0,9
0
D
0,11
1 млн
0,89
0
Обозначим: U(5 млн)=1; U(l млн)=U; U(0)=0. В левой
лотерее есть выбор между действиями А (получить 1
млн) и В (согласиться на лотерею). Подавляющее
большинство людей предпочитает А. Из этого
следует 𝑈 > 0,1 ∙ 1 + 0,89 ∙ 𝑈 или 𝑈 > 10/11.
В правой лотерее есть выбор между действиями С и
D (две лотереи). Подавляющее большинство людей
предпочитает действие С (почти та же вероятность
проиграть, но выигрыш больше). Тогда
1 ∙ 0,1 > 0,11 ∙ 𝑈, т. е. 𝑈 < 10/11.
0,6
50
0,5
44
0,4
-20
0,5
0
Нерациональное поведение
«Дилемма генерала»: Генерал потерпел поражение в
войне и хочет вывести свои войска (600 чел.) с
территории противника. У него есть две возможные
дороги, и разведка дала оценки возможных потерь
при выборе каждой из них. Данные о дорогах и
возможных потерях представлены на рисунке
200 чел спасены
Дорога 1
1/3
600 чел
спасены
Дорога 2
2/3
0 чел
спасены
400 чел погибнут
Дорога 1
1/3
Никто не
погибнет
Дорога 2
2/3
Все
погибнут
Приёмы, применяемые в
процессе принятия решений
Суждение по представительности. Люди часто
судят о вероятности того, что объект А принадлежит
к классу В только по похожести А на типовой объект
класса В. Они почти не учитывают априорные
вероятности, влияющие на эту принадлежность.
Суждение
по
встречаемости.
Люди
часто
определяют вероятности событий по тому, как часто
они сами сталкивались с этими событиями и
насколько важными для них были эти встречи.
Суждение по точке отсчёта. Если при определении
вероятностей используется начальная информация
как точка отсчёта, то она существенно влияет на
результат.
Сверхдоверие. В экспериментах было показано, что
люди чрезмерно доверяют своим суждениям,
особенно в случаях, когда они выносят суждение о
прошлых событиях.
Стремление к исключению риска. Многочисленные
работы показывают, что как в экспериментах, так и в
реальных ситуациях люди стремятся исключить
ситуации, связанные с риском.
Причины нерациональности
человеческого поведения
 недостаток информации у ЛПР в процессе выбора;
 недостаточный опыт ЛПР: он находится в процессе
обучения и поэтому меняет свои предпочтения;
 ЛПР стремится найти решение, оптимальное с
точки зрения совокупности критериев (целей),
строго упорядоченных по важности, но не может
его найти;
 различие между объективно требуемым временем
для реализации планов
и субъективным
горизонтом планирования ЛПР.
Моделирование в теории
принятия решений
Различают три вида моделей:
 Аналоговые.
 Физические.
 Математические.
Аналоговая модель - это модель, основанная на
аналогии
или
подобии
между
объектами,
операциями или процессами, имеющими различную
физическую природу.
Физическая модель - это уменьшенная в несколько
раз материальная копия исследуемого объекта в
основных,
наиболее
существенных
чертах,
воспроизводящая реальный объект в искусственно
созданных условиях, имитирующих реальные
окружающие условия и воздействия.
Математическая модель – это идеализированный образ реального объекта, выраженный в
математических
понятиях
и
символах,
с
определенной степенью адекватности отражающий
наиболее существенные свойства и характеристики
реального объекта.
В теории принятия решений выделяют три класса
моделей:
 Принятие решений в условиях определённости.
 Принятие решений в условиях риска.
 Принятие
решений
в
условиях
полной
неопределённости.
Окружающие
условия,
обстановка
или
обстоятельства, в которых необходимо действовать
при осуществлении операций, получили название
природы.
В моделях в условиях полной определённости
имеется несколько альтернатив (их может быть и
бесконечно много), а о природе все точно известно и
у неё имеется только одно-единственное состояние.
Модели в условиях риска характеризуются наличием
нескольких альтернатив и нескольких состояний
природы,
относительно
которых
известны
вероятности их наступления.
В моделях в условиях полной неопределённости
имеется несколько альтернатив и несколько
состояний природы, но о вероятностях их
наступления ничего неизвестно в принципе.
Платежная матрица
Альтернативы
Платежи при различных состояниях
природы
С1
…
С𝑛
𝐴1
𝑎11
…
𝑎1𝑛
𝐴2
𝑎21
…
𝑎2𝑛
…
…
…
…
𝐴𝑚
𝑎𝑚1
…
𝑎𝑚𝑛
Алгоритм составления
платежной матрицы
 исходя из проводимой операции или мероприятия, в




котором
необходимо
принимать
решение,
определяется понятие природы;
определяются все возможные состояния природы
𝐶1 , 𝐶2 , … , 𝐶𝑛 которые могут реализоваться в действительности;
вырабатываются все возможные варианты решений
𝐴1 , 𝐴2 , … , 𝐴𝑛 ;
определяется формула для расчета величины платежа
(выигрыша или убытка),
последовательно, одно за другим, начиная с первого,
просматривается каждое решение при каждом
состоянии природы и определяются значения
платежей 𝑎𝑖𝑗 , 𝑖 = 1,2, … , 𝑚, 𝑗 = 1,2, … , 𝑛.
Модель торговца
прохладительными напитками
Сезонный
торговец
прохладительными
напитками продает напитки в сезон (в августе), а
заказать их поставку от оптовика и оплатить заказ он
должен уже в марте. Оптовик поставляет
прохладительные напитки только малыми (1000 л),
средними (2000 л) или крупными (3000 л) партиями.
Торговец закупает напитки в марте по цене 1 ден.
ед./л, продает их в августе по цене 1,5 ден. ед./л, а
если к концу сезона (к сентябрю) у него остаются
нераспроданные напитки, он возвращает их
оптовику, но уже по цене 0,7 ден. ед./л.
По своему прошлому опыту торговец знает, что
объемы продаж прохладительных напитков зависят
от состояния погоды в августе. Так, если в августе
будет холодно, то объем продаж составит скорей
всего 500 л, если прохладно — 900 л, если тепло —
2000 л и если жарко — 2800 л.
Торговцу необходимо принять решение о том,
какую партию прохладительных напитков ему
следует заказать у оптовика в марте, чтобы получить
наибольшую прибыль от их продажи в августе.
Природа – состояние погоды в августе.
 Холодно (С1 ) – низкий спрос (500 л).
 Прохладно (С2 ) – средний спрос (900 л).
 Тепло (С3 ) – хороший спрос (2000 л).
 Жарко (С4 ) – отличный спрос (2800 л).
Возможные решения:
 закупить 1000 л (𝐴1 );
 закупить 2000 л (𝐴2 );
 закупить 3000 л (𝐴3 ).
{Платёж}={Доходы от продажи}-{Затраты}+
{Выручка от возврата нераспроданных напитков}
Платёжная матрица торговца прохладительными напитками
Альтернативы
Прибыль
Холодно (С1 )
(спрос 500 л)
Прохладно (С2 )
(спрос 900 л)
Тепло (С3 )
(спрос 2000 л)
Жарко (С4 )
(спрос 2800 л)
𝐴1
100
420
500
500
𝐴2
-200
120
1000
1000
𝐴3
-500
-180
700
1340
Пример расчёта платежа
Если в августе будет холодно, то доход продавца
составит 1,5 ден. ед./л х 500 л = 750 ден. ед., выручка
от возврата напитков 0,7 ден. ед./л х 1500 л = 1050 ден.
ед. и прибыль (точнее убыток), составит 750 - 2000
ден. ед. + 1050 ден. ед. = = -200 ден. ед. Это значение
заносится в матрицу платежей в ячейку,
образованную пересечением второй строки и
первого столбца.
Матрица рисков
Матрица рисков показывает, насколько рискует ЛПР,
приняв неоптимальное решение при данном
состоянии природы, и насколько при этом будут
велики его убытки. Чем сильнее отличается
принятое
решение
от
оптимального,
тем
значительнее будет величина убытков и степень
риска.
Алгоритм составления матрицы
рисков
 построить платежную матрицу,
 в каждом столбце матрицы платежей, т. е. при каждом
состоянии природы, найти максимальное значение
платежа 𝑚𝑎𝑥{𝑎𝑖𝑗 } , 𝑗 = 1, 2, … , 𝑛,
 на пересечении каждой строки i, соответствующей
данной альтернативе, и каждого столбца j, вычисляется
значение риска 𝑟ij = 𝑚𝑎𝑥{𝑎𝑖𝑗 } − 𝑎𝑖𝑗 , равное разности
между максимальным значением платежа в данном
столбце и платежом, соответствующем данному
решению,
 предыдущий этап вычисления рисков повторить для
всех столбцов матрицы платежей.
Матрица рисков торговца прохладительными напитками
Альтернативы
Риски
Холодно (С1 )
(спрос 500 л)
Прохладно (С2 )
(спрос 900 л)
Тепло (С3 )
(спрос 2000 л)
Жарко (С4 )
(спрос 2800 л)
𝐴1
0
0
500
840
𝐴2
300
300
0
340
𝐴3
600
600
300
0
Примеры расчёта рисков
𝑟11 = max 𝑎𝑖1 − 𝑎11 = 100 − 100 = 0
𝑟21 = max 𝑎𝑖2 − 𝑎21 = 100 − −200 = 300
𝑟31 = max 𝑎𝑖3 − 𝑎31 = 100 − (−500) = 600
Модели принятия решений в
условиях риска
Полная группа состояний природы.
Состояния природы С1 , С2 , … , С𝑛 в моделях принятия
решений в условиях риска являются случайными
явлениями. Будем считать что они образуют полную
группу несовместных событий. Это означает, что
какое-либо одно состояние природы обязательно
реализуется в действительности и, кроме того,
никакие два состояния природы не могут появится
одновременно.
В этом случае вероятности наступления состояний
природы
𝑝1 , 𝑝2 , … , 𝑝𝑛 должны
удовлетворять
равенству:
𝑝1 + 𝑝2 +… +𝑝𝑛 = 1.
Ожидаемое значение случайной
величины
Если некоторая случайная величина 𝑥 может
принимать одно из своих возможных значений
𝑥1 , 𝑥2 , … , 𝑥𝑛 с соответствующими вероятностями
𝑝1 , 𝑝2 , … , 𝑝𝑛 , то ожидаемое значение 𝑥 случайной
величины 𝑥 определяется как сумма произведений
всех её возможных значений на их вероятности, т. е.
𝑥 = 𝑥1 𝑝1 + 𝑥2 𝑝2 +… +𝑥𝑛 𝑝𝑛 .
В моделях принятия решений в условиях риска для
выбора наилучшего решения используются два
критерия (или метода, основанного на критериях):
 критерий максимального ожидаемого платежа
(выигрыша),
 критерий минимального ожидаемого риска.
Критерий максимального
ожидаемого платежа
Принятие решений по критерию максимального
ожидаемого платежа основывается на модельном
представлении операции в виде платёжной
матрицы,
а
выбор
наилучшего
решения
осуществляется по максимальному значению
ожидаемого платежа среди ожидаемых платежей для
всех возможных решений.
Алгоритм
 построить платёжную матрицу,
 для каждой альтернативы 𝐴𝑖 ( 𝑖 = 1,2, … ,m), т. е.
для каждой строки матрицы платежей, вычислить
ожидаемое значение платежа
𝑎𝑖 = 𝑎𝑖1 𝑝1 + 𝑎𝑖2 𝑝2 +… +𝑎𝑖𝑛 𝑝𝑛 ,
 среди всех вычисленных значений ожидаемых
платежей 𝑎𝑖 ( 𝑖 = 1,2, … ,m) выбрать максимальное
значение 𝑚𝑎𝑥{𝑎𝑖 },
 оптимальное решение соответствует полученному
значению 𝑚𝑎𝑥{𝑎𝑖 }.
Применение к модели торговца
прохладительными напитками в
условиях риска
Предположим, что торговец напитками оценил
вероятности наступления холодной, прохладной,
теплой и жаркой погоды в августе следующими
величинами
 𝑝1 = {Вероятность холодной погоды) =0,1;
 𝑝2 = {Вероятность прохладной погоды} = 0,2;
 𝑝3 = {Вероятность теплой погоды} = 0,4;
 𝑝4 = {Вероятность холодной погоды} = 0,3.
Прибыль
Значения
ожидаемых
платежей
𝒂𝒊
Холодно
(С1 )
(спрос
500 л)
Прохладно
(С2 )
(спрос
900 л)
Тепло
(С3 )
(спрос
2000 л)
Жарко
(С4 )
(спрос
2800 л)
𝑝1 = 0,1
𝑝2 = 0,2
𝑝3 = 0,4
𝑝4 = 0,3
𝐴1
100
420
500
500
444
𝐴2
-200
120
1000
1000
704
𝐴3
-500
-180
700
1340
596
Альтернативы
Примеры вычисления
ожидаемых платежей
𝑎1 = 100 ∙ 0,1 + 420 ∙ 0,2 + 500 ∙ 0,4 + 500 ∙ 0,3 = 444
𝑎2 = −200 ∙ 0,1 + 120 ∙ 0,2 + 1000 ∙ 0,4 +
+1000 ∙ 0,3 = 704
𝑎3 = −500 ∙ 0,1 + −180 ∙ 0,2 + 700 ∙ 0,4 +
+1340 ∙ 0,3 = 596
Критерий минимального
ожидаемого риска
Алгоритм:
 построить матрицу рисков,
 для каждой альтернативы A𝑖 (𝑖 = 1, 2, … , 𝑚), т. е. в
каждой строке матрицы рисков, вычислить
ожидаемое значение риска
𝑟𝑖 = 𝑟𝑖1 𝑝1 + 𝑟𝑖2 𝑝2 +… +𝑟𝑖𝑛 𝑝𝑛 ,
 среди всех вычисленных значений ожидаемого
риска 𝑟𝑖 (𝑖 = 1, 2, … , 𝑚) выбрать минимальное
значение, т. е. величину равную
min 𝑟𝑖 ,
𝑖
 оптимальное решение соответствует минимальной
величине ожидаемого риска min 𝑟𝑖 .
𝑖
Применение к модели торговца
прохладительными напитками
Прибыль
Значения
ожидаемых
рисков
𝒓𝒊
Холодно
(С1 )
(спрос
500 л)
Прохладно
(С2 )
(спрос
900 л)
Тепло
(С3 )
(спрос
2000 л)
Жарко
(С4 )
(спрос
2800 л)
𝑝1 = 0,1
𝑝2 = 0,2
𝑝3 = 0,4
𝑝4 = 0,3
𝐴1
0
0
500
840
452
𝐴2
300
300
0
340
192
𝐴3
600
600
300
0
300
Альтернативы
Вычисление ожидаемых рисков
 𝑟1 = 0 ∙ 0,1 + 0 ∙ 0,2 + 500 ∙ 0,4 + 840 ∙ 0,3 = 452
 𝑟2 = 300 ∙ 0,1 + 300 ∙ 0,2 + 0 ∙ 0,4 + 340 ∙ 0,3 = 192
 𝑟3 = 600 ∙ 0,1 + 600 ∙ 0,2 + 300 ∙ 0,4 + 0 ∙ 0,3 = 300
Модели принятия решений в
условиях неопределенности
Примеры неопределенностей, для которых нельзя
получить обоснованные значения вероятностей:
 спрос и объемы продаж на действительно новую
продукцию, которой ранее на рынке не было;
 состояние фондового рынка, рынка товаров и услуг, и
вообще экономики в будущем (через месяц, год,
несколько лет и т. д.);
 успех или неуспех новой книги, нового фильма,
телепередачи и т. п.;
 возникновение
природных,
социальных
и
экономических катаклизмов;
 молодежные музыкальные течения, и вообще
состояние культуры через несколько лет.
Методы принятия решений в
условиях неопределенности
 критерий Лапласа;
 максиминный критерий (критерий Вальда);
 максимаксный критерий;
 критерий
минимаксного
риска
(критерий
Сэвиджа);
 критерий
Гурвица).
пессимизма-оптимизма
(критерий
Модель выбора акций
Инвестор желает инвестировать свои деньги в акции
одной из трех фирм, W, V и U. Прогнозируемые
доходы на одну акцию (см. табл.) зависят от
состояния экономики в будущем (например, через
месяц, квартал, год и т. д.), которые инвестор
оценивает как неблагоприятное, благоприятное и
отличное.
Акции какой фирмы следует выбрать инвестору?
Платежная матрица операции инвестиций в акции
Акции
фирм
Доход на одну акцию при различных
состояниях экономики в будущем, %
Неблагоприятное
(С 1 )
Благоприятное
(С 2 )
Отличное
(С 3 )
W
-9
15
28
V
2
12
18
U
-7
10
30
Матрица рисков инвестиций в акции
Акции
фирм
Риск инвестора на одну акцию при различных
состояниях экономики в будущем, %
Неблагоприятное
(С 1 )
Благоприятное
(С 2 )
Отличное
(С 3 )
W
11
0
2
V
0
3
12
U
9
5
0
Критерий Лапласа
Для принятия решения по критерию Лапласа, по
матрице платежей и для каждой альтернативы 𝐴𝑖 ,
вычисляется значение ожидаемого платежа 𝑎𝑖 ,
которое с учетом равенства вероятностей (р)
наступления всех состояний природы равно
𝑎𝑖 =𝑝 𝑎𝑖1 + 𝑎𝑖2 + … + 𝑎𝑖𝑛 .
Множитель р одинаков для всех альтернатив,
поэтому его можно опустить и просто вычислить
сумму платежей 𝑙𝑖 (критерий Лапласа) для каждой
альтернативы 𝐴𝑖 по всем состояниям природы, т. е.
𝑙𝑖 = 𝑎𝑖1 + 𝑎𝑖2 + … + 𝑎𝑖𝑛 .
Наилучшему решению соответствует та альтернатива, которая имеет максимальное значение
критерия Лапласа
𝑙𝑚𝑎𝑥 = max 𝑙𝑖 .
𝑖
Алгоритм
 построить платежную матрицу;
 для каждой альтернативы 𝐴𝑖 , 𝑖 = 1, 2, … , 𝑚, т. е. в
каждой строке платежной матрицы вычислить
сумму платежей 𝑙𝑖 = 𝑎𝑖1 + 𝑎𝑖2 + … + 𝑎𝑖𝑛 ;
 среди всех значений 𝑙𝑖 , 𝑖 = 1, 2, … , 𝑚 выбрать
максимальное значение 𝑙𝑚𝑎𝑥 = max 𝑙𝑖 .;
𝑖
 наилучшим считается решение, соответствующее
максимальному значению ожидаемого платежа
(𝑙𝑚𝑎𝑥).
Применение критерия Лапласа к
модели выбора акций
Акции фирм
Критерий Лапласа
W
𝑙1 = (-9)+ 15 + 28 = 34
V
𝑙2 = 2+ 12+ 18 = 32
U
𝑙3 = (-7)+ 10 + 30 = 33
Максиминный критерий
(критерий Вальда)
Критерий позволяет принимать такое решение, которое
гарантирует некоторый выигрыш даже при наступлении
самого неблагоприятного состояния природы, так что
при реализации более благоприятных состояний
природы ЛПР получит больший выигрыш.
Применение максиминного критерия оправдано для
осторожного, не склонного к риску ЛПР, а также в
ситуациях, в которых получение отрицательного
результата недопустимо, например, когда речь идет о
безопасности людей и их здоровье.
Алгоритм
 построить платежную матрицу;
в
каждой строке платежной матрицы ( 𝑖 ),
соответствующей определенному возможному
решению 𝐴𝑖 , выбрать минимальную величину платежа
𝑣𝑖 = min{𝑎𝑖𝑗 } ,
𝑖 = 1, 2, … , 𝑚;
𝑗
 из всех найденных минимальных платежей 𝑣𝑖 , 𝑖 =
1, 2, … , 𝑚 выбрать максимальное значение 𝑣𝑚𝑎𝑥 =
max 𝑣𝑖 = max {min{𝑎𝑖𝑗 }};
𝑖
𝑖
𝑗
 решение, которому соответствует найденная на
предыдущем
наилучшим.
Акции
фирм
этапе
величина
𝑣𝑚𝑎𝑥 и
будет
Минимальное значение платежа
𝑣𝑖 = min{𝑎𝑖𝑗 }
𝑗
для каждой альтернативы
W
𝑣1 = -9
V
𝑣2 = 2
U
𝑣3 = -7
Максимаксный критерий
ЛПР, применяющий максимаксный критерий,
склонен к риску и верит, что наступит такое
состояние природы, при котором его выигрыш будет
наибольшим. Для такого ЛПР выигрыш имеет
большую значимость, чем проигрыш (выигрыш —
все, проигрыш — ничто).
Алгоритм
 построить платежную матрицу;
в
каждой строке платежной матрицы ( 𝑖 ),
соответствующей
определенному
возможному
решению 𝐴𝑖 , выбрать максимальную величину платежа
𝑚𝑖 = max{𝑎𝑖𝑗 } ,
𝑖 = 1, 2, … , 𝑚;
𝑗
 из всех найденных максимальных платежей 𝑚𝑖 , 𝑖 =
1, 2, … , 𝑚 выбрать максимальное значение
𝑚𝑚𝑎𝑥 = max 𝑚𝑖 = max {max{𝑎𝑖𝑗 }};
𝑖
𝑖
𝑗
 решение, которому соответствует найденная на преды-
дущем этапе величина 𝑚𝑚𝑎𝑥 и будет наилучшим.
Определение наилучшего решения
по максимаксному критерию
Акции
фирм
W
V
U
Максимальное значение платежа
𝑚𝑖 = max{𝑎𝑖𝑗 } ,
𝑗
для каждой альтернативы
𝑚1 = 28
𝑚2 = 18
𝑚3 = 30
Критерий минимаксного риска
(критерий Сэвиджа)
ЛПР, применяющий критерий Сэвиджа, исходит
того, что всегда следует ожидать наступление
наихудшего состояния природы, или хотя бы
готовиться к нему. Однако в отличие от критерия
Вальда, в котором по платежной матрице сначала
ищется минимальный платеж, а среди них —
максимальный, критерий Сэвиджа оперирует
матрицей рисков и в ней сначала определяется
максимальный риск, а среди них — минимальный.
Наилучшее решение по критерию Сэвиджа
гарантирует получение наименьших потерь в
наихудших условиях. Другими словами, критерий
Сэвиджа выбирает то решение, при котором
минимизируются риски (потери) при возможном
наступлении наихудших состояний природы.
Алгоритм
 построить платежную матрицу;
 по платежной матрице построить матрицу рисков;
 в каждой строке матрицы рисков ( 𝑖 ),
соответствующей определенному возможному
решению 𝐴𝑖 , выбрать минимальный риск
𝑠𝑖 = max{𝑎𝑖𝑗 } ,
𝑖 = 1, 2, … , 𝑚;
𝑗
 из всех найденных максимальных рисков 𝑠𝑖 , 𝑖 =
1, 2, … , 𝑚 выбрать минимальное значение
𝑠𝑚𝑖𝑛 = min 𝑠𝑖 = min {max{𝑎𝑖𝑗 }};
𝑖
𝑖
𝑗
 решение, которому соответствует найденная на
предыдущем
наилучшим.
Акции
фирм
W
V
U
этапе
величина
𝑠𝑚𝑖𝑛
и
Максимальное значение риска
𝑠𝑖 = max{𝑎𝑖𝑗 } ,
𝑗
для каждой альтернативы
𝑠1 = 11
𝑠2 = 12
𝑠3 = 9
будет
Модели принятия решений в
условиях определённости
Рассмотрим транспортную задачу.
В этих задачах, рассматривается операция по
перевозке некоторых однородных грузов из пунктов
отправления в пункты назначения, причём известны
стоимости перевозки единицы груза между любыми
двумя пунктами отправления и назначения.
Требуется составить оптимальный план перевозок,
то есть определить количество груза перевозимого
из каждого пункта отправления в каждый пункт
назначения, при котором суммарная стоимость всех
перевозок будет минимальной.
Транспортная задача на примере
Логистическая
компания
располагает
тремя
пунктами упаковки косметики расположенными в
Твери, Ярославле и Смоленске, откуда сформированные наборы перевозятся на грузовиках к четырём
оптовым поставщикам, расположенным в Москве,
Санкт-Петербурге, Нижнем Новгороде и Саратове.
Дневная производительность по формированию
косметических наборов в городах приведена на
схеме.
С.-Петербург
Стоимость доставки (транспортные тарифы) одного
набора (ед.) из пунктов упаковки к каждому
оптовому поставщику приведены в таблице.
Пункты
упаковки
наборов
Стоимость доставки одного набора из каждого пункта
отправления в каждый пункт назначения, ден. ед.
Москва
СанктПетербург
Нижний
Новгород
Саратов
Тверь
1,5
3,2
2,4
4,8
Ярославль
1,7
3,7
1,2
4,2
Смоленск
1,8
3,8
2,8
5,1
Логистическая компания должна принять решение,
сколько наборов с косметикой необходимо
отправлять из каждого пункта упаковки каждому
оптовому поставщику, чтобы:
1) все наборы с каждого пункта упаковки были
вывезены;
2) спрос на наборы с косметикой каждого
оптового поставщика был полностью
удовлетворён;
3) суммарные затраты на транспортировку всех
наборов были минимальными.
Обозначим пункты отправления индексом 𝑖, так что
𝑖 = 1 соответствует Твери, 𝑖 = 2 — Ярославлю и
𝑖 = 3 — Смоленску, а пункты назначения —
индексом j, при этом 𝑗 = 1 соответствует Москве, j =
2
— Санкт-Петербургу, 𝑗 = 3
— Нижнему
Новгороду и 𝑗 = 4 — Саратову.
Переменными 𝑥𝑖𝑗 математической модели (управляемыми факторами) являются объёмы ежедневных
перевозок наборов между пунктами отправления 𝑖
(𝑖 = 1, 2, 3) и пунктами назначения 𝑗 (𝑗 = 1, 2, 3, 4).
Математическая модель задачи
Минимизировать суммарные затраты на транспортировку.
𝐹 = 1,5𝑥11 + 3,2𝑥12 + 2,4𝑥13 + 4,8𝑥14 +
+1,7𝑥21 + 3,7𝑥22 + 1,2𝑥23 + 4,2𝑥24 +
1,8𝑥31 + 3,8𝑥32 + 2,8𝑥33 + 5,1𝑥34 → 𝑚𝑖𝑛
С условиями:
𝑥11 + 𝑥12 + 𝑥13 + 𝑥14 = 1300,
𝑥21 + 𝑥22 + 𝑥23 + 𝑥24 = 1800,
𝑥31 + 𝑥32 + 𝑥33 + 𝑥34 = 1500,
𝑥11 + 𝑥21 + 𝑥31 = 1700,
𝑥12 + 𝑥22 + 𝑥32 = 1300,
𝑥13 + 𝑥23 + 𝑥33 = 700,
𝑥14 + 𝑥24 + 𝑥34 = 900,
𝑥𝑖𝑗 ≥ 0, 𝑖 = 1,2,3 и 𝑗 = 1,2,3,4.
Download