Визуализация границы Парето в задачах многокритериальной оптимизации (Лекции в МФТИ, февраль 2013 г.) А. В. Лотов Вычислительный Центр им. А.А.Дородницына РАН ВМК МГУ им. М.В.Ломоносова Часть II. Визуализации границы Парето и ее применение. Содержание • А. Краткий обзор методов визуализации малого числа критериальных точек • Б. Визуализации границы Парето в выпуклых задачах многокритериальной оптимизации: аппроксимация оболочки Эджворта-Парето и диалоговые карты решений • В. Метод достижимых целей в выпуклом случае. Примеры практического применения метода достижимых целей • Г. Визуализация границы Парето в задачах анализа данных и примеры ее практического применения. • Д. Метод достижимых целей в невыпуклом случае. Примеры практического применения метода достижимых целей в невыпуклом случае. Многокритериальная оптимизация Множество допустимых решений X W Решения отображаются в многомерное векторное пространство y f ( x) min Условная запись, означающая, что желательно уменьшать значения каждого из критериев при неизменных других. Доминирование по Парето и граница Парето Доминирование по Парето Пусть Y f (X ) множество достижимых значений критериев Граница Парето P(Y ) { y Y : { y ' Y : y ' y} } Оболочка Эджворта-Парето Имеет место Y* Y R m Решение задачи МКО Математическое (теоретическое) решение задачи МКО – множество в пространстве критериев (граница Парето) P(Y ) и множество в пространстве решений (множество решений, оптимальных по Парето) P( X ) {x X : f ( x) P(Y )} Лицо, принимающее решение В рамках методов МКО считается, что выбор единственного решения, оптимального по Парето, осуществляется лицом, принимающим решение (ЛПР). Классификация современных методов в соответствии с ролью ЛПР Методы МКО No-preference methods A priori preference methods A posteriori methods Interactive methods Задачи с двумя критериями: замещения видны на рисунке y2 y1 d ( y2 ) Норма замещения (Tradeoff rate) ( y*) d ( y1 ) Методы визуализации многомерной границы Парето Основная идея – перенесение на случай многих критериев методики, эффективно использующейся при двух критериях. При этом важно помнить, что при анализе границы Парето в двумерном случае важную роль играют не только сами значения критериев, но и информация о замещении одного критерия другим. А. Краткий обзор методов визуализации малого числа критериальных точек Метод параллельных прямых (Value path) Изображение значений каждой из альтернатив в виде ломаной линии на параллельных прямых, соответствующих критериям. Value path: 8 решений и 22 критерия Value path: 77 решений и 10 критериев Радарные диаграммы: 4 решения и 20 критериев Scatterplot Matrix Ошибочная попытка изобразить критериальные точки для случая более чем двух критериев с помощью проекций на всевозможные двухкритериальные плоскости Пример scatterplot matrix Б. Визуализации границы Парето в выпуклых задачах многокритериальной оптимизации: аппроксимация оболочки ЭджвортаПарето и диалоговые карты решений Аппроксимация с целью визуализации границы Парето (метод Диалоговых карт решений) Метод основан на аппроксимации ОЭП простыми фигурами и на быстрой диалоговой визуализации двумерных сечений ОЭП Y * y R :y f x,x X m Совокупность границ двумерных сечений ОЭП дает ЛПР представление о границе Парето. Аппроксимация ОЭП Построение методов аппроксимации ОЭП явилось основной математической проблемой, которую понадобилось решить при разработке метода Диалоговых карт решений. В случае выпуклого ОЭП в качестве аппроксимирующего тела используется выпуклое многогранное множество. Эта задача тесно связана с задачей полиэдральной аппроксимации выпуклых компактных тел. Итерационные методы полиэдральной аппроксимации выпуклых многомерных компактных тел (в.к.т.) Рассмотрим задачу аппроксимации в.к.т. С из Rm . Под итерационными методами полиэдральной аппроксимации в.к.т. принято понимать такие методы построения последовательности телесных многогранников P0 , P1 , …, Pk , … с растущим на единицу числом вершин (или граней), в которых последующий многогранник строится на основе предыдущего добавлением одной новой вершины. k lim ( P , C ) 0, где Требуется k (C1 , C2 ) = max {sup{d(x, C2):xC1}, sup{d(x,C1):xC2}}. СХЕМЫ ВОСПОЛНЕНИЯ Итерационные алгоритмы различаются способом построения последующего многогранника по предыдущему. Здесь ограничимся схемами восполнения, имеющими следующий вид. Пусть P(C) – семейство выпуклых телесных многогранников, вершины которых принадлежат границе C аппроксимируемого в.к.т. C. Пусть Pk P(C). Тогда (k+1)-я итерация состоит из двух шагов. Шаг 1. Выбирается точка y* C; Шаг 2. Строится Pk = conv { y*, Pk }. Выбор точки осуществляется на основе расчета значение опорной функции в.к.т. C gС (u) = max {<u, y>: y С }. для некоторого направления u S = {v Rm: <v, v> = 1}. Очевидно, что если в некотором алгоритме, построенном на основе схемы восполнения, многогранник начального приближения P0 принадлежит P(C), то и Pk P(C) для любого k. Адаптивные методы Итеративные методы делятся на адаптивные и неадаптивные. В неадаптивных методах требуется заранее выбрать систему направлений u(1),…u(N) S, для которых будет измеряться опорная функция. В адаптивные методах для выбора направления u S , используемого для расчета опорной функции, используется информация о многограннике Pk. В этом случае выбор направления u S адаптирован к форме C в той мере, в какой Pk аппроксимирует C. Адаптивные алгоритмы являются более эффективными, нежели неадаптивные, основанные на построении априорной сетки на сфере направлений, т.е. не учитывающие конкретную форму аппроксимируемого тела. В то же время, неадаптивные методы обладают рядом преимуществ, которые обсудим позднее. Метод Уточнения оценки Первый (исторически) адаптивный метод для m>2, метод Уточнения оценки (УО), был предложен В.А.Бушенковым и А.В.Лотовым (1982). Метод уточнения оценки Пусть аппроксимируется телесное в.к.т. C. Обозначим через U(P) конечное множество единичных внешних нормалей к гиперграням телесного многогранника P. Очевидно, что множество U(P) задано, если многогранник P задан в виде множества решений системы линейных неравенств. Рассмотрим (k+1)-й итерацию. Перед началом итерации должен быть построен многогранник Pk , заданный в виде множества решений системы линейных неравенств. Метод уточнения оценки 2 Шаг 1: находим u* U(Pk), на котором достигается max{ ( gC (u) g P k (u)): u U ( P k ) }; В качестве y* берем такую точку C, что < u*, y* > = gC(u*). Шаг 2: находим U(Pk+1) для Pk+1= conv { y*, Pk } на основе построения conv {y*, Pk } в виде множества решений системы линейных неравенств. Предполагается, что перед началом работы алгоритма задан исходный многогранник P0 (обычно берется симплекс), методы построения которого здесь рассматриваться не будут. Отметим, что в результате решения задач оптимизации на шаге 1 одновременно строится внешняя аппроксимация C P̂ = {y Rm: <u, y> gC(u), u U(Pk) } k Теоретический анализ адаптивных методов. Многогранники наилучшей аппроксимации При анализе адаптивных методов для их оценки была использована “образцовая” последовательность многогранников – последовательность многогранников наилучшей аппроксимации. Пусть задано некоторое в.к.т. C. Тогда среди многогранников с числом вершин, не более чем N, найдется многогранник PN, на котором достигается минимум расстояния по Хаусдорфу. Этот многогранник называется многогранником наилучшей аппроксимации (МНА). Он может служить эталоном аппроксимации тела C. Существование таких многогранников доказано для любых в.к.т. Методы построения МНА отсутствуют, но их свойства известны и дают информацию для изучения качества численных методов аппроксимации в.к.т. Известно, в частности, что (C, PN)0 при N. Известна оценка сходимости МНА для гладких тел • Существуют такие kC и KC , что kC / N 2/(m-1) (C, PN) KC / N 2/(m-1) • • • • Для m=2 получаем 2/(m-1) 1/N2 Для m=3 получаем 2/(m-1) 1/N Для m=5 получаем 2/(m-1) 1/N0.5 Для m=7 получаем 2/(m-1) 1/N1/3 Анализ хаусдорфовых адаптивных методов аппроксимации Хаусдорфовы методы возникли как обобщение метода УО. Метод полиэдральной аппроксимации называют хаусдорфовым для в.к.т. C с константой γ > 0, если он порождает {Pk}, k = 0, 1, ... со свойством (Pk, Pk+1) γ (Pk, C), k = 0, 1, ... Основной теоретический результат для хаусдорфовых адаптивных методов: для любого в.к.т. C (C, Pk) ~ 1 / Nk 2/(m-1). При этом гладкость границы не предполагается. Результаты изучения хаусдорфовых методов приведены в книге Г.К.Каменев «Оптимальные адаптивные методы полиэдральной аппроксимации выпуклых тел». М: Изд. ВЦ РАН, 2007, 233 с. Асимптотическая эффективность Пусть F = {Pk}k = 0, 1, ... – последовательность многогранников, сходящаяся к в.к.т. C. (C , PN ( P k ) ) Величину ( F ) lim inf k (C , P k ) назовем асимптотической эффективностью последовательности F. Для последовательностей МНА имеем η(F) = 1; для последовательностей, не оптимальных по порядку числа вершин, имеем η(F)=0; в остальных случаях η(F) между 0 и 1. Асимптотическая эффективность для хаусдорфовых последовательностей Показано, что для в.к.т. с трижды непрерывно дифференцируемой границей для последовательности F , полученной на основе хаусдорфового метода с константой γ , имеет место 1 m 1 m1 m ( F ) 4 m1 m 2 m1 min max где rmin и rmax – минимальный и максимальный радиусы кривизны C, а θm – плотность покрытия пространства Rm единичными шарами (1< θm <2). Свойства метода УО • Метод УО является реализацией хаусдорфовым для любого в.к.т. C и имеет константу γ, в процессе аппроксимации стремящуюся к 1/a(C), где a(C) – асферичность C. • Для в.к.т. с дважды непрерывно дифф. границей метод УО обладает константой γ, стремящейся к единице, причем ( F ) 1 4 . • Для в.к.т. с дважды непрерывно дифф. границей метод УО асимптотическая оптимален по числу расчетов опорной функции. Экспериментальные исследования (аппроксимации 2-4 мерных эллипсоидов) позволили сделать следующие выводы • Алгоритм УО, как и следует из теоретического анализа, являются оптимальными по порядку числа вершин аппроксимирующих многогранников; • в трех- и четырехмерных случаях экспериментальная асимптотическая эффективность алгоритма УО превосходит 1/2; • экспериментальная асимптотическая эффективность алгоритма УО растет с ростом размерности; • экспериментальная асимптотическая эффективность алгоритма УО мало зависит от асферичности аппроксимируемого тела. Построение выпуклой оболочки многогранника и точки (метод beneath-beyond) Методы, основанные на схеме beneath-beyond различаются между собой по способу решения трех задач: • Как определить видимость из присоединяемой точки; • Как определить соседство двух плоскостей; и • Как найти выпуклую оболочку точки и многогранника. Устойчивый вычислительный алгоритм метода УО реализован О.Л.Черных в 1986 г. на основе метода свертывания линейных неравенств, предложенного Фурье в начале XIX века и модифицированного С.Н.Черниковым в 1960х годах. Хотя метод О.Л.Черных применим в случае последовательного поступления точек, для простоты предположим, что задано s точек {v1, v2, ... , vs} Rm , выпуклая оболочка которых должна быть построена в виде решения системы линейных неравенств. По определению, точка y Rm принадлежит выпуклой оболочке {v1, v2, ... , vs} Rm , если найдутся такие величины λ1, λ2,..., λs , что s y i v , i i 1 s i 1 i 1, i 0, i 1, 2, ..., s. Рассмотрим пространство Rs+m переменных λ1, λ2,..., λs и y. Тогда эта система задает многогранное множество в Rs+m. Искомая выпуклая оболочка – проекция этого множества на пространство Rm переменных y. На основе методов проектирования Фурье-Черникова был построен устойчивый метод построения выпуклой оболочки. Таким образом, теоретические и экспериментальные исследования подтверждают возможность аппроксимации выпуклых множеств в пространствах размерности от трех до семи-восьми с помощью адаптивных алгоритмов, в частности, метода УО. Аппроксимация выпуклой ОЭП Отличается от аппроксимации в.к.т. тем, что исходное множество – не симплекс, а конус (симплекс с бесконечно удаленными точками). Далее… Неадаптивные методы Адаптивные методы имеют ряд недостатков. Во-первых, итеративное построение аппроксимации неудобно при распараллеливании алгоритмов, поскольку число решаемых задач оптимизации может резко меняться от итерации к итерации. Во вторых, в сети Интернет, когда крайне удобно выполнять построение аппроксимации на специальном ресурсе, а расчет опорной функции – на компьютере пользователя, наличие итераций приводит к требованию многократного (до нескольких сотен раз) взаимодействию пользователя с ресурсом, что не является практичным. Характерный пример зависимости числа решаемых задач расчета опорной функции в методе УО от номера итерации Построение субоптимальной системы направлений Как уже говорилось, в неадаптивных методах требуется заранее выбрать систему направлений u(1),…u(N) S, для которых будет измеряться опорная функция. Поскольку эта система направлений строится заранее и не зависит от аппроксимируемого множества, целесообразно сделать эти направления равномерно расположенными на mмерной единичной сфере. Этого можно добиться за счет построения покрытия сферы системой окрестностей заданного числа точек сферы с минимальным радиусом покрытия. Далее, эти точки можно использовать как направления в неадаптивных методах. Поскольку задача построения оптимального покрытия сферы не имеет решения при m>2, строится субоптимальное покрытие. Метод пошагового пополнения покрытия, ППП Метод ППП (Stepwise Supplement of Covering, SSC) предназначен для численного построения покрытий многомерной единичной сферы окрестностями конечного числа точек. Итеративно строится последовательность покрытий, каждое из которых отличается от предыдущего включением всего одной точки. Ясно, что такие покрытия заведомо не являются оптимальными. Однако, при разумном выборе точки, включаемой в базу покрытия, они являются асимптотически субоптимальными. Оптимальное покрытие Оптимальное покрытие для непустого множества A некоторого метрического пространства Z с метрикой (.,.) определяется следующим образом. Пусть T – конечное подмножество A. Пусть U (T ) – замкнутая ε -окрестность T. Если A U (T ) , то U (T ) будем называть (конечным) покрытием A, а T – базой покрытия. Радиусом покрытия множества A будем называть величину (T ) : inf : A U (T ). Пусть Ωk – совокупность подмножеств A, составленных из k>0 точек. Для данного A введем обозначение kopt : inf (T ) : T k . Если существует база покрытия TkoptΩk, на которой достигается величина kopt, то полученное покрытие U (Tkopt ) назовем оптимальным k-точечным покрытием A. opt k Покрытие единичной сферы Обратимся к покрытиям единичной сферы Sm-1={ :<u, u> =1}, т.е. будем считать, что Z=A=Sm-1. Рассмотрим на Sm-1 внутреннюю метрику (.,.) , совпадающую с минимальным углом между векторами, направленными на точки сферы, т.е. с минимальной длиной дуги большого круга (сечения сферы двумерной плоскостью, проходящей через ее центр и рассматриваемые точки). Субоптимальные покрытия Рассмотрим на Sm-1 бесконечные последовательности баз покрытия Tk, k=1,2,…, с растущим числом точек, причем пусть для простоты величина k означает не только номер базы, но и число ее точек. Для A=Sm-1 и любого k>0 opt T существует оптимальное покрытие с базой k . Поэтому среди последовательностей баз покрытия Tk, k=1,2,…, opt T наилучшей является k , k=1,2,…. Последовательности покрытий сферы U (Tk ) (Tk ) и их баз Tk, k=1,2,…, будем называть (асимптотически) субоптимальными, если lim inf kopt (Tk ) 0 k Расчет радиуса покрытия • Расчет радиуса покрытия (Tk ) для любого конечного покрытия единичной многомерной сферы Sm-1, заданного базой покрытия Tk основан на построении Pk – выпуклого телесного многогранника с k вершинами в точках Tk. Имеет место связь между (Tk )и расстоянием по Хаусдорфу hk между Pk и шаром Bm = { u E m: <u, u> ≤ 1} hk 1 cos( (Tk )) • Для использования этого соотношения достаточно по точкам базы Tk построить многогранник Pk в форме решения системы линейных неравенств. Такое представление многогранника позволяет найти величину расстояния по Хаусдорфу hk между Pk и шаром Bm . Метод ППП Метод ППП основан на использовании метода УО для построения последовательности выпуклых телесных многогранников Pk, k=d+1, d+2,…, аппроксимирующих шар Bm. Совокупность вершин Pk порождает базу Tk покрытия Sm-1. Асимптотическая эффективность последовательности покрытий, заданных базой Tk, построенной с использованием метода ППП, определяется как opt SSC SSC : lim inf k k d k Теоретические результаты Теорема. Имеет место оценка SSC 2 m 1 2 m Отсюда следуют оценки SSC 0.500, 3SSC 0.577, 4SSC 0.612, 5SSC 0.632, 6SSC 0.645, 7SSC 0.655,... Более точная асимптотическая оценка SSC 0.7573< <1. Экспериментальные оценки SSC SSC SSC SSC 3 ≈ 0.763, 4 ≈ 0.795, ≈ 0.817, ≈ 0.834 1/ 2 m 2 5 6 Сравнение со сферическими координатами 1 Здесь сравниваются асимптотические эффективности dSph и dSSC Здесь и на следующих Рисунках d -- размерность Сравнение со сферическими координатами 2 Сравнение со сферическими координатами 3 Сравнение со сферическими координатами 4 Сравнение со сферическими координатами 5 Вернемся к неадаптивным методам, направление которых выбираются на основе покрытий единичной сферы (результаты аппроксимации ОЭП в прикладной задаче) Графики зависимости отклонения dev от числа k расчетов опорной функции для методов УО (штрих-пунктирная кривая), простейшего (штриховая кривая) и ВРП (сплошная кривая) в случае пяти критериев То же в логарифмических координатах Диалоговые карты решений Двумерное сечение множества Пусть нас интересует двумерное сечение некоторого множества V гиперплоскостью, проходящей через некоторую точку y* параллельно плоскости двух координат (yi, yj). Если не обращать внимание на порядок координат, то каждую точку этой плоскости можно представить в виде y*=(yi, yj, w*), где yi и yj – значения в рассматриваемой плоскости, а w* – совокупность значений остальных (m-2)-х координат. Тогда двумерное сечение множества V плоскостью, параллельной плоскости координат (yi, yj) и проходящей через точку y*, есть множество G( yi y j ) (V , w*) ( yi , y j ) : ( yi , y j , w*) V Построение двухкритериальных сечений Пусть полиэдральная аппроксимация ОЭП построена в виде m a j 1 lj y j bl , l 1, 2, ... , N . Тогда ее двухкритериальное сечение, параллельное плоскости (yi, yj) и проходящее через точку y*, задается ali yi alj y j bl a k i , j lk y , l 1, 2, ... , N . * k Одно свойство двумерных сечений ОЭП Монотонность по отношению к изменениям w: G( yi y j ) (Y *, w*) G( yi y j ) (Y *, w * *) при w*≤ w**. Поэтому при монотонном изменении одной из координат w происходит монотонное расширение (или сжатие) множества G( yi y j ) (Y *, w) . В связи с этим при наложении нескольких сечений (1) (k ) G( yi y j ) (Y *, w ),..., G( yi y j ) (Y *, w ) w(1) w( 2 ) ... w( k ) их границы при не пересекаются. Благодаря этому свойству удобно изображать карты решений – изображения, содержащие несколько сечений, наложенных одно на другое. Карта решений – набор параллельных сечений ОЭП • Поскольку сечение ОЭП, параллельное плоскости некоторых двух координат (yi, yj), определяется значениями координат из совокупности w*, то, меняя значения w*, получаем различные параллельные сечения ОЭП. • Недоминируемые границы этих сечений дают в совокупности представление о паретовской границе этого множества. • Меняя значения только одного критерия из w*, получаем карту решений. Меняя значение другого критерия из w*, получаем анимацию карты решений. Пример карты решений В. Метод достижимых целей в выпуклом случае Метод достижимых целей (МДЦ) МДЦ является развитием целевого подхода. МДЦ основан на предварительной визуализации границы Парето с помощью ДКР. После изучения границы Парето, ЛПР с помощью мыши указывает наиболее предпочтительную критериальную точку y’ на границе Парето. Далее находится решение задачи m max( y j yj ) j ( y j yj ) min, 1 j m j 1 где y = f (x), x X, величины j -- малые положительные параметры. Приложения МДЦ Два типа приложений: • Методические приложения, предназначенные для демонстрации того, как метод может быть использован; • Реальное использование, в рамках которого ЛПР самостоятельно применяет метод для принятия решений Методические приложения: поиск эффективных стратегий • • • • • • Регионального использования водных ресурсов Улучшения качества воды в морском заливе Развития сельского хозяйства в небольшом регионе Улучшения качества воды в малых реках России Среднесрочного развития промышленной отрасли Средне- и долгосрочного развития экономики Финляндии • Уменьшения загрязнения атмосферы в Европе • Противодействия глобальному изменению климата • Выращивания риса и креветок в Северо-западной Мексике Реальные приложения Первое реальное приложение: использование метода для выбора долгосрочных национальных целей в процедуре среднесрочного планирования в Госплане СССР (1984 -1987) • Исследование проводилось на основе динамической 17-отраслевая балансовой модели леонтьевского типа. Критерии – потребление групп населения, развитие образования и медицины, другое государственное потребление и т.д. • Была построена ОЭП на 15 лет. В связи с отсутствием ПК, заранее был рассчитан альбом сечений ОЭП, который затем интенсивно использовался в Госплане СССР в течение трех лет. СППР для поддержки переговоров об уменьшения загрязнения атмосферы (1990-1992) • Компьютерная система для поддержки переговоров между представителями России и Финляндии по проблеме кислотных дождей (совместно с M.Pohjola и V.Kaitala, ETLA). • В исследование включена Эстония в связи с тем, что выбросы в Эстонии играют существенную роль в загрязнении воздушной среды Финляндии. Проблема В Финляндии в конце 80-х годов была разработана программа поддержки инвестиций в странах Восточной Европы, направляемых на уменьшение выбросов загрязнителей на тех объектах, которые оказывают влияние на состояние атмосферы в Финляндии. Вопрос об объеме такой поддержки и о стратегиях ее использования должен быть решен в процессе переговоров между представителями заинтересованных стран. Модель Рассматривались только окислы серы. Модель осадков Q=AE+B, где Q – осадки, E – эмиссия, A – матрица транспортировки, B – внешние источники. Вся информация – от финских специалистов. Связь затраты-эмиссия для регионов Финляндии Связь затраты-эмиссия для регионов СССР Список критериев в СППР Перечислим возможные критерии выбора решения в системе: • затраты на уменьшение эмиссии в каждом из регионов; • затраты на территории Финляндии в целом и России в целом; • общие затраты; • удельное (на единицу площади) выпадение кислотных осадков в каждом из регионов; • максимальное (по регионам) удельное выпадение осадков в каждой из стран; • максимальное удельное выпадение осадков на всей территории. Пример исследования Три критерия: • затраты на уменьшение эмиссии на территории Финляндии (CF), в миллионах финских марок, • затраты на уменьшение эмиссии во всех странах, рассматриваемых в модели (CT), в миллиардах финских марок, • максимальное удельное выпадение загрязнения в Финляндии (PF), в граммах на квадратный метр за год. Кроме того, были наложены некоторые ограничения на загрязнение в Финляндии Распределение затрат в точке E Исходные осадки и результат Реальное использование результатов В сентябре 2001 г. президенты России и Финляндии подписали соглашение, по которому часть российского долга (около US$500 миллионов) может быть частично использована для уменьшения выбросов в СПб. Программа Возрождение Волги. СППР для поддержки поиска эффективных стратегий улучшения качества воды в р. Ока СППР для поиска эффективных решений и переговоров состоит из: • подсистемы визуализации текущего состояния реки, • подсистемы выбора критериев и назначения ограничений, • подсистемы аппроксимации, • подсистемы визуализации эффективных границ и выбора достижимой цели, • подсистемы расчета стратегии, • подсистемы визуализации полученной стратегии с помощью ГИС. Математическая модель Математическая модель состоит из трех составляющих: • модели выброса загрязнителей, • модели переноса загрязнителей, дающей возможность вычислять концентрации загрязнителей в гидрологических пунктах при заданных выбросах загрязнителей по створам, • модели очистки стоков, связывающей уменьшение выбросов загрязнителей с вариантами использования имеющихся технологий очистки сточных вод и объемом капиталовложений в очистное оборудование. Для скрининга решений была разработана упрощенная интегрированная модель. Упрощенная модель переноса загрязнителей Число регионов – R. Река разбита на K створов, разделенных между собой станциями наблюдения. Поток воды около k-й станциями наблюдения, обозначенный через Qk , рассчитан заранее. Пусть I – число загрязнителей. Уравнение баланса i-го загрязнителя в k-м створе где Mki – поток i-го через k-ю станцию наблюдения, ki – коэффициент распада i-го загрязнителя, полученного из в k-1-го створа, mrki – выброс i-го загрязнителя в k-м створе из r-го региона, arki -- соответствующий коэффициент распада, Rk – подмножество регионов, загрязняющих k-й створ. Модель очистки Рассматривалось N возможных технологий. Основное уравнение trkn – доля выброса загрязнителей, очищаемых помощью n-й технологии, in – коэффициент очищения для n-й технологии, Концентрация загрязнителей Концентрация i-го загрязнителя в k-й станции где 0ki -- фоновое загрязнение. Пусть где imax -- максимальное разрешенное загрязнение. Рассматривалось 6 наиболее важных загрязнителей: • Взвешенные вещества, фосфаты; нитраты; нефтепродукты; соединения железа; БПК. Загрязненность по отдельному веществу оценивалась относительной концентрацией этого вещества, измеренной в единицах ПДК. Критерии Рассматриваются экологические и экономические критерии. Качество воды в r-ом регионе задается вектором где Kr – множество створов, располагающихся в r-м регионе. Максимальные величины Уровни загрязнения, максимальные по всем регионам, даются вектором: Подсистема выбора критериев Пользователь имеет возможность выбрать интересующие его критерии из большого списка стоимостных и экологических показателей, характеризующих проект улучшения качества воды. Стоимостные показатели включают общую стоимость проекта и затраты в отдельных регионах. Экологические показатели включают загрязненность воды в реке: концентрации веществ в гидрологических пунктах, максимальные концентрации по гидрологическим пунктам, расположенным в отдельных регионах, и максимальные концентрации веществ по всей реке. Подсистема визуализации эффективных границ и выбора достижимой цели Эволюционный подход к выбору решения • Инженеры-водохозяйственники часто возвращались к списку показателей после анализа решения для того, чтобы изменить значения ограничений и, может быть, список критериев. • Инженеры ухитрялись анализировать связи до 9 критериев одновременно. Г. Визуализация границы Парето в задачах анализа данных Метод разумных целей МРЦ, также как и МДЦ, является развитием целевого подхода Рассмотрим таблицу альтернативных решений, описываемых своими атрибутами Пример: покупка дома с участком Иллюстрация метода для двух критериев Аппроксимация выпуклой оболочки Аппроксимация ОЭП выпуклой оболочки Выбор решения пользователем Автоматический отбор ближайших альтернатив Процедура выбора малого числа альтернатив по целевой точке Описанные ранее методы полиэдральной аппроксимации в.к.т. применяются при числе точек до 106 . Если число точек существенно превышает 106 , то используются специально разработанные методы. При этом число вариантов доходило до 1040 . Веб-ресурс для поддержки выбора с использованием МРЦ http://www.ccas.ru/mmes/mmeda/ www.rgdb.com Функциональная схема ресурса Ввод данных Пример дисплея Отобранные альтернативы Разработка и изучение методов поддержки асинхронного коллективного выбора решений в сети Интернет Изучается принятие решения коллективом людей, которых невозможно собрать вместе (скажем, разделенных территориально) Коллективное принятие решений разбито на две стадии: • На первой стадии, участники независимо друг от друга с использованием МРЦ выражают свои индивидуальные предпочтения в виде разумной цели – предпочтительного баланса критериальных величин • На второй стадии, информация о разумных целях используется для получения справедливого группового решения Первая стадия a(Y) y1 Участники независимо указывают цели на карте решений, представляющей ОЭП выпуклой оболочки точек. y(1) y2 Вторая стадия – выбор группового решения y1 a(Y) y(2) y(1) Могут быть использованы различные процедуры, в том числе процедуры агрегирования предпочтений, выраженных, скажем, в форме y2 эрзац-функций полезности. Методические приложения: разработка методов • Выбора инженерных решений • Выбора товаров и услуг по сети (дома, автомобили, отели и т.д.) • Выбора эффективных вариантов капиталовложений (развитие cost-benefit analysis) • Поиска работы • Выбора альтернатив в условиях неопределенности и риска • Медицинской диагностики, и т.д. • Робастное принятие решений • Коллективный выбор Реальное применение МРЦ Participatory Decision Support for Integrated River Basin Planning (Funding: German Federal Ministry of Education and Research) The Web RGDB was used as a part of DSS developed by Jörg Dietrich and Andreas H. Schumann, Ruhr University Bochum, Institute for Hydrology, Water Management and Environmental Engineering DSS was calibrated for the Werra River Basin Ems Elbe Weser Werra Rhein Architecture of the Web-based DSS ИСПОЛЬЗОВАНИЕ МРЦ В ЗАДАЧАХ РОБАСТНОГО ПРИНЯТИЯ РЕШЕНИЙ Под робастным принятием решений понимается выбор таких решений, которые были бы удовлетворительны при любых сценариях будущего. Рассмотрим пример удачного использования МРЦ для анализа ситуации перед дефолтом 1998 г. Вопрос : как разумно вложить US$1000? Рассматривались три сценария: 1) Продолжение нормального развития; 2) Девальвация рубля на 50%; 3) Коллапс банковской системы РФ. Возврат денег при каждом из сценариев рассматривался как критерий. Таким образом, рассматривалось три критерия. Возможные варианты действий: вложения в различные российские банки в различных валютах. Цвет соответствует возврату денег при коллапсе банковской системы РФ ИСПОЛЬЗОВАНИЕ МРЦ В ЗАДАЧАХ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКА Модель Рассматриваются N альтернатив, каждая из которых характеризуется не числом, а функцией распределения F(x)=P{v<x}, где значение показателя v желательно уменьшить (или увеличить). Критерии Критерии типа F(z)=P{v<z} при фиксированном z. • Если показатель v – типа дохода или прибыли (т.е. v желательно увеличивать), то величину y=F(z) желательно уменьшать; • Если показатель v – типа потерь (т.е. v желательно уменьшать), то величину y=F(z) желательно увеличивать. Если заданы m величин zk, k=1,..,m, то можно рассмотреть m критериев yk=F(zk)=P{v<zk} и применить МРЦ. Пример: выбор варианта дамбы Рассмотрим функцию распределения для потерь для некоторого варианта дамбы F(z), порождающую три критерия: 1.Ожидаемые потери (включая заданные расходы на строительство и поддержание, в год); 2. Вероятность P_h высоких потерь h, т.е. P_h=1-F(h) ; 3. Вероятность P_c катастрофических потерь c, т.е. P_c=1-F(c). Представляет интерес минимизация всех трех критериев. Список альтернатив Если выбрана комбинация значений критериев, соответствующая кресту на карте решений, то выбираются следующие альтернативы Была сделана попытка применить эту методику для анализа портфелей активов с несколькими VAR Д. Метод достижимых целей в невыпуклом случае Особенности класса нелинейных моделей, для которых осуществляется аппроксимация • Рассматриваем задачу y f ( x) min X W • Вектор-функция f задана в виде вычислительного модуля, рассчитывающего значения критериев по заданному решению; • Одно из следствий – отсутствие информации о постоянной Липшица • Обычно: невыпуклость множества Y и многоэкстремальность критериев. Гибридный метод аппроксимации ОЭП Метод основан на модификации и комбинации нескольких подходов, не требующих информации о модели. Благодаря этому можно аппроксимировать ОЭП для объектов, заданных «черным ящиком». Кроме того, имеется возможность формулировки правил остановки, которые также являются некоторым средством статистической проверки качества аппроксимации. Аппроксимация осуществляется множеством T* , являющимся объединением множеств y m R где y принадлежит базе аппроксимации – конечному набору T точек множества Y. Итеративные гибридные методы аппроксимации ОЭП (простейший вариант) 1. Однофазный метод (должны быть заданы правила остановки, например, максимальное отклонение сгенерированных критериальных точек от имеющейся аппроксимации должно быть меньше заданной величины) А) генерируется случайная выборка, оценивается выполнение правил остановки; В) если правила остановки не выполняются, база аппроксимации пополняется новыми критериальными точками и из нее исключаются доминируемые. 2. Двухфазный метод – итерация дополняется «улучшением» случайных точек на основе решения специально сформулированных задач локальной скалярной оптимизации. 3. Трехфазный метод – итерация дополняется построением подмножества множества X, в котором надо искать решения; генерируются две выборки – во всем множестве X и на его подмножестве. 4. Генетический метод – итерация состоит в расчете критериальных точек случайных выпуклых комбинаций специально подобранных пар решений; база аппроксимации пополняется наиболее удаленными точками и из нее исключаются доминируемые критериальные точки. Для адаптации методов к конкретной задаче пользователь сначала должен провести серию экспериментов с разными методами и выбирать их параметры, а затем уже можно осуществить автоматический расчет ОЭП. Оценка качества аппроксимации Полнота аппроксимации hT = Pr {f(x) T*: x X } . (1- hT) показывает вероятность получения точки вне T* при генерировании точки случайной выборки HN = {x1, … , xN}X . Величина hT(N) = n / N, где n=|f(xi) T*| -несмещенная оценка полноты. Можно также построить оценку для полноты hT >hT(N) – (– ln (1 – ) / (2N) )1/2 Функция полноты Пусть (T*)ε - ε–окрестность T*. Тогда hT (ε)= Pr {f(x) (T*)ε : x X } является функцией полноты. Оценка hT (ε)> hT(N)(ε) – (– ln (1 – ) / (2N) )1/2 Оптимизационная полнота hT = Pr {f(Φ(x)) T*: x X }, где отображение Φ улучшает случайные точки так, что их критериальные образы «приближаются» к паретовой границе. В нашем исследовании отображение Φ реализуется на основе решения адаптивно сформулированных задач локальной скалярной оптимизации. Для функции оптимизационной полноты имеет та же оценка. Две функции оптимизационной полноты для двух итераций (1-я и 7-я) двухфазного метода Сравнение двухфазного и трехфазного методов Реализация гибридных методов на двух платформах схема Модуль аппроксимации ОЭП (персональный компьютер) Модуль аппроксимации ОЭП (многопроцессорная система) Модуль интерактивной визуализации паретовой границы (ПК) Распараллеливание гибридных методов В связи с тем, что методы основаны на генерировании случайных точек и операций с ними, имеется возможность естественного распараллеливания процесса расчета. Более того, потеря части результатов не страшна – она влияет только на надежность оценок. Благодаря этому возможно использовать методы в среде GRID. Реализация в многопроцессорной среде Визуализация паретовой границы в задаче охлаждения стали Процесс охлаждения стали при непрерывной разливке Модель В Университете г. Ювяскуля (Финляндия) были разработаны модель и вычислительный модуль, который по интенсивностям водяных струй рассчитывал температуру стали. См. • Laitinen E. and Neittaanmäki P. “On Numerical Solution of the Problem Connected with the Control of the Secondary Cooling in the Continuous Casting Process”, Control Theory and Adv. Tech., 4, 285-305, 1988. Модуль • Модуль представляет собой программное обеспечение решения нелинейной краевой задачи охлаждения стали с учетом многофазности системы и влияния излучения. Использовался метод конечных элементов (по пространству) и конечных разностей (по времени). Модуль позволяет по интенсивностям водяных струй (325 переменных) рассчитать температуру по всему объему стали. Критерии Критерии – нарушение требований • J2 –к температуре поверхности; • J3 – к градиенту температуры поверхности; • J4 – к температуре после точки z3; • J5 – к температуре в точке z5. Исследование модели охлаждения стали При решении этой задачи (n=325, m=4) экспериментально исследовались различные сочетания методов и было подтверждено, что наилучшим сочетанием является применение сначала двухфазного метода, далее – трехфазного, в конце – генетического. Аппроксимация ОЭП после применения многофазных методов Аппроксимация ОЭП после применения генетического метода Применение метода в задаче формирования диспетчерского графика каскада водохранилищ Построения правила для Иркутского водохранилища Исследование было направлено на улучшение диспетчерского графика. Диспетчерский график описывался 132 параметрами (6 параметров кривой для каждого периода при 22 периодах, на которые был разбит год). Задача состояла в выборе значений этих 132 параметров. Многокритериальная оптимизация: критерии выбора решений • y1 - штраф за наличие холостого сброса, • y2 - штраф за нарушение минимального уровня водосброса с мая по сентябрь в 1500 м.куб./сек., • y3 - штраф за нарушение минимального уровня водосброса с октября по апрель в 1350 м.куб./сек., • y4 - штраф за превышение уровня водосброса в 4000 м.куб./сек., • y5 - штраф за понижение уровня отдаваемой мощности ниже 372 Мвт, • y6 - штраф за понижение уровня отдаваемой мощности ниже 340 МВт , • y7 - штраф за превышение уровня воды в оз. Байкал (457 м) при водосбросе, не превышающем 3200 м.куб./сек., • y8 - штраф за нарушение уровня воды в оз. Байкал(456м -457 м) Величины критериев Величины критериев брались как отношение к значениям критериев в исходном диспетчере Б. В тех случаях когда для диспетчера Б. значение критерия было равно нулю (в диспетчере Б. требования по третьему и седьмому критериям выполняются полностью), то изучалось влияние значений этих критериев в окрестности нуля. Анализ результатов • Оказалось, что без ущерба для других критериев можно положить y3=y7=0, и, кроме того, y4=y6=0. То есть, обеспечивались отдаваемая мощность не ниже 340МВт, не превышался максимальный уровень водосброса, с октября по апрель не нарушался минимальный уровень водосброса, при уровне воды в оз. Байкал (457 м) водосбросе был не менее 3200 м.куб./сек. • Поэтому далее анализ проводился лишь по критериям y1, y2, y5, y8. Напомним, что • y1 - штраф за наличие холостого сброса, • y2 - штраф за нарушение минимального уровня водосброса с мая по сентябрь в 1500 м.куб./сек., • y5 - штраф за понижение уровня отдаваемой мощности ниже 372 Мвт, • y8 - штраф за нарушение уровня воды в оз. Байкал(456м -457 м) Карта решений 1 Карта решений 2 Карта решений 3 Карта решений 4 Карта решений 5 Отобранные целевые точки 1. 2. 3. 4. 5. y1=0.91, y2=0.00, y5=0.91, y8=0.89 y1=0.86, y2=0.00, y5=0.77, y8=0.93 y1=0.77, y2=0.22, y5=0.85, y8=0.84 y1=0.86, y2=0.11, y5=0.65, y8=0.95 y1=0.83, y2=0.11, y5=0.42, y8=1.02 График для точки 2 Свойства Книги • Лотов А.В., Бушенков В.А., Каменев Г.К., Черных О.Л. Компьютер и поиск компромисса. Метод достижимых целей. М.: Наука, 1997. • Lotov A.V., Bushenkov V.A., Kamenev G.K. Interactive Decision Maps. Boston: Kluwer Academic Publishers, 2004. • Лотов А.В., Поспелова И.И. Многокритериальные задачи принятия решений. М.: изд. МАКС Пресс, 2008. Web address • http://www.ccas.ru/mmes/mmeda Приложение. Построение проекций многогранных множеств Projections of polyhedral sets DEFINITION. Let a set M Rp Rq be specified. The set Mw = { w Rq : v: (v,w) M } is known as the (orthogonal) projection of the set M onto Rq. To construct the desired projection of the set M, one can use the methods proposed for the convolution of systems of linear inequalities by J.B.Fourier (1826). The convolution methods help to construct the projection Mw of a convex polyhedral set M Rp Rq in the form Mw = {w Rq : Dw d } . Convolution of linear inequality systems Let the convex polyhedral set M is specified as M = { (v,w) Rp Rq : Av + Bw c}, where A, B are specified matrices, and c is a specified vector. It is needed to find a matrix D and a vector d of the description of its projection Mw. Fourier proposed the convolution method for eliminating the vector v from the finite system of linear inequalities in a way that results in the constructing of the projection. The method starts with the elimination of one coordinate of the vector v, i.e. with constructing the projection of the set M onto Rp-1 Rq. Constructing of the projection is based on eliminating the first component of the vector v. Then the process continues until all components of the vector v are eliminated. Eliminating of one component of the vector v is carried out by summation of pairs of the inequalities. The Fourier method resembles to some degree the method proposed by Gauss for solving systems of linear equations. However, the Fourier method is more sophisticated. The Fourier method for p = 1 In the case p = 1, the system may be recast as ai v + <bi , w> ci , i = 1, 2, ... , N, where ai are numbers and bi are vectors. We break up all inequalities into three groups, P+, P- and P0, in correspondence to the sign of the coefficient by the variable v. The system describing the projection includes • all inequalities, which have zero coefficients at the variable v (i.e. the inequalities that belong to P0), • all possible linear combinations of pairs of inequalities with opposite signs of the coefficients, i.e. all inequalities < aj bi - ai bj , w> aj ci - ai cj , where i P- , j P+. When excluding a greater number of variables by the Fourier method, the procedure remains the same: on a current elimination step, the system, which is a result of elimination of the previous coordinate, is taken as the starting system. Reduced fundamental convolution (S.N.Chernikov) In 1960s, S.N.Chernikov developed the reduced fundamental method for convolution of linear inequality systems. It constructs matrices D and vectors d with the minimal number of rows (while b and c are considered as parameters). The reduced fundamental method establishes the relation between the vertices and the hyperfaces of the projection (inequality index storage). Constructing the convex hull-1 Now we can construct the convex hull by projecting the polyhedral set s y i v i , i 1 s i 1 i 1, i 0, i 1, 2, ..., s. It can be constructed by eliminating the variables λ1, λ2,..., λs from the above system of equalities and inequalities. We eliminate the variables λ from the system in the same order as they are numbered. The first m+1 variables λ1, λ2,..., λm+1 can be eliminated from the system by expressing them in terms of the other variables and using the equalities of the system. The remaining variables can be eliminated by the method of reduced fundamental convolution. Constructing the convex hull-2 Let us consider the resulting system obtained after the variables λ1, λ2,..., λq, where q m+1, have been eliminated. The system provides, in effect, the description of the convex hull of the points {v1, v2, ... , vq}: it is only needed to equate the variables λq+1,..., λs to zero in it. The excluding the next variable λq+1 from the resulting system is equivalent to attaching a point vq+1 to the convex hull of the points {v1, v2, ... , vq}. Thus, when constructing a convex hull, the information about the points that have yet to be attached is not needed. Therefore, it is not necessary to know the future points themselves or even their number. Result: a stable beneath-beyond scheme Thus, this method can be used for constructing the polyhedron sequentially, one point after another. Important that this procedure transforms the method into the method based on the beneath-beyond scheme. The inequality index storage used in the reduced fundamental convolution method is equivalent to a partial storage of combinatorial structure of the intermediate polyhedra. Therefore, a polyhedron is, in effect, stored as a system of inequalities, each of which corresponds to a face of the polyhedron. Also, each inequality is stored along with information that gives the numbers of the vertices, which belong to particular faces. This information helps to solve three problems listed above. For example, the question as to whether or not a given face is visible from a new point is answered by inserting the point being attached in the linear inequality corresponding to that face.