ВЫБОР «ДЕРЕВА ЦЕЛЕЙ» ПО КРИТЕРИЮ

advertisement
СБОРНИК НАУЧНЫХ ТРУДОВ НГТУ. – 2010. – № 4(62) – 141–148
УДК 681.3
ВЫБОР «ДЕРЕВА ЦЕЛЕЙ» ПО КРИТЕРИЮ
ИНФОРМАЦИОННОЙ ПОЛЕЗНОСТИ*
Б.Р. ШЕГАЛ, Е.К. МОЛОДКИН
В настоящей работе предлагается модель выбора наиболее предпочтительного дерева
целей на этапе формирования системы целей и критериев в процессе принятия решений. Мера возможности точной и быстрой оценки значений критериев дерева – «информационная полезность» – является критерием выбора иерархии. Исследуются вопросы оценки информационной полезности при различных вариантах управления
источниками информации. В качестве решающего правила выбора иерархии используется теория полезности.
Ключевые слова: дерево целей, иерархия, принятие решений, критерий, информационная полезность.
ВВЕДЕНИЕ
Проблема построения «Дерева целей» при уточнении смысла глобальной,
расплывчатой цели [1] не является строго формальной. Размер иерархии зависит от ряда факторов, в том числе допустим качественный её рост [2]. При
построении иерархии акцент делается на чёткость и понятность целей и критериев. Однако, как правило, не затрагиваются следующие вопросы: «Насколько правдоподобно (точно), быстро, экономично можно оценить значения
критериев в созданной иерархии? Существуют ли необходимые для этого информационные ресурсы и доступны ли они управляющему органу?»
Допустим, что иерархия целей системы построена. Она представляет собой орграф типа «прадерево» (далее – «дерево») (рис. 1). Любой из критериев
нижнего уровня имеет определённую важность для лица, принимающего решения (ЛПР), которая будет учтена формально при выборе решающего правила сравнения альтернатив решения проблемы. Кроме этого, при анализе
альтернатив каждый критерий должен быть оценен как можно более точно.
Для этого существуют источники информации (ИИ). Помимо правдоподобия
информации нас интересуют её стоимость и время получения, особенно в задачах оперативного принятия решений. Таким образом, для любого критерия
нижнего уровня мы можем иметь векторную оценку его «информационной
полезности» (ИП) в смысле вышеприведенных характеристик. Если свести
эти показатели в скалярную оценку ИП по всему множеству критериев, то
получим оценку ИП данного «дерева целей» (иерархии).
* Статья получена 8 ноября 2010 г.
Б.Р. Шегал, Е.К. Молодкин
142
Глобальная
цель
Уровень 0
Уровень 1
Рис. 1. Иерархия целей
Отсюда возникает вопрос, а не будет ли некоторая менее детализированная иерархия, являющаяся подграфом исходной, более эффективной по
критерию ИП? Ведь в этом случае «семантическое» преимущество более
детализированной иерархии (цели более понятны ЛПР) исчезает из-за невозможности эффективного оценивания критериев. Более того, будем считать, что «семантическое отставание» менее детальной иерархии компенсируется за счёт качественного роста иерархии целей. Следовательно, проблема
выбора наиболее предпочтительной иерархии заключается в оптимизации
критерия ИП на множестве допустимых альтернативных «деревьев целей».
1. ПОСТАНОВКА ЗАДАЧИ
Представлен орграф G = (X, Г) типа «дерево», задающий иерархию целей,
созданную методом «дерева целей» или «конкретизации» [2], где X – множество вершин графа, Г – отображение на множестве вершин.
Требуется:
1. Сформировать множество подграфов данного графа, являющихся деревом, при следующих условиях допустимости формирования:
а) корень прадерева (уровень 0 дерева) является элементом множества
вершин подграфа, т.е. сохраняется для любого подграфа;
б) если дуга, исходящая из вершины уровня k, принадлежит множеству
дуг подграфа, то ему принадлежат все дуги (и, соответственно, инцидентные им вершины уровня k + 1), исходящие из этой вершины; данное условие вытекает из необходимости уточнения смысла вышестоящей цели во всех аспектах заинтересованности ЛПР.
2. Для всех сформированных иерархий оценить ИП критериев нижнего
уровня по следующим частным критериям:
а) диагностичность информации о значении критерия;
Выбор «дерева целей»…
143
б) время получения информации;
в) стоимость информации.
Подмножества критериев нижнего уровня в различных иерархиях могут
пересекаться. Это необходимо учесть, чтобы избежать лишних исследований.
Как вариант постановки задачи, время и стоимость рассматриваются как ограничения, сводя задачу выбора иерархии к однокритериальной.
3. Выбрать схему скаляризации векторного критерия ИП для критериев
ПР нижнего уровня (в дальнейшем критерий ПР в иерархии будем называть
КПР, а критерий информационной полезности КПР – КИП). Предполагается,
что в качестве решающего правила сравнения альтернатив (конкретный
КПР – это оцениваемая альтернатива) используется теория полезности.
4. Выбрать правило оценивания иерархии в целом по множеству КИП
терминальных вершин дерева.
2. ПОДХОД К РЕШЕНИЮ ЗАДАЧИ
Процесс формирования допустимых иерархий не представляет алгоритмической трудности. Кроме того, допустимы эвристики со стороны ЛПР.
Формализацию критерия диагностичности информации, получаемой от
ИИ, можно осуществить двумя путями:
 используя ожидаемую энтропийную оценку остаточной неопределенности КПР при «наилучшем» расходе имеющихся информационных ресурсов;
 диагностичность ИИ и ожидаемый уровень энтропии тесно связаны
между собой через параметр правдоподобия полученной информации, используемый в формуле Байеса. Следовательно, правдоподобие – это другая
возможная формализация диагностичности.
Вышеуказанные формализации можно провести для неопределённости,
порождённой как случайностью, так и нечёткостью [3]. В любом случае, для
оценки КИП требуется решение следующих задач:
 формирование допустимых алгоритмов управления ИИ (алгоритмов
использования информационных ресурсов);
 оценка диагностичности, времени, стоимости алгоритма управления ИИ.
При решении первой задачи необходимо определить ИИ, информация которых существенно влияет на неопределенность КПР. Нечеткость понятия
«существенно» требует восстановления функции принадлежности нечеткому
множеству существенных связей.
Проверка данного условия связана с построением структуры, устанавливающей отношение US «влияния» информации ИИ на неопределенность КПР.
Синтез подобной структуры, названной семантической моделью процесса
устранения неопределенности (СМ ПУН) [4], является первым этапом решения задачи оценки КИП.
144
Б.Р. Шегал, Е.К. Молодкин
На втором этапе требуется параметризация данной структуры [5], в зависимости от принятого уточнения понятия «диагностичность».
Прежде чем описывать процедуру синтеза СМ ПУН, рассмотрим правила
построения абстрактных семантических моделей, для задания которых используется специальный семантический язык. Семантику языка L, на котором
сформулировано интересующее понятие, могут отображать другой язык L и
правила перевода с L на L. Толкования понятий на L не должны иметь омонимии и полисемии. Разрешающая способность языка L должна быть ограничена, так как этот язык служит не для усовершенствования L, а для его описания. Язык с такими свойствами определяется как семантический язык.
Отличительная его черта – хорошо развитая семантика и весьма ограниченный круг грамматических правил. Грамматика такого языка может быть в
простейшем случае задана структурно-лингвистическим трафаретом (СЛТ),
на основе которого формируется высказывание.
СЛТ может отображать семантическую модель, которая ставит в соответствие целям системы ресурсы для их достижения. Модель высказываний на
языке L, описывающая элементы L, определяется как семантическая модель.
В СМ ПУН для задания языка L целей используется целевой глагол «устранить», который объединяется с названиями неопределенностей из множества {Hi}. После определения понятий L необходимо сформировать L, указав
его алфавит и правила перевода L → L, в соответствии с которыми и конструируются семантические модели. С точки зрения соответствия между понятиями из L и L, интерпретация отношения US «применяемости» ИИ для КПР
следующая. Понятие языка L «Устранить H(КПРi)» имеет связь (соответствие)
с понятием языка L «Устранить неопределенность Qjk», т.е. снижение неопределенности КПР эквивалентно по смыслу снижению неопределенности выходного сообщения ИИ с номером k при j-ом варианте управления. Алфавит
L может включать не только выходные переменные ИИ. Выходные переменные эквивалентны «информационным ресурсам», которые содержат источники для устранения H(КПРi ). Это нижний семантический предел языка L'. Помимо {Qj}, могут существовать другие переменные или признаки описания
среды, имеющие связь с КПРi . Другими словами, между понятиями L и данными признаками может быть установлено соответствие в смысле СЛТ, т.е.
понятие «Устранить неопределенность признака Bl» включается в алфавит
языка L.
Если признак Bl информативен (существует US) для КПРi, а вариант
управления Vjk информативен для Bl, то считается, что Vjk информативен для
КПРi, но при воздействии через Bl. Однако тот же вариант управления может
и непосредственно влиять на неопределенность КПРi . Связь признаков и вариантов управления отражается путем их соединения дугами при построении
семантического графа. Ориентация дуг графа соответствует направлению
движения информации.
Выбор «дерева целей»…
145
Рассмотрим проблему скаляризации КИП.
Пусть отношение предпочтения на множестве алгоритмов управления ИИ
по КПРi обладает свойствами линейности и транзитивности. Тогда, допуская,
что все три частных критерия (диагностичность, время, стоимость) независимы по предпочтению, и следуя теории полезности [2], скалярное значение
КИПi можно представить в следующем виде:
3
W (КПРi ) 
  j v j (КПРi ) ,
j 1
где W (КПРi ) – общее значение КИП по шкале полезности для КПРi,
 j – весовой коэффициент важности частного критерия КИПj, j = 1, 3,
v j (КПРi ) – частная функция полезности по j-ому КИП.
Вид частных функций полезности для трёх составляющих КИП восстанавливает ЛПР. Также, оно задаёт значения весов критериев.
Общая полезность КИП, по анализируемой иерахии в целом, определяется
как взвешенная сумма КИПi по всем КПР данной иерархии, где i – индекс КПР.
n
Wk   iW (КПРi ) ,
i 1
где Wk – информационная полезность k-ой иерархии (дерева) в целом, i –
весовой коэффициент значимости i-го КПР, W(КПРi ) – значение КИП для
КПРi.
Лучшей считается иерархия, обладающая максимальным значением Wk.
Теперь рассмотрим вопросы получения и использования информационных ресурсов, за счёт которых повышается значение КИП. Дополнительная
информация, снижающая неопределенность, является продуктом источников
информации. Она может быть получена одним из трех видов эксперимента:
натурным, модельным или экспертным. Идеальным случаем была бы возможность получать информацию от всех имеющихся ИИ, используя различные функции источников. Тогда снижать неопределенность можно до предела, определяемого принципиальной невозможностью получить требуемую
информацию. Однако, учитывая ограничение на время сбора и обработки информации (оперативные требования), все множество полезных ИИ применить
не удается. Следовательно, встает задача выбора подмножества ИИ из заданного множества и функций этих источников, обеспечивающих минимальную
остаточную неопределенность значений вершин дерева целей. Введем основные определения.
Под управлением конкретным источником (измерительным прибором,
моделью, экспертом) будем понимать задание (запрос) на формирование информации определенного содержания.
Б.Р. Шегал, Е.К. Молодкин
146
О1. Вариант управления источником – это задание на формирование значения конкретной выходной переменной плюс процесс функционирования
ИИ при данном задании.
Например, «передвижной станции контроля качества воздуха (ПСК) N1,
являющейся ИИ, измерить концентрацию фенола в зоне N2».
Формализация понятия ИИ должна предусматривать оценки времени и
стоимости использования источника при данном функциональном применении. Это следует из необходимости учета временных и стоимостных ограничений при анализе стратегий получения информации. Поскольку информация
используется для изменения «меры возможности» значений параметров, модель ИИ должна приводить оценки правдоподобия формируемых значений
переменных.
Характеристики времени, стоимости получения информации и ее правдоподобия в общем случае ситуативны, т.е. зависят от условий среды, в которой
функционирует источник, что должно быть отражено в модели ИИ. Это относится к экспертному и натурному эксперименту. Модель M ИИ, отражающая
вышеописанные свойства источника, может быть представлена следующим
образом:
M = <U, G, Фq>,
где U – множество управлений или запросов, определяющих содержание выходной информации ИИ, где каждый элемент множества соответствует конкретному варианту управления;
G – условия среды, в которой функционирует ИИ, где G могут запрещать
формирование информации; Фq – векторное отображение,
Фq: U×G → (Q, Tии, Cии, Оп),
Фq = (Фq1, Фq2, Фq3, Фq4),
где Q – множество выходных переменных ИИ или видов сообщений; Tии –
множество отрезков времени, соответствующих вариантам управления между
моментами поступления запроса и получения информации; Cии множество
значений стоимости получения различных видов сообщений; Оп – правдоподобие выходной информации различного вида.
О2. Алгоритм управления источниками – это последовательнопараллельный способ объединения вариантов управления ИИ, позволяющий
формировать на некотором временном интервале совокупность сообщений
различных видов для устранения неопределенности конкретной ситуации.
Остаточная неопределенность ситуации служит критерием выбора ИИ и
их функций. Она является функцией применяемого алгоритма управления
ИИ. При решении задачи выбора ИИ должны выполняться ограничения на
время получения информации и ее стоимость.
Выбор «дерева целей»…
147
При альтернативной формализации понятия «диагностичность», отмеченной выше, т.е. при замене энтропийного критерия правдоподобием информации источников, постановка задачи выбора ИИ следующая.
Целевая функция для выбора алгоритма управления ИИ записывается
следующим образом:
 Fki ki  max ,
i ki
где Fki – правдоподобие алгоритма с номером k по КПРi;
βki – булева переменная, равная 1, если алгоритм управления ИИ анализируется на предмет снижения неопределенности КПРi и 0 в противном случае.
ЗАКЛЮЧЕНИЕ
Некоторые замечания по поводу работы с системой критериев.
Эффективность применения модуля управления ИИ зависит от адекватности оценок неопределённости. Когда критерии оценены, используется выбранный метод ПР в условиях многокритериальности. Здесь речь идет не об
«оптимальном» решении, а о том, что следует понимать под «оптимальным»
решением, поскольку каждое ЛПР, пусть и в рамках типового сценария, имеет
свои предпочтения на множестве критериев.
Подобный субъективизм является основной особенностью системного
анализа, как метода исследования слабоструктурированных объектов.
При принятии решений ЛПР выступает носителем интересов определенной организации. Поэтому решение должно приниматься на логической, а не
на психологической основе. Сложность альтернатив редко позволяет проводить их непосредственное сравнение. Поэтому у сравниваемых объектов стараются выделить определенные стороны или показатели и сравнивать их на
основе значений этих показателей, т.е. сравнение объектов происходит с помощью сравнения векторов. Задание информации об объектах в виде вектора
еще не определяет предпочтения между объектами. Для этого нужна совокупность решающих правил. При сравнении двух альтернатив может быть четыре
итога:
1) a > b, альтернатива a предпочтительнее альтернативы b;
2) b > a, b предпочтительнее а;
3) a = b, a равнозначна b;
4) a  b, a и b не сравнимы.
Для упрощения поиска оптимальной альтернативы на сложных бинарных
отношениях можно в соответствие каждой альтернативе поставить действительное число , а далее применять стандартные методы оптимизации. Тогда
(a)  (b)  a  b ;
Б.Р. Шегал, Е.К. Молодкин
148
(a)  (b)  a  b .
Если предпочтения ЛПР удовлетворяют условиям линейности и транзитивности, то можно переходить к построению функции , которая называется
функцией полезности.
Исторически выделено два языка ПР:
 язык бинарных отношений (попарное сравнение альтернатив);
 язык критериев качества (каждая альтернатива это аргумент функции,
определяющий её полезность).
Развитие изложенного подхода к выбору иерархии целей слабоструктурированной системы [4] заключается в совместном учёте критерия информационной полезности и семантической точности отражения аспектов заинтересованности ЛПР. В этом случае необходимо обосновать формулу используемой
функции полезности.
[1] Шегал Б.Р. Принятие решений при проектировании АСОИУ / Учеб.
пособие. – Новосибирск: Изд-во НГТУ, 2005. – 50 с.
[2] Кини Р.Л., Райфа Х. Принятие решений при многих критериях: предпочтения и замещения. – М.: РиС, 1981. – 560 с.
[3] Шегал Б.Р. Меры ценности информации в системах принятия решений. – Новосибирск: НГТУ, 1999. – 17 с.
[4] Шегал Б.Р. Модели информационных процессов в сложных системах. – Новосибирск: НГТУ, 1996. – 42 с.
[5] Шегал Б.Р. Компенсация риска оценки нечётких переменных во фреймах-сценариях управленческой деятельности и экспертных системах // Научный вестник НГТУ. – 2006. – № 3(24)– С. 116–122.
Шегал Борис Романович – кандидат технических наук, доцент кафедры
автоматизированных систем управления Новосибирского государственного
технического университета. E-mail: sheg@ngs.ru.
Молодкин Евгений Константинович – магистрант кафедры автоматизированных систем управления Новосибирского государственного технического
университета. E-mail: burivuh@gmail.com.
B.R. Shegal, E.K. Molodkin
Choice of «Relevance tree» by criterion of information utility
The model of an optimal “relevance tree” choice during the phase of objectives and criteria
system forming in decision making is described. A measure of accuracy and time of criteria
estimating, that is called “information utility”, is a criterion of objectives hierarchy choice.
This work investigates problems of “information utility” calculation under various strategies
of information sources control. As in any multi-criterion decision making problem the main
difficulties are connected with the principle of rational choice.
Key words: relevance tree, hierarchy, decision making, criterion, information utility.
Download