УДК 007.52 Ройзензон Г.В. Институт Системного Анализа РАН, г. Москва, Россия [email protected] СНИЖЕНИЕ РАЗМЕРНОСТИ ПРИЗНАКОВОГО ПРОСТРАНСТВА С ИСПОЛЬЗОВАНИЕМ МЕТОДА «ИСКРА»* АННОТАЦИЯ В статье исследуется проблема снижения размерности признакового пространства с использованием метода «Искра». Предлагаемый метод применяется в многокритериальных задачах принятия решений. В работе приводится алгоритмическая процедура решения задачи снижения размерности признакового пространства, основанная на использовании комбинации методов вербального анализа решений. Представлены примеры решения практических задач. ВВЕДЕНИЕ В задачах принятия решений достаточно часто рассматриваются слабо структурируемые проблемы, сочетающие количественные и качественные зависимости, причем недостаточно определенные стороны проблемы имеют тенденцию доминировать. При решении таких задач необходимо учитывать большое количество технических, экономических, политических и психологических аспектов. Соответственно, объекты, рассматриваемые в рамках таких задач, можно представить как многопризнаковые (МПО). Провести сравнение таких объектов и выбрать среди них лучший не удается, так как эти объекты, как правило, оказываются несравнимыми. Это, в основном, обусловлено тем, что число сравниваемых объектов, как правило, невелико (до 10), а описывающие их признаки (например, технические и эксплуатационные характеристики) разнообразны, различны по значениям и достаточно многочисленны (десятки и сотни). Необходимость применения методов снижения размерности признакового пространства (ПП) крайне актуально для решения задачи построения компьютерной модели эксперта [1]. Во многих практических случаях задача создания компьютерной модели Работа поддержана программами фундаментальных исследований РАН «Фундаментальные проблемы информатики и информационных технологий» и ОИТВС РАН «Фундаментальные основы информационных технологий и систем», Российским фондом фундаментальных исследований (проекты 04-0100290, 05-01-00666, 06-07-89352). * 2 опытного специалиста может быть представлена как задача многокритериальной классификации, так как экспертное знание часто состоит в отнесении объектов к классам решений. Эффективность метода многокритериальной классификации оценивается числом обращений к эксперту, необходимых для построения полной непротиворечивой классификации. Соответственно уменьшение размерности ПП является одним из основных подходов, который позволяет существенно сократить число вопросов к эксперту. Для упрощения процедуры сравнения или классификации МПО по их свойствам предлагается предоставить в распоряжение ЛПР (лица, принимающего решение) соответствующий инструментарий, дающий возможности агрегирования большого числа характеристик в небольшое число критериев, имеющих небольшие шкалы оценок, отражающих предпочтения ЛПР. Использование вербальных шкал оценок по критериям позволяет ввести в рассмотрение сложные и субъективные понятия, учесть неопределенность, что характерно для описания сложных объектов. МЕТОД «ИСКРА» СНИЖЕНИЯ РАЗМЕРНОСТИ ПРИЗНАКОВОГО ПРОСТРАНСТВА В общем виде задача снижения размерности ПП может быть представлена следующим образом: x(1),…, x(m)y(1),…, y(m’), m’<m, где x – исходный набор признаков, y – новый набор признаков, m – размерность исходного ПП, m’ – размерность нового ПП. Известно достаточно большое число методов снижения размерности ПП, в частности, можно упомянуть регрессионный, дискриминантный и кластерный анализы [3]. Однако такие процедуры требуют «хороших» статистических рядов, которые могут отсутствовать при решении новых задач. В ряде случаев сбор подобной статистики может потребовать больших временных затрат, что не всегда представляется возможным. Среди способов снижения размерности ПП важно отметить методы векторной стратификации [4] и теорию гранулирования информации [5]. Альтернативный подход базируется на опыте и интуиции экспертов, при содействии которых может быть решена задача агрегирования. Так, при помощи экспертов может быть сформирован исходный набор характеристик рассматриваемых объектов. Далее эти характеристики необходимо объединить в независимые группы критериев, обладающих вербальными порядковыми шкалами с небольшим числом градаций (3-5). При этом необходимо разработать язык описания качества рассматриваемых объектов, 3 который, с одной стороны, будет одобрен экспертами, а с другой стороны, понятен ЛПР при осуществлении окончательного выбора или классификации [2]. Необходимо отметить, что подобная процедура может иметь итеративный характер, т.е. полученные группы критериев могут быть в свою очередь объединены в новые группы (следующий уровень иерархии) и т.д. О разработке порядковых вербальных шкал критериев следует сказать отдельно, поскольку уже на данном этапе можно частично сократить размерность рассматриваемых задач (например, при выборе числа градаций шкал критериев). Для разработки такой процедуры необходимо рассмотреть основные типы шкал и соответствующие операции на шкалах. Данный вопрос детально рассматривается в работах по теории измерений [6]. В соответствии с теорией измерений можно выделить следующие типы шкал: абсолютная шкала, шкала отношений, шкала интервалов, шкала порядка и шкала наименований. Таким образом, задача сокращения размерности ПП может быть частично решена уже на стадии выбора (преобразования) типов шкал исходных (базовых) характеристик. Проблема снижения размерности ПП также решается с применением иерархических систем критериев с вербальными шкалами оценок для представления МПО. В рамках метода «ИСКРА» (Иерархическая Структуризация Критериев и Атрибутов) предлагается следующая процедура. Первоначально составляется перечень всех базовых показателей объекта (например, список технических характеристик). Характеристики, описывающие объекты, можно представить в виде иерархической системы, нижним уровнем которой служат выделенные базовые показатели. Далее ЛПР по своему усмотрению определяет число и состав критериев, их содержание. В качестве критерия можно выбрать один из базовых показателей или несколько характеристик, объединенных в составной критерий. ЛПР устанавливает, какие базовые показатели будут считаться самостоятельными критериями, а какие будут отнесены к тому или иному составному критерию. Далее формируются вспомогательные шкалы оценок для каждого базового показателя. Шкалы могут иметь числовые (точечные, интервальные) или вербальные оценки. Шкалы оценок могут совпадать с обычно используемыми на практике, либо конструироваться специально для данного критерия. Для формирования шкал оценок по составным критериям можно воспользоваться несколькими процедурами. 4 Наиболее простым и легко воспринимаемым ЛПР способом конструирования порядковой шкалы для составного критерия является использование однотипных наборов порядковых вербальных шкал базовых показателей и объединение одинаковых оценок в одну общую оценку по принципу: все лучшие оценки по базовым показателям образуют лучшую оценку по составному критерию, все средние оценки – среднюю, все худшие оценки – худшую. Более сложные процедуры построения шкал критериев предполагают применение методов ЗАПРОС [1] и ЦИКЛ [7], в которых необходимо рассматривать множество всех возможных векторных оценок в ПП, образованном декартовым произведением значений оценок на шкалах критериев. Метод ЗАПРОС позволяет для составного критерия построить единую порядковую шкалу, формируя ее из оценок по отдельным частным критериям. Метод ЦИКЛ предназначен для построения полной непротиворечивой порядковой классификации МПО. В нашем случае в качестве таких МПО выступают наборы оценок по базовым показателям, образующим составной критерий. При формировании шкалы оценок составного критерия важно также учесть, что одна часть характеристик, входящих в состав подобного критерия, может рассматриваться как самостоятельная, а другая часть характеристик может быть составной. Поэтому процедура построения шкалы составного критерия сама может состоять из нескольких этапов. ЗАКЛЮЧЕНИЕ Рассмотренная процедура позволяет в задачах принятия решений со многими признаками выделить группы взаимно-независимых критериев, сформулировать для них обобщенные критерии с вербальными порядковыми шкалами оценок и по построенным системам критериев получить информацию от ЛПР. Использование иерархических систем критериев дает возможность снизить размерность ПП, что положительно сказывается на общем затраченном ЛПР времени решения задачи. Предлагаемая концепция обеспечивает систематизацию имеющейся информации, анализ причин принятия окончательных решений, получение их обоснования. Разделение всех критериев на независимые группы позволяет «распараллелить» решение задачи, что также дает существенную экономию времени. Важной особенностью разработанной процедуры является возможность сформировать разные наборы критериев, с тем, чтобы сравнить полученные результаты для разных вариантов с целью оценки качества выбора. Пред- 5 ложенная концепция была использована при решении практических задач многокритериального выбора вычислительных кластеров [8] и оценки банковских кредитов в зависимости от степени риска [7]. С точки зрения дальнейших исследований, представляется интересным сравнить полученные результаты (правила классификации, результаты многокритериального выбора), основанные на опыте и интуиции экспертов, с накопленной впоследствии статистикой. ЛИТЕРАТУРА 1. Ларичев О. И. Вербальный анализ решений / Под ред. А. Б. Петровского. — М.: Наука, 2006. 2. Петровский А. Б. Компьютерная поддержка принятия решений: современное состояние и перспективы развития // Системные исследования. Методологические проблемы. Ежегодник / Под ред. Д. М. Гвишиани, В. Н. Садовского.— № 24. 1995-1996. М.: Едиториал УРСС, 1996.— С. 146–178. 3. Прикладная статистика. Классификация и снижение размерности / С. А. Айвазян, В. М. Бухштабер, И. С. Енюков, Л. Д. Мешалкин; Под ред. С. А. Айвазяна. — М.: Финансы и статистика, 1989.— 607 с. 4. Глотов В. А., Павельев В. В. Векторная стратификация.— М.: Наука, 1984.— 94 с. 5. Zadeh L. A. Toward a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic // Fuzzy Sets and Systems.— 1997.—September.— Vol. 90, no. 2.— Pp. 111–127. 6. Орлов А. И. Репрезентативная теория измерений и ее применения // Заводская лаборатория. — 1999. — Т. 65, № 3.— С. 57–62. 7. Метод многокритериальной классификации ЦИКЛ и его применение для анализа кредитного риска / А. А. Асанов, П. В. Борисенков, О. И. Ларичев, Е. В. Нарыжный, Г. В. Ройзензон // Экономика и математические методы. — 2001. — Т. 37, № 2. — С. 14–21. 8. Ройзензон Г. В. Многокритериальный выбор вычислительных кластеров // Методы поддержки принятия решений: Сборник трудов Института системного анализа Российской академии наук / Под ред. С. В. Емельянова, А. Б. Петровского. — М.: Едиториал УРСС, 2005. — Т. 12. — С. 68–94.