2009_3 - E-study.in.ua

advertisement
УДК 519.9
И.И. РЯСНАЯ, А.Н. ХОДЗИНСКИЙ
Институт кибернетики им. В.М. Глушкова НАН Украины, riasnaia@gmail.com
ОБ АДЕКВАТНОСТИ МЕР СХОДСТВА ПРИ ИСПОЛЬЗОВАНИИ
КАЧЕСТВЕННЫХ ХАРАКТЕРИСТИК ОБЪЕКТОВ
Введение. Структуры эмпирических систем часто исследуются путем построения и анализа мер
сходства на базе нечетких качественных характеристик объектов. Эти меры используются для решения конкретных задач классификации, прогноза либо оптимизации с использованием функций принадлежности нечетких множеств, измеренных в различных шкалах. Для доказательства адекватности
получаемых результатов, прежде всего, необходимо в рамках репрезентативной теории измерений
доказать адекватность используемых мер сходства. В данной работе рассматриваются некоторые логические аспекты построения мер сходства на базе нечетких качественных характеристик и условия
адекватности таких мер.
Постановка задачи. Построить нечеткую меру сходства на базе нечетких данных измерений качественных характеристик объектов эмпирической системы с использованием нечетких операторов
[1] и исследовать эту меру в рамках репрезентативной теории измерений [2, 3].
Основные понятия и определения. Пусть X – конечное множество элементов эмпирической
системы (ЭС), W – конечное множество качественных характеристик элементов множества X . Качественной характеристике w  W поставим в соответствие множество T  t1,..., tm  вербальных
значений этой характеристики, m  m  w  .
Характеристику w  W считаем измеримой, если x  X можно определить множество значений 1  x  , ..., m  x  , где k  x  определяет степень принадлежности характеристики w элемента
x значению tk , k  1, m , k  x   0,1 . Обозначим μ  x   1  x  , ..., m  x   . Если μ  x   0 , то полагаем, что элемент x не обладает характеристикой w , и наоборот, если μ  x   0 , то элемент x обладает характеристикой w . Иначе говоря, измеримость качественной характеристики w  W предполагает, что можно определить отображение μ : X  T  0,1 . Для конкретной характеристики w  W
множество векторов μ  x  : x  X  образуют матрицу, называемую обычно матрицей “объектсвойство”, а совокупность таких матриц описывает конкретную эмпирическую систему.
Данная модель охватывает случай как четких, так и нечетких характеристик. Если качественная
характеристика бинарна, то матрица “объект-свойство” состоит из одного столбца, содержащего
только нули или единицы, что соответствует ложности или истинности утверждений о наличии у
объекта конкретной характеристики. Если же четкая характеристика имеет несколько значений, то
строчки матрицы содержат не более одной единицы, поскольку эти значения считаются несовместимыми. Значение k  x  нечеткой качественной характеристики w , лежащее в интервале  0,1 , может
рассматриваться как степень истинности утверждения: “характеристика w объекта x имеет значение
tk ”. Кроме того, допускается совместимость значений характеристик, т.е. строчки матрицы “объектсвойство” могут содержать любое количество (пределах от 1 до m ) отличных от нуля чисел.
Нечеткой мерой сходства на множестве X называется отображение
(1)
 : X  X  [0,1] ,
удовлетворяющее условиям рефлексивности –   x, x   1 x  X , и симметричности –   x, y  
   y, x  x, y  X .
Будем говорить, что отображение (1) задает на X нечеткое отношение сходства  , т.е.
x, y  X
x  y    x, y   0 .
Если  : X  X  0,1 , то получаем обычное (четкое) отношение сходства  , которое может
быть определено в рамках традиционной формальной логики. Обычное отношение сходства удовлетворяет одному из основных законов формальной логики – закону исключения третьего: элементы
могут быть только либо сходны   x, y   1 , либо несходны   x, y   0 . Отношением (четкой) эквивалентности  называется отношение сходства  , удовлетворяющее условию транзитивности
(2)
 xy  &  yz    xz  x, y, z  X .
Нечеткое отношение сходства является аналогом отношения обычного сходства, однако, в рамках нечеткой логики закон исключения третьего не соблюдается. Для нечетких множеств условие
транзитивности отношения нечеткого сходства  можно сформулировать в общем виде следующим
образом:
(3)
  ,
где – оператор композиции нечетких отношений.
Матрицу, соответствующую этому отношению на X , обозначим R . Элементы матрицы
   x, y  представляют собой оценку сходства элементов множества X . Способ композиции матриц
определяется теоретико-множественной интерпретацией семантических операторов И (and), ИЛИ (or)
в форме логических операторов того или иного вида. Логическим эквивалентом семантического оператора И является оператор нормы, а оператора ИЛИ – оператор конормы [1]. В рамках нечеткой логики, связанной с теорией нечетких множеств, существует значительная свобода в выборе вида логических эквивалентов семантических операторов. В данной работе будут использоваться только операторы, введенные Заде и Лукасевичем.
Системой с отношениями M называется кортеж M = A, R1, ... , R p , где A – непустое множество, называемое областью задания системы с отношениями, R1, ... , R p – отношения на A . Если
множество A состоит из эмпирических объектов и отношения на A определены эмпирически, то система M называется эмпирической системой с отношениями. Если A  Rn , где R – множество действительных чисел, система M называется n -мерной числовой системой с отношениями. Если A –
множество нечисловых математических объектов (например, векторов, функций, матриц), то система
M называется математической системой с отношениями.
Шкалой называется гомоморфное либо изоморфное отображение эмпирической системы с отношениями в числовую или математическую систему с отношениями.
В работах [2, 3] для качественных характеристик рассматриваются только две шкалы: номинальная и шкала порядка. Шкала порядка вводится на основе отношения порядка в ЭС только для
одномерных характеристик, поскольку в общем случае множество векторов невозможно линейно
упорядочить без потери информации. Номинальные шкалы определяются и при наличии нескольких
характеристик на основе отношения эквивалентности в ЭС. Шкалы в [2, 3] вводятся только для четких характеристик. В данной работе рассматривается нечеткая шкала сходства объектов эмпирической системы, качественные характеристики которых описываются нечеткими множествами. Несмотря на то, что значения функций принадлежности нечетких множеств могут измеряться в шкалах
разного типа, величина нечеткого сходства объектов, как показано ниже, измеряется в абсолютной
шкале, для которой допустимы только тождественные преобразования.
При построении формальных моделей эмпирических систем, в которых используется эмпирическая информация о нечетких свойствах, необходимо обоснование применения операций к значениям
принадлежности. Согласно критерию “адекватности-инвариантности” [4], должна иметь место адекватность операции относительно допустимых преобразований в шкале, в которой измерена принадлежность. Этого можно достичь в случае, когда имеет место инвариантность результатов операции
относительно допустимых преобразований соответствующих шкал.
Построение нечеткой шкалы сходства. Согласно репрезентативной теории измерений при построении любой шкалы возникают три проблемы: 1) проблема существования, состоящая в необхо-
димости доказательства гомоморфизма либо изоморфизма формальной модели и эмпирической системы; 2) проблема адекватности, связанная с доказательством того, что предлагаемый способ построения шкалы обеспечивает независимость содержательных выводов от допустимых преобразований первичных данных измерения; 3) проблема единственности, состоящая в выявлении типа допустимых преобразований результатов измерений [2].
Для пояснения сущности рассматриваемых проблем построим нечеткую шкалу сходства для одной качественной характеристики w  W . Такую шкалу будем называть парциальной нечеткой шкалой сходства.
Обозначим FX – множество всех нечетких подмножеств множества X ; FT – множество всех
нечетких подмножеств множества T ; R – нечеткое отношение на X  T ; μ R  x, tk  – функция принадлежности, определяющая нечеткое отношение R , x  X , k  1, m .
Пусть  : X  FT – отображение, называемое описанием измерений характеристики w  W , та-


кое, что tk  T x  X  x (tk )   R ( x, tk ) ; Dx   x   tk ,  x  tk  : tk  T – нечеткое подмножество множества T , назовем его нечетким описанием измерения характеристики w  W объекта
x  X ;  = Dx : x  X  – множество нечетких описаний измерений характеристики w .
Пусть  : T  FX – отображение, называемое описанием значений лингвистических термов
tk  T , такое, что x  X tk  T t k ( x )  μ R  x, tk  ; Ek    tk  
 x , t
k
 x
: xX
 – нечеткое
подмножество множества X . Назовем Ek нечетким значением (смыслом) лингвистического терма
tk  T .
Определим на множестве X отношение (четкой) эквивалентности  : xy  Dx = D y . Иначе
говоря, элементы x и y эквивалентны, если равны результаты измерений качественной характеристики w . Обозначим через X  – фактор-множество (множество классов эквивалентности множества X ), а совокупность классов эквивалентности множества  – фактор-множеством   .
Пусть на множестве  нечетких описаний измерений характеристики w  W существует адек-


ватное нечеткое отношение сходства * Dx , D y , т.е. существует адекватная нечеткая мера сходства
между нечеткими подмножествами Dx   x  и D y    y  . Пусть   x, y  – парциальное отношение
сходства на X , определяемое на базе сравнения эмпирических объектов по характеристике w  W .
Положим, что
(4)
  x, y  = * Dx , D y .


Согласно (4) отношение сходства   x, y  порождается сходством нечетких подмножеств
D x , D y , представляющих собой результаты измерений характеристики w . Эти подмножества порож-
дают матрицу сходства R* , с помощью которой определяется отношение сходства в формальной
модели эмпирической системы.
В результате определена эмпирическая система M 1 = X , ,  с двумя отношениями: отношением
эквивалентности  и отношением сходства  , и гомоморфная ей (по построению) математическая
система M 2 = FT , ,  * с отношением равенства  и отношением сходства  * нечетких подмножеств, являющихся результатами измерений характеристики w  W .
Парциальной нечеткой шкалой сходства будем называть кортеж M 1, M 2 , .
Парциальная нечеткая шкала сходства представляет собой способ вычисления (производного
измерения [2]) нечеткой меры сходства значений некоторой качественной характеристики w  W
элементов x  X . Сходство значений характеристики элементов x  X определяется сходством нечетких вербальных описаний результатов измерений с помощью нечетких подмножеств. В свою оче-
редь, сходство этих нечетких подмножеств порождается сходством значений (смыслов) термов, каждое из которых – нечеткое подмножество множества X .
Перейдем к исследованию проблемы адекватности построенной нечеткой шкалы сходства. Из
выражения (4) следует, что x  y    tk  T  :  x  Ek  and  y  Ek  , где степени истинности


утверждений x  Ek , y  Ek равны, соответственно, t k  x  , t k  y  .
Поскольку T  tk k 1 , то
m
  x, y  
 x  E1  and  y  E1  or ... or  x  Em  and  y  Em  ,
где and, or – соответственно, семантические операторы И, ИЛИ. Заменяя семантические операторы
их теоретико-множественными эквивалентами – треугольными нормами T и конормами
, полу-

чим функцию принадлежности нечеткой меры сходства
   x, y  
  T  t
tk T
k
 x  , tk  y   .
(5)
Такое выражение для вычисления меры сходства количественных характеристик объектов использовалось в работе [5].
Теорема 1. Нечеткая мера сходства, вычисляемая в соответствии с выражением (5), неадекватна
при измерении значений нечеткой качественной характеристики w  W в шкале порядка, отношений
или интервалов.
Доказательство. Формальная модель M 2 = FT , ,  * представляет собой математическую
систему с отношениями, в которой вербальное описание значений характеристики w  W возможно
при измерении значений t k  x  в различных шкалах. Для доказательства теоремы достаточно исследовать условия, при которых мера сходства (5) удовлетворяет условиям симметричности и рефлексивности.
Симметричность меры сходства следует из симметричности любой треугольной нормы [3]. Согласно (4) рефлексивность меры   следует из рефлексивности меры  * . Допустим, что мера  *


удовлетворяет условию рефлексивности, т.е. выполняется условие * Dx , Dx  1 .
Будем рассматривать нечеткие операторы, введенные Заде,
T  a, b   min  a, b  ,
 a, b  max  a, b , a, b[0,1] ,

и нечеткие операторы, введенные Лукасевичем,
T  a, b   max  0, a  b  1 ,
 a, b  min 1, a  b , a, b[0,1] .
Пусть значения t k  x  измеряются в абсолютной шкале, для которой допустимы только тождественные преобразования [3]. При этом в выражении (5) можно использовать любую из рассматриваемых норм.
Для нормы по Заде выполняется условие идемпотентности
водит к выражению
   x, x  
 t
tk T
k
T
t
k
 x  , tk  x   = tk  x  , что при-
 x  =1.
(6)
Если использовать определение нормы по Лукасевичу, то нетрудно показать, что условие рефлексивности не соблюдается, в случае, когда все значения функции принадлежности меньше или
равны 0,5.
При использовании в (6) конормы по Заде получим
 t
tk T
k
 x  = max tk  x   =1.
tk T
Иначе говоря,
значение функции принадлежности для одного из термов должно равняться 1. Очевидно, что в боль-
шинстве случаев это условие не будет выполняться. При использовании в (6) конормы по Лукасевичу


получим    x, x  
tk  x   min  1,
tk  x    1 .
 t T

tk T
 k

Следовательно, при измерениях в абсолютной шкале условие рефлексивности нечеткой меры
сходства принимает вид
(7)
 tk  x   1 .



tk T
Будем называть условие (7) необходимым условием адекватности мер сходства, вычисляемых
по формуле (5).
В [5] использовалось условие
 tk  x   1 .

tk T
Допустим, что для произведенных измерений выполняется условие (7), но значения функций
принадлежности измеряются не в абсолютной шкале, а в шкале отношений либо в шкале интервалов,
либо в шкале порядка. Для шкалы отношений и интервалов допустимы, соответственно, преобразования вида tk  x  = tk  x  , tk  x  = t k  x    ,   0 . Очевидно, что данные преобразования монотонны и существует 0    1 , при котором условие (7) будет нарушено. В шкале порядка допустимы произвольные монотонные преобразования измеренных значений принадлежности, которые не
нарушают порядок измеренных величин, в том числе и рассмотренные выше, которые приводят к
нарушению условия рефлексивности. Теорема доказана.
Случай измерения значений t k  x  в номинальной шкале не будем рассматривать, поскольку
“измерение принадлежности в шкале наименований не является естественным, так как определение
нечеткого множества предполагает некоторый порядок объектов от принадлежности к непринадлежности” [4]. Шкала наименований слишком бедна, чтобы вводить на ней отношение порядка и связанное с ним отношение нечеткой принадлежности. Поэтому термин «нечеткая номинальная шкала»,
используемый в [5], на наш взгляд, не является удачным, так как затемняет сущность рассматриваемых структур в эмпирических системах. Это становится очевидным при исследовании проблем адекватности.
Таким образом, показано, что при использовании выражения (5), адекватную нечеткую меру
сходства можно построить только при измерении первичных характеристик в абсолютной шкале и
выполнении условия (7), которое не всегда может соблюдаться. Однако, проблема построения адекватной меры сходства при измерении нечетких характеристик в шкалах порядка, отношений и интервалов разрешима. Приведем пример построения адекватной нечеткой меры сходства, определяемой
на основе коэффициента лингвистической корреляции [6].
Коэффициент лингвистической корреляции. Коэффициент лингвистической корреляции вычисляем по формуле
Klingv  x, y  
  x, y  
i
Dxi
 Diy
Dxi
 Diy

m  wi 

k 1
N

1
i  x, y  ,
N i 1

min tk  x  , tk  y 
(8)
m  wi 
 
k 1


max tk  x  , tk  y  ,
(9)
где i  x, y  – парциальный коэффициент лингвистической корреляции элементов x, y  X , определяемый по характеристике wi  W ;   мощность нечеткого подмножества Z ; Z 



zSupp Z
Z  z  ;
Supp Z – носитель нечеткого подмножества Z , Supp Z  z  Z  Z ( z )  0 ; N – общее количество
характеристик.
Положим    x, y  = Klingv  x, y  .
Теорема 2. Нечеткая мера сходства, построенная на основе коэффициента лингвистической корреляции, вычисляемого по формулам (8), (9), адекватна при измерении значений функции принадлежности качественных характеристик w  W в шкале отношений и абсолютной шкале.
Доказательство теоремы аналогично доказательству, приведенному в [6]. Симметричность меры
очевидна. Нетрудно показать, что при измерениях первичных характеристик в шкалах отношений и
абсолютных шкалах такая нечеткая мера сходства рефлексивна без необходимости требования выполнимости условия (7), т.е. при любом значении
tk  x  . Легко также показать, что при измере-

tk T
нии первичных характеристик в шкале отношений x, y  X значение Klingv  x, y  инвариантно при
допустимых преобразованиях.
Следовательно, мера сходства    x, y  адекватна и измеряется в абсолютной шкале.
Лемма. При измерении значений функции принадлежности качественной характеристики в
шкале порядка существует допустимое монотонное преобразование t  x    t  x  , приводящее
k


k
к инвариантности значений функции принадлежности.
Такое преобразование легко построить на базе вычисления значений рангов и нормировке на
максимальное значение рангов.
Теорема 3. Нечеткая мера сходства, построенная на основе коэффициента лингвистической корреляции, вычисляемого по формулам (8), (9), после применения преобразования t  x    t  x 
k

k

адекватна при измерении значений функций принадлежности качественных характеристик w  W в
шкалах порядка.
Значения tk  x  измеряются в абсолютной шкале. Дальнейшие преобразования не меняют тип
шкалы. Таким образом, x, y  X Klingv  x, y  будет инвариантен, т.е. адекватен.
Аналогичным способом нетрудно доказать следующую теорему.
Теорема 4. Нечеткая мера сходства, построенная на основе коэффициента лингвистической корреляции, адекватна при измерении значений функций принадлежности качественных характеристик
w  W в шкалах интервалов и применении преобразования  к измеренным значениям функций
принадлежности.
Заключение. В работе показано, что адекватную нечеткую меру сходства можно построить
только в том случае, если правильно определены типы шкал, в которых проведены первичные измерения характеристик объектов. Способ построения адекватной нечеткой меры сходства зависит от
типа шкал, в которых производится измерение первичных характеристик.
Таким образом, задача исследования типа шкалы, в которой проведено измерение той или иной
характеристики – необходимая часть процедуры построения адекватной нечеткой меры сходства.
При отсутствии такого исследования мера сходства может оказаться неадекватной, т.е. непригодной
для анализа структуры эмпирической системы.
1.
2.
3.
4.
5.
6.
Нечеткие множества в моделях управления и искусственного интеллекта / Под ред. Д.А. Поспелова.  М.:
Наука, 1986.  312 с.
Суппес П., Зинес Дж. Основы теории измерений // Психологические измерения. – М.: Мир, 1967.– С. 9–110.
Пфанцагль И. Теория измерений. – М.: Мир, 1976. – 248 с.
Блишун А.Ф. Сравнительный анализ методов измерения нечеткости // Изв. АН СССР. Техническая кибернетика. – 1988. – № 5. – С. 152–175.
Benoit E., Foulloy L. Towards fuzzy nominal scales // Measurement. – 2003. – 34. – Р. 49–55.
Рясная И.И. О мерах сходства и различия на гетерогенных множествах // Компьютерная математика. –
2007. – № 2. – С. 5158.
Download