statistiweskimet

advertisement
А.Я с а у и у н и в е р с и т е т і н і њ х а б а р ш ы с ы, №1, 2011
З.Б.ТУКУБАЕВ
кандидат технических наук
МКТУ им. А.Ясави
В.М.ДАВЛЕТОВА
магистрант МКТУ им. А.Ясави
А.З.ТУКУБАЕВ
соискатель МКТУ им. А.Ясави
CТАТИСТИЧЕСКИЕ МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ В
ЭКСПЕРТНЫХ СИСТЕМАХ
Бұл мақалада шешімдер қабылдаудың статистикалық әдістеріне Turbo PROLOG тілінде жасалған экспертті жүйенің
прототипі көмегімен талдау жасалған.
The statistical methods of the decisions with the help of the prototype of expert system created in Turbo PROLOG are analyzed in
this article.
В настоящей статье на основе применения разработанного прототипа экспертной системы для
прогноза погоды делается анализ статистических методов принятия решений на основе
применения нечетких множеств и нечеткой логики. Такие экспертные системы применяются во
многих областях науки, образования, медицины, экономики, георазведке, юристпруденции,
прогноза погоды и других областях [2, 3].
При этом, измерение и оценка признаков (факторов таких как ветер, влажность, облачность)
для прогноза погоды производятся на основе экспертных оценок [2, 3]. Эти факторы составляют
элементы нечетких множеств F1 , F2 , F3 . Анализ методов принятия решений проводим в рамках
следующих методов; метода максимального правдоподобия гипотез, максимальной апостериорной
вероятности, метода Байеса и идеального наблюдателя- Котельникова-Зиггерта (КЗ) [4, 5]. В
рассматриваемой задаче по данным измерения можно определить априорные вероятности гипотез.
В областях, где с большей вероятностью можно принимать решение в пользу одного события нет
необходимости рассматривать события с очень маленькой условной вероятностью.
Например,исключаются из рассмотрения летние и зимние дни, где вероятность дождя имеет
мизерное значение. Но, однако, при этом нет необходимости выделять определенные области
рассмотрения; можно рассматривать всю обширную область, где присутствуют факторы хотя бы
одного события.
При применении какого-либо одного метода из вышеперечисленных условные риски или
штрафные функции определяются по формулам [5]:
r1  C1   , r2  C4   , где  ,   условные вероятности событии при заданных факторах.
В рассматриваемой задаче   условная вероятность принятия гипотезы. H 2 ,  P 2 / H1 
- называется уровнем значимости испытания, а в теории обнаружения – вероятностью ложной
тревоги;   условная вероятность принятия гипотезы. H1 ,   Q 1 / H 2 -называется
мощностью правила выбора решения.
Выбор определенного статистического решения основывается на критериях и правилах [6,7].
Под критерием понимаются некоторые условия, которым должно удовлетворять решение. Часто
на практике используют экстремальный критерий, где решение должно максимизировать или
минимизировать те или иные величины; например, условные или апостериорные вероятности.
Под правилом выбора решений понимается описания операции (действий), которые
необходимо выполнить для получения решения, удовлетворящее выбранному критерию.
В теории статистических решений под правилом можно понимать решающую функцию,
которая определяет то или иное решение при различных значениях аргумента или фактора. При
множестве факторов берется произведение их вероятностей, поскольку все факторы принадлежат
одному и тому же событию и происходят одновременно [2].
Когда имеется один фактор в одномерном пространстве на основе принятого критерия
определяется граничное значение фактора в виде точки, которая разделяет область на две части. В
каждой из этих областей принимается одно определенное решение; для двухальтернативной
задачи-  1 ,  2 , где  1 - принимается решение в пользу гипотезы H 1 , т.е будет дождь,  2 принимается решение в пользу H 2 , т.е. будет ясная погода. При этом, для каждого события по
каждому фактору строятся функций правдоподобия гипотез.
Для n факторов граничные значения определяются в n -мерном пространстве. При этом, для
каждого из решений  1 ,  2 , строятся n -параметрические вектора или функции правдоподобия
гипотез. Cамым простым правилом принятия решения является поиск максимума или минимума
этих функции по всем параметрам.
Исследование методов принятия решений проводим на базе примера прогнозирования
погоды. Рассматриваем такие факторы, как ветер, влажность и облачность. В качестве исходных
данных были заданы – факторы F1 , F2 , F3 , и соответствующие этим факторам количества случаев
H1 , H 2 , которые были приведены в таблице 1.
В рассматриваемом примере для факторов F1 , F2 , F3 построены нечеткие множества
условных статистических частностей или условных вероятностей этих факторов. При этом,
фактор F1 - (Ветер) образует нечеткое множество ( F1 , F1, F1 ), где фактор F1 - слабый
ветер, F1 - умеренный ветер, F1 - сильный ветер. Фактор F2 (Влажность) образует нечеткое


множество ( F2 , F2, F2 ), где факторы, определеяющие влажность; F2 - высокая влажность, F2 средняя влажность, F2 - низкая влажность; Фактор

множество ( F3 , F3, F3 ), где F3 - ясно, F3 - облачно,
Погода в день наблюдения
Ветер
( F1 )
Влажность
( F2 )
Облачность
( F3 )
F3 - (Облачность) образует нечеткое
F3 -
пасмурно.
Количество случаев на следующий день
173 дня.
Дождливой погоды
Погоды без осадков
( H 1 ) 53 дня; 0,3
( H 2 ) 120 дней; 0,7
Слабый
Умеренный
Сильный
19; 0,3584905660
27; 0,5094339622
7 ; 0,1320754717
52; 0,433333333333
44; 0,366666666666
24; 0,2
Высокая
Средняя
Низкая
35; 0,6603773584
12; 0,22641509433
6; 0,11320754716
18; 0,15
42; 0,35
60; 0,5
Ясно
Облачно
Пасмурно
5; 0,094339622
8; 0,150943396
40; 0,7547169811
83; 0,691666666666
27; 0,225
10; 0,0833333333
Таблица 1.
А для определения апостериорных вероятностей необходимо определить новые значения
факторов в течение дня: ветра, влажности и облачности. Анализ методов принятия решений
проводим на основе конкретного примера. Допустим заданы факторы: ветер сильный, высокая
влажность и облачно. При таких факторах необходимо подсчитать прогноз погоды на завтра.
Основной задачей модуля принятия решений является определение вероятности дождя или ясной
погоды на следующий день после измерения. Измерены 3 параметра (факторов): ветер, влажность,
облачность, которые сведены в таблицу 1. Прогнозируются 2 гипотезы: H 1  дождь, H 2  без
осадков.
1) Метод максимального правдоподобия гипотез.
Определяются
условные
вероятности
факторов
PF / H i   PF1 , F2 , F3 / H i   PF1 / H i   PF2 / H i   PF3 / H i ; i  1,2 для двух событий H1 , H 2 .
PF / H i   PF1 , F2 , F3 / H i   PF1 / H i   PF2 / H i   PF3 / H i ;
для события H 1 .
для события H 2 .
Далее, из двух условных вероятностей определяется наибольшая и по ней принимается
решение;
PF / H1   0,0132, QF / H 2   0,00675. Поскольку PF / H1   QF / H 2  , принимается решение, что будет
дождь.
2) Метод апостериорной вероятности.
QF / H i   QF1 , F2 , F3 / H i   QF1 / H i   QF2 / H i   QF3 / H i ;
Апостериорная вероятность дождливой погоды на следующий день подсчитывается по формуле
Байеса:
Далее, подсчитывается априорная вероятность
P F / H   P H 
PH 1 / F  
1
1
PF / H 1 PH 1   QF / H 2 QH 2 
 0,463.
дождя - PH1  =0,30 и сравнивается с апостериорной PH1 / F  .
Поскольку апостериорная вероятность (0,463) больше априорной (0,30), следует ожидать, что
на следующий день ожидается дождь.
3) Максимум апостериорной вероятности.
Подсчитывается апостериорная вероятность другого события, т.е. QH 2 / F  , по формуле Байеса.
QF / H 2   QH 2 
Q H 2 / F  
 0,537. PH1 / F   0,463.
PF / H1 PH1   QF / H 2 QH 2 
Далее, сравнивая эти вероятности, находится наибольшая. Поскольку PH1 / F   QH 2 / F 
принимается решение, что будет ясная погода. Поскольку последний метод охватывает все
предыдущие, он является наиболее информативным и, следовательно, наиболее точным и
эффективным. Применение этих методов сопровождается с определенным риском принятия
неверного решения, который определяется коэффициентом риска или штрафной функцией. Из
примера видно, что последовательное применение сразу двух критериев повышает надежность
оценки. Но, однако, не всегда есть необходимость применения дополнительного критерия.
Например, при следующих факторах: умеренном ветре, высокой влажности и пасмурной погоде
апостериорная вероятность ожидания дождливой погоды равна 0,9164435. При таком значений
вероятности можно уверенно сказать, что на следующий день будет дождь. И нет, при этом,
необходимости применения дополнительного критерия. При этом риск или вероятность другого
события составляет 0,0835565.
Поэтому можно использовать пороговое значение штрафной функции или риска, например,
равной 0,1; при превышений которого применяются дополнительные методы принятия решений.
Достоверность оценок прогнозирования можно также увеличить введением дополнительных
факторов; например, температуры и других факторов, а также увеличением количества градации;
например, можно брать не три уровня, а пять уровней. При этом, увеличением количества
факторов и объема статистических данных измерений можно добиться
высокой
достоверности оценок прогнозирования. Но, однако, практически количество факторов и объем
статистики всегда ограничены; следовательно, добиться высокой достоверности оценок прогноза
не всегда возможно. Наиболее эффективным для больших и сложных систем в условиях
стохастичности и нестационарности является управление с прогнозом. А в прогнозе наиболее
эффективным является прогноз основанный на априорной и плюс последней измеренной
информации. Анализируя результаты собственных исследований и других авторов делается
вывод, что байессовская стратегия выводов незаменима в теории управлений сложными
системами и процессами; особенно, в теории стохастического управления нестационарными
процессами. Последняя теория является незаменимой в управлении сложными техническими и
иными системами, а также при создании модулей принятия статистических решений в экспертных
системах различного назначения.
Разработанный алгоритм и программа на Turbo PROLOG являются простыми и надежными;
его можно использовать в учебных и научно-исследовательских работах по построению
нтеллектуальных экспертных систем.
ЛИТЕРАТУРА
1.
2.
3.
4.
5.
6.
7.
Тукубаев З.Б. и др. Анализ байессовской теорий в приложениях// Вестник МКТУ, №1, Туркестан, 2008.
Алиев Р.А. и др. Гибридные интеллектуальные системы. Баку, 1998.
Савчук В.П. Байесовские методы статистического оценивания.-М.: Наука, 1989.
Лочмель О.И. Основы теории обработки информации в автоматизированных системах управления. Изд-во МГУ., - М.: 1972.
Закс Ш. Теория статистических выводов. –М.: Мир, 1975.
Де Грот. Оптимальные статистические решения. - М.: Мир, 1974.
Кендалл М., Стьюарт А. Статистические выводы и связи. –М.: Наука, 1973.
Download