УДК 004.942; 519.856.3; 519.812.3 Михайлов Владислав Олегович Малихов Николай Сергеевич студенты гр. АС-1-М-10 Научные руководители: Коньшин Борис Федорович доц., к.т.н. Гончаренко Сергей Николаевич проф., д.т.н. Московский государственный горный университет МОДЕЛИРОВАНИЕ КРЕДИТНОГО РЕЙТИНГА ЗАЕМЩИКОВ НА ОСНОВЕ ТЕОРИИ НЕЧЕТКИХ МНОЖЕСТВ MODELLING OF THE CREDIT RATING OF BORROWERS USING THE THEORY OF FUZZY SETS В настоящее время одной из актуальных задач является оценка кредитоспособности банковских клиентов, решение которой способствует получению максимальной прибыли от заключенных сделок по предоставлению кредитов и исключению возможности финансовых потерь. Банковский работник не может адекватно судить о материальных возможностях клиента, поскольку на характер принимаемого решения влияют множество факторов, которые могут быть противоречивыми и неоднозначно определёнными. Анализ показывает, что для построения интеллектуального прогноза целесообразно использовать экспертные системы на основе нечетких баз знаний. Такие базы знаний используют аппарат нечеткой логики, основное преимущество которого заключается в возможности создания количественных оценок для лингвистических переменных, а также эффективного отображения зависимости между этими переменными в виде нечетких правил. Целью статьи является разработка экспертной системы оценки кредитоспособности банковских клиентов на основе методов нечеткой логики. Системы нечеткого логического вывода преобразуют значения входных переменных процесса управления в выходные переменные на основе использования нечетких правил. Процесс обработки данных при этом можно разбить на следующие этапы: 1. Формирование базы правил, для чего необходимо: - определить множество входных переменных: x ; - определить множество выходных переменных: ; - формировать базовое терм–множество с соответствующими функциями принадлежности каждого терма: ; 59 - сформировать конечное множество нечетких правил, согласованных относительно используемых в них переменных. 2. Фаззификация – установление соответствия между конкретным значением отдельной входной переменной системы нечеткого вывода и значением функции принадлежности соответствующего ей терма входной логической переменной. Для этого функции принадлежности, определённые на входных переменных, применяются к их фактическим значениям [1]. 3. Агрегирование – определение степени истинности условий по каждому из правил системы нечеткого вывода. 4. Активизация – процесс нахождения степени истинности каждого из подзаключений правил нечеткого вывода, т.е. определение усеченных функций принадлежности нечетких множеств. 5. Аккумуляция – процесс нахождения функции принадлежности итогового нечеткого подмножества для переменной выхода. 6. Дефаззификация – процесс нахождения четкого значения для каждой из выходных лингвистических переменных [1]. Для корректировки области определения функций принадлежности нечетких множеств с целью получения требуемой чувствительности системы к входным факторам предложено использовать сеть Байеса. Этот выбор определяется неоднозначностью данных, поступающих на вход системы, вследствие чего рассчитывается вероятность гипотезы в условиях, когда на основе наблюдений известна лишь некоторая частичная информация о событиях. Пусть W - выборочное пространство случайных событий, а Е иН – две переменные, которые каким либо образом взаимосвязаны между собой. Если переменная Н принимает конкретное значение, то условная вероятность события Е, т.е. вероятность с которой переменная Е примет конкретное значение, определяется из выражения: (1) Две переменные не пересекаются, если они не имеют одинаковых значений. Теория построения сетей Байеса основывается на предположении, что события являются исчерпывающими и не пересекаются. В этом случае вероятность события Е можно вычислить при помощи условных вероятностей: (2) Используя формулу (1), вероятность пересечения событий Е и Н можно выразить следующим образом: (3) 60 откуда получаем: (4) С учетом (2) формулу (4) можно представить следующим образом: (5) Последняя формула представляет собой формулу Байеса. Для нахождения коэффициентов, определяющих область определения функций принадлежности нечетких множеств, используется следующий подход: 1. Рассчитываются вероятности входных факторов при априори заданной вероятности выходной переменной, при этом вероятности значений выходной переменной изменяются в максимально возможном диапазоне; 2. Определяется коэффициент максимального изменения вероятностей i-го параметра: , (6) где - сумма значений вероятностей значений i-го фактора при различных априори заданных значениях выходной переменной; 3. Рассчитываются параметры, характеризующие определения функций принадлежности нечетких множеств. область При этом следует учитывать, что большему значению соответствует меньшая область определения функции принадлежности. Это делает систему более чувствительной к данному фактору [1]. Если σ параметр, определяющий предварительную область определения функции принадлежности, то с учетом степени влияния данного фактора этот коэффициент принимает значение . Апробация предложенной методики осуществлялась на примере расчета кредитоспособности банковских клиентов при принятии решения по выдаче кредитов на строительство жилья. В качестве входных переменных использовались следующие характеристики: - Х1–месторасположение; - Х2–качество предполагаемого выполнения отделочных работ согласно архитектурному проекту строящегося здания; - Х3–оценка активов; - Х4–оценка дохода потенциального клиента; 61 - Х5–величина подлежащих уплате процентов, согласно предполагаемому плану выплат по взятому кредиту. В качестве выходной переменной Y используется оценка кредитоспособности, которая является основой для принятия решения руководством банка по предоставлению кредита потенциальным клиентам. Экспертный анализ характера взаимосвязи входных переменных с выходной позволяет составить базу данных, на основании которой формируются правила системы нечеткого логического вывода. Для определения характера взаимосвязи входных характеристик с выходной разработана база знаний, лежащая в основе работы сети Байеса. Анализ базы знаний позволил построить графики функций зависимости кредитоспособности (Y) от факторов, влияющих на принятие решения о выдаче кредита: местоположения (Х1), качества отделочных работ (Х2), активов (Х3), величины дохода (Х4) и выплат (Х5). Они представлены на рис. 1. Значения вышеперечисленных величин изменялись в условных единицах от 0 до 15. Характер представленных зависимостей определялся структурой разработанной базы знаний. Решение задачи производилось с использованием программной среды Matlab. Для настройки сети из графиков, изображенных на рисунке 1, были определены значения входных факторов, соответствующих 100 значениям выходной переменной – кредитоспособности. Дискредитация переменных была произведена путем их разбиения на 3 приблизительно равных диапазона для входных параметров и 5 – для выходной переменной. Средние значения коэффициентов входных факторов для корректировки области определения функций принадлежности нечетких множеств, рассчитанные по формуле (6) следующие: kх1= 0,57; kх2= 0,62;kх3= 0,7; kх4= 0,77; kх5= 0,66. Рис. 1. Графики зависимости кредитоспособности от входных характеристик системы. 62 Для выходных параметров использовались треугольные функции принадлежности нечетких множеств [2]: , (7) где параметры а и с определяют координаты основания треугольника, а параметр b определяет координату его вершины. При своей простоте эти функции позволяют получить требуемую точность дефаззификации за счет фиксированной области их определения. В качестве терм-множества выходной переменной У – кредитоспособность будем использовать множество Т ={«очень низкая», «низкая», «средняя», «высокая», «очень высокая»} (рис. 2.) Рис. 2 График функции принадлежности для выходной переменной Y – кредитоспособность Для проверки работы системы был проведён анализ кредитоспособности пяти клиентов. Результаты представлены в таблице 1. Таблица 1. Оценка кредитоспособности клиентов Номер клиента 1 2 3 4 5 X1 X2 X3 X4 X5 Y 2 2 2 8 10 3 3 3 8 10 10 10 8 8 9 8 10 5 5 9 2 8 2 2 2 6,6 6,65 3,39 5,85 7,66 Жильё первых трёх клиентов характеризуется плохим месторасположением и низким качеством отделки. Первые два клиента имели очень высокие активы, уровень дохода первого клиента был высоким, а второго очень высоким. Выплаты по процентам у первого 63 клиента были низкие, а у второго высокие. Третий клиент имел высокие активы, средний доход и низкие выплаты по процентам. Расчет системы показал, что кредитоспособность второго клиента выше, чем первого. Это объясняется тем, что значимость уровня дохода выше, чем выплаты по процентам, т.е. доходная часть клиента является более предпочтительной. Кредитоспособность третьего клиента низкая, поскольку уровень дохода и качество предоставляемого жилья не соответствует требованиям, в соответствии с которыми принимается положительное решение по кредитованию клиента. Четвёртый клиент имеет активы, уровень доходов и выплаты по процентам такие же, как и третий, однако его жильё имеет хорошее месторасположение и высокое качество отделки. Это сказалась на его кредитоспособности, которую можно классифицировать как среднюю, но ближе к высокой. Высокой кредитоспособностью характеризуется пятый клиент, жильё которого имеет прекрасное месторасположение и очень высокое качество отделки, высокие активы, высокий уровень доходов и низкие выплаты по процентам. Литература 1. Заде Л.А. Понятие лингвистической переменной и ее применение к принятию приближенных решений. – М.: Мир, 1968. – 167 с. 2. Мелихов А.Н., Бернштейн Л.С., Коровин С.Я. Ситуационные советующие системы с нечеткой логикой. – М.: Наука, 1990. – 272 с. Аннотация Проведенные исследования показали, что комплексное использование системы нечеткого логического вывода и сети Байеса в системах поддержки принятия решений способствует повышению скорости и точности принятия решения за счет автоматизации процесса обработки поступающей информации. На основании экспертного анализа разработана база знаний, учитывающая характер взаимосвязи входных характеристик с выходной и лежащая в основе нечеткой системы определения кредитоспособности банковских клиентов при принятии решений по выдаче кредита на покупку жилья. Предложена методика расчета коэффициентов, корректирующих область определения функций принадлежности нечетких множеств. Studies have shown that the integrated use of fuzzy inference in Bayesian network sand decision support systems improves the speed and accuracy of decision making by automating the processing of incoming information. Based on expert analysis developed knowledge base, taking into account the nature of the relationship of input and output characteristics of the underlying fuzzy system determine the credit worthiness of bank customers when deciding on a loan for the purchase of housing. The method of calculating the coefficients, correcting the domain of the membership functions of fuzzy sets. 64 Ключевые слова нечеткая логика, нечеткие множества, нечеткий логический вывод, кредитоспособность fuzzy logic, fuzzy sets, fuzzy inference, the creditworthiness 65