Credit Risk Scorecard Development for sendout

advertisement
ПОСТРОЕНИЕ
СКОРИНГОВЫХ МОДЕЛЕЙ.
ПРАКТИЧЕСКИЕ АСПЕКТЫ
Мария Чепурина,
Коллекторское агентство "Пристав"
Руслан Морозов, Банк "Петрокоммерц"
ТЕОРИЯ
Руслан Морозов, Банк "Петрокоммерц"
ЖИЗНЕННЫЙ ЦИКЛ МОДЕЛИ
11.
Пересмотр
1. Требования
к модели
10. Внедрение и
Сопровождение
9. Документация
8. Тестирование
7. Калибровка
2. Сбор
данных
3. Выбор
методологии
4. Однофакторный анализ
5. Многофакторный анализ
6. Анализ
отклоненных
ОСНОВНЫЕ ЭТАПЫ
Требования к модели












принятие решения о выдаче кредита
определение уровня принятия решения
расчет ожидаемых убытков
ценообразование
определение лимитов
прогнозирование
отчетность
мониторинг
индикаторы раннего предупреждения
расчет резервов
расчет капитала
и т.д.
ОСНОВНЫЕ ЭТАПЫ
Сбор данных
Исчерпывающий набор данных является
важной предпосылкой для построения
качественной модели. Следующие
требования предъявляются к полноте
выборке и её качеству:







Объем и историчность данных, период
наблюдения
Источники данных
Репрезентативность выборки
Достаточное количество «плохих»
Качество данных (пропущенные и
удаленные значения, верность и т.п.)
Определение Хороший / Плохой
Формирование выборки
ОСНОВНЫЕ ЭТАПЫ
Хороший / Плохой
Для построения скоринговой системы необходимо
решить, что есть «плохой» клиент.
В соответствие с Базель II дефолт должника считается
произошедшим, когда имело место одно или оба из
следующих событий:
 Банк считает, что должник не в состоянии полностью
погасить свои кредитные обязательства перед Банком
без принятия Банком таких мер, как реализация
обеспечения (если таковое имеется).
 Должник более чем на 90 дней просрочил
погашение любых существенных кредитных
обязательств перед Банком.
ОСНОВНЫЕ ЭТАПЫ
Формирование выборки
ОСНОВНЫЕ ЭТАПЫ
Выбор методологии

Экспертные системы
Generic модели
Pooling модели

Регрессии




Деревья решений





logit, probit, наименьших квадратов, нейросети и
т.д.
CHAID, CART
Линейное программирование
Модели ценообразования опционов
Модели приведенной стоимости
и т.д.
ОСНОВНЫЕ ЭТАПЫ
Однофакторный анализ
Предварительный выбор переменных существенно
уменьшает сложность последующего многомерного
анализа.
Этапы однофакторного анализа
 Составление «длинного» списка переменных
 Проверка гипотез:



Трансформация






предсказательная сила
соответствие ожидаемому поведению
нормализация
стандартизация
разбиение на групп
и т.п.
Проверка корреляций
Работа с пропущенными значениями
Результатом анализа является список переменных.
ОСНОВНЫЕ ЭТАПЫ
Многофакторный анализ


Существуют различные методы построения
«оптимальной» модели по набору заданных
переменных. Наиболее распространенный метод –
логистическая регрессия.
Преимущества регрессии:




Итоговый Score получается простым взвешиванием
переменных.
Score лежит в диапазоне [0,1] и может быть
проинтерпретирован как вероятность негативного события
Метод устойчив к небольшим изменениям выборки.
Нахождение оптимального решения сводится к
максимизации функции правдоподобия
X наблюдение ln( X прогноз)  (1  X наблюдение) ln( 1  X прогноз) 
ОСНОВНЫЕ ЭТАПЫ
Многофакторный анализ
В таблице ниже перечислены значения Джини,
которые могут быть достигнуты на практике для
различных типов моделей.
ОСНОВНЫЕ ЭТАПЫ
Анализ отклоненных клиентов
Существует различные техники определения
качества отклоненных клиентов:
 Присвоить всем отклоненным клиентам статус –
Плохой
 Разбить на хороших и плохих в той же пропорции,
что и по известной части
 Экстраполяция
 Пополнение
 Метод соседей
 Совместное распределение
 Использование 3 групп (плохие, хорошие,
отклоненные)
 Анализ причин отклонения (негативная кредитная
история -> отказ)
ОСНОВНЫЕ ЭТАПЫ
Калибровка
Калибровка – назначение вероятности дефолта для
заданного рейтинга модели. Качество калибровки
зависит от того, в какой степени вероятности
дефолта, предсказанные моделью, соответствуют
фактически реализовавщимся дефолтам.
Существует ряд методов, позволяющих оценить
качество калибровки:
 Показатель Бриера
 Диаграмма надежности
 Проверки значимости отклонений от частоты
дефолтов



Проверочная калибровка с использование
стандартного нормального распределения
Биномиальный Калибровочный тест
Процедура калибровочных испытаний на основе
корреляций дефолтов.
ОСНОВНЫЕ ЭТАПЫ
Пример калибровки
Вводим новую переменную RDR =PD/(1–PD)





Вычисляем Average DR по модели на
недофолтной выборке
Переводим полученный результат в
RDRмодели
Вычисляем Average DR по портфелю и
переводим в RDRпортфеля
Считаем RDRнекалиб для каждой группы
RDRкалиб находим как RDRнекалиб х
(RDRпортфеля / RDRмодели)
ОСНОВНЫЕ ЭТАПЫ
Тестирование
Целью тестирования является оценка качества модели при её
использовании на данных не входящих выборку, которая была
использована при построении модели. Можно выделить
следующие основные тесты:






Основным показателем эффективности является коэффициент
Джини. Чем больше выборка, тем более надежным будет данный
критерий.
Для оценки надежности коэффициента Джини используют:




Эффективность (дифференцирующая способность)
Устойчивость (робастность)
Бэк-тестирование
Champion-Challenger стратегия
Бенчмаркинг
Аналитическую оценку уровня доверия
Эвристическую оценка уровня доверия путем повторных случайных
выборок (Bootstrapping, Jackknifing, Метод скользящего среднего)
Выборка для валидации


In-time: выборка построена случайным выбором из общей выборки
Out-of-time: случайный выбор из другого временного периода.
ОСНОВНЫЕ ЭТАПЫ
Документация
В соответствие с Базель II:
Все важнейшие элементы модели и процесса
моделирования
должны
быть
полностью
и
надлежащим образом задокументированы. Банки
обязаны письменно документировать разработку
внутренних моделей и оперативные подробности.
Документация
должна
продемонстрировать
соблюдение банком минимальных количественных и
качественных
стандартов,
и
должна
также
покрывать такие разделы, как применение модели
для различных сегментов портфеля, процедура
рейтингования,
ответственность
сторон,
участвующих в моделировании, а также процессы
утверждение и пересмотра модели.
ОСНОВНЫЕ ЭТАПЫ
Внедрение и Сопровождение
Фактическая интеграция процедуры рейтингования в
процесс управления кредитным риском в Банке и в
системы отчетности, включают в себя:
 Разработку банком внутренних процедур, которые
включают в себя процесс рейтингования, и включение
их в банковские документы
 Использование рейтингов в процессе управления
кредитным риском (принятие решений,
ценообразование, полномочия, система лимитов, и т.д.)
 Соответствие процедуры рейтингование с кредитной
стратегией Банка
 Ответственность за рейтинг не должна лежать на
фронт-офисе (бизнес), исключение возможно лишь в
рознчном бизнесе, но также не рекомендуется.
 В случае если пользователь может отклоняться от
рейтинговой процедуры, должна быть определена
чёткая процедура как и когда, все отклонения должны
быть задокументированы.
ОСНОВНЫЕ ЭТАПЫ
Валидация
В соответствие с Базель II:
 Банк должен регулярно оценивать (валидировать)
работу модели, включая мониторинг ее результатов и
стабильности, отслеживание взаимосвязей моделей и
тестирование результатов моделирования относительно
реальных данных.
Основные принципы валидации






Банк ответственен за валидацию модели
Валидация должна оценивать предсказательную силу
модели и использование результатов модели в
кредитном процессе
Валидация – итеративный процесс
Не существует единого подхода к валидации
Валидация должна включать в себя как качественную,
так и количественную валидацию
Валидация должна быть независимой от
основного процесса моделирования
ВОПРОСЫ ?
ПРАКТИКА
Мария Чепурина,
Коллекторское агентство "Пристав"
Розничное кредитование
Эволюция моделей




Запуск проекта – разработать MAC, отражающие
демографические и локальные особенности
рынка. Установить среднерыночные лимиты и
собирать данные.
Рост – разработка скоринговых карт для разных
сегментов бизнеса и разных регионов. Лимиты на
основании скоринга.
Развитие – агрессивная стратегия – снизить
cut-offs, усиленный мониторинг по каналам
продаж. Реагировать на увеличение риска
изменением cut-offs, информировать каналы.
Развитие – Cross Sell – тестировать и внедрять
критерии продаж, использовать эксперименты
champion/challenger (установление лимита,
увеличение лимита, прибыльность).
Розничное кредитование
Данные







Вводить все поля анкеты
Хранить информацию по отказанным заявкам
Информация о канале продаж (внутренний,
внешний, Cross-sell)
Возможность сигнала от кредитного специалиста
(visual contact codes)
Контролировать потоки заявок и события на всех
стадиях выдачи кредита (проверки по базам,
верификация, СЭБ).
Быстро настраиваемые work flows в ИТ-системах.
Обеспечить удобные интерфейсы с
автоматическим системами проверок на
мошенничество
Розничное кредитование
Мониторинг






Approval/Rejection rates по каналам продаж
Размер просрочки по продуктам
Отказы на верификации/проверкам на Fraud по
каналам продаж
Средние скоринговые баллы по каналам продаж
Средние скоринговые баллы для всех заявок,
одобренных/отклоненных заявок
Случаи override скоринга
Розничное кредитование
Предотвращение мошенничества





Разработать простой и ясный набор правил для
проверок на мошенничество.
Не опираться на данные, сообщенные самим
аппликантом об уровне дохода, и на результаты
звонков при верификации. Наилучший вариант –
дополнительная проверка по базам ФНС,
Пенсионного фонда.
Мониторинг FPD по каналам и точкам продаж
(может быть связано с внутренним
мошенничества)
Fraud скоринг
Включить меры по сокращению мошенничества в
KPI департамента продаж.
Розничное кредитование
Работа с просроченными долгами







В этой области присутствуют более четкие
определения риска.
Collection scoring как комбинация locator score и
performance score.
Учет затрат по сравнению с размером долга и
прогнозируемым возвратом.
В растущем проекте – заблаговременное
планирование capacity.
Использование сотрудников согласно их
квалификации.
Мотивация, четкое разделение на стадии работы.
Обратное движение только при крупных
погашениях.
Продажа долгов, использование аутсорсинга.
Розничное кредитование
Аналитика












Мониторинг состояния портфеля (уровень
просрочки).
Application Scorecard Development (Originations).
Fraud Scorecard Development (Originations).
Behaviour Scorecard development (управление
лимитами, перевыпуск карт, Collections).
Динамический расчет провизий (flow-rates).
Сегментация портфеля.
Оптимизация процессов (Collection, Verification).
Планирование Collection Capacity.
Fraud Intelligence – проверка эффективности
экспертных правил.
Анализ результатов экспериментов.
Profitability score models.
И многое другое…
2004 – Разработка скоринга
Необходимость в разработке собственной модели
 Новое направление кредитования (CF),
сокращенный ввод данных в POS
 Зависимость от внешнего разработчика
 Низкие показатели эффективности generic модели
(СС + Overs)
Первые действия
 Критический анализ экспертами generic модели
 На уровне банка принято решение о
конфиденциальности, передаче Директору по
управлению рисками единолично принимать
решения по разработке и внедрению моделей
Достаточность данных для разработки
 К этому моменту было накоплено достаточное колво Bads (60+ dpd) – 500-1000.
Качество данных
Примеры проблем







Недостаточно развернутые классификации в FE
(подготовлены без учета мнения аналитиков)
(Industry type, Position, Work type).
Частый выбор категории ‘OTHER’ при вводе
данных.
Различные написания в полях текстового ввода.
Неполные классификации.
Необходимость учета существующих интерфейсов
между системами (хорошие предикторы иногда
невозможно передать без доработки
интерфейсов).
Учет различных кодировок при разработке,
тестировании и настройке.
Ошибки при повторном вводе.
Качество данных
Примеры проблем
Должность
Возможно 9
вариантов выбора
типа должности, но в
точках продаж агенты
просто выбирают
“OTHER”.
Position
ACCOUNTER
Number of
customers
Percent
1265
2%
93
0%
759
1%
DIRECTOR
3257
5%
EMPLOYE
1897
3%
724
1%
MAINTENANCE_STAFF
5535
8%
SALES_MANAGER
1981
3%
SPECIALIST
1575
2%
OTHER
54493
76%
TOTAL
71579
CHIEF_OF_DEPARTMENT
CHIEF_OF_SECTION
IT_SPECIALIST
Качество данных
Примеры проблем
Тип отрасли
Industry type
ADMINISTRATION
Number of
customers
Percent
1311
1,83%
AGRICULTURE
630
0,88%
ART
234
0,33%
AUTHORITY
1662
2,32%
CONSTRUCTION
5732
8,00%
ENTERTAINMENT
3072
4,29%
16
0,02%
1115
1,56%
758
1,06%
2277
3,18%
GAMBLING
193
0,27%
HOTELS
169
0,24%
EXCHANGE
26 вариантов выбора
для характеристики “Тип
отрасли”.
EXTRACTIVE
Агенты не
задумываются над
классификацией,
выбирают “OTHER”.
INSTRUCTING
18
0,03%
JEWELLERY
64
0,09%
247
,34%
69
0,10%
2174
3,03%
373
0,52%
Огромное число
вариантов написаний
(ошибки, пр.) в поле
прямого ввода для
категории “OTHER” .
REAL_ESTATE
94
,13%
REPAIR
1122
1,57%
RETAIL
8800
12,28%
358
0,50%
SECURITY
1986
2,77%
SERVICES
1127
1,57%
107
0,15%
WHOLESALE
3895
5,44%
OTHER
34055
47,52%
TOTAL
71659
FINANCES
FORMATION
LEGAL
MANAGEMENT
MEDICINE
PRESS
SCIENCE
TOURISM
Разработка скоринга
Общие идеи








Поиск удачных предикторов – как охота, нет априорных
правил.
Позвольте данным рассказать о себе. Учитесь у них.
На начальном этапе стоит отказаться от сложных
теоретических методов.
Модель должна быть логичной относительно выбранного
Good/Bad флага. Если направление связи трудно объяснить –
лучше исключить эту переменную.
Изучайте всю возможную информацию (доп. ввод архива,
классификация текстовых полей, не используемые в ITсистемах поля). Возможно, вы найдете предиктор, для
которого потребуется изменение текущих процессов.
Чрезвычайно важно тщательное тестирование (OOS, OOT,
настройки систем).
Избегать использования переменных сегментации в
скоринговых моделях (регионы, размер дохода, канал продаж,
тип продукта.. )
Force option – «психологические оси» - баланс предикторов
Разработка скоринга





Information asymmetry between the lender and the
borrower
The borrower signals to the lender, the lender
interprets the signal according to prior experience
Choices offered in a credit application are signaling
devices
For example, providing phone number means:
 borrower probably has a phone
 borrower wants to give his phone number.
Both facts have to be given consideration
Разработка скоринга
Автоматизация








SAS Base (+ macro in Excel – HSBC)
SAS Base (+ in-house GUI tool - Lloyds TSB)
SPSS
STATISTICA
SIGMA – Experian’s in-house tool
(200 models over a year in 2002)
SAS Enterprise Miner, SAS Credit Scoring
Scorto Scoring Solution
KSEMA
Разработка скоринга
Процесс

IN VEH Num ber of Vehicle

IN ADD1 (Residential) Region Residing <> Moscow AND Only one phone num ber (w ork or residential) w as specified

25


Registration phone given
IN Tim e Since Marriage
IN Marital Status


IN Num of children
Age
20


Internrt Application

HIP Card Type (corrected)
IN ADD1 Residential Status

branch rank
AP Currency of application
IN Gender


IN EMP Em ploym ent Status
IN EMP Field of Activity of org

15


IN FIN Total Declared Incom e
IN ADD2 Tim e since Registr


EMPLOER Region
Additional Incom e is Specified

10

Week day
IN EMP Tim e Curr Em ployer


Mobile phone given
HIP ADD DOC in 1 field


Tim e As Custom er >= 3 m onth
HIP MOBILE OPERATOR
5


Education
Credit History Inform ation

HIP E-MAIL GIVEN
20
25
0
0
5
10
15
30
35
40
45
50
55
pos rank
60
65
70
75
80
85
90
95
100
Разработка скоринга
… но они лучше
выплачивают
кредит
Процесс
14000
100
женщин
меньше…
5
13000
76
90
12753
12000
11000
67
80
10000
70
9000
8000
60
7000
7071
6000
50
5000
40
4000
28
20
1000
0
Женский
Мужской
Good
10
Count
Count
Indeterminate
20
2000
0
Bad
Женский
IN Gender
sex-age
18
16
14
12
%
Good Bad Flag
30
3000
доля мужчин
и женщин с
разбивкой
по возрасту
Мужской
IN Gender
доля плохих заемщиков
ageи- sex
среди мужчин
женщин
18
16
10
14
8
12
6
F
4
M
2
0
17-25
25-30
age
30-33
bad rate
10
8
6
4
2
0
F
M
17-25
33-37
M sex
37-43
43+
F
25-30
M
30-33
33-37
age
F
37-43
43+
sex
Разработка скоринга
Процесс
1
доля плохих кредитов
0,9
Внешний
разработчик
Идеальный скоринг
0,8
0,7
Reference line
Скоринг УР
0,6
• Карта
недостаточно
хорошо выделяет
самых плохих
заемщиков
0,5
0,4
0,3
0,2
0,1
0
0
0,1
0,2
0,3
0,4
0,5
0,6
доля выборки
0,7
0,8
0,9
1
Разработка скоринга
Процесс
30%
28%
26%
24%
22%
20%
18%
16%
14%
12%
10%
8%
6%
4%
2%
0%
«Идеальное»
распределение
«плохих»
Распределение
«плохих»
Распределение
«хороших»
«Идеальное»
распределение
«хороших»
425 450 475 500 525 550 575 600 625 650 675 700 725 750 775 800 825 850 875
скоринговый балл
Разработка скоринга
Процесс – отчет на ГКК
Чистка данных
Выставление Good/Bad флага
Отправка данных стороннему разработчику
Пересмотр правила определения «Good»
Одномерный анализ данных
Двумерный анализ данных
Отбор переменных в анализе
(определение «психологических осей»)
Многомерный анализ
Тестирование новой карты на
контрольной выборке
Анализ полученных результатов
выполняется
выполняется
Применение итоговой модели
Варианты применения модели:
 Установить модель от внешнего разработчика,
набрать Out-Of-Time sample, сравнить
performance у собственной модели и внешней,
принять решение об использовании.
 На условленный срок включить 100% open gates
(для быстрого набора достаточного количества
Bads - gaining experience at the price of loss rates).
 Компромисс: 50% open gates (random via
champion/challenger), 50% собственная модель.
 Применение московской модели в избранных
регионах (25% open gates, 75% scored).
 Совместное применение нескольких моделей (CF+
FPD), комбинация правил для cut-off
Результаты работы модели

Результат работы карт
за 2 года - снижение резервов с
экспертных 20-28% до
5-16%, в зависимости от продукта
Мониторинг PSI (Москва)
60%
50%
40%
Change
30%
RB
20%
Slight change
10%
SF
No change
0%
июн.05 июл.05
авг.05
сен.05
окт.05
ноя.05
дек.05
янв.06
фев.06
мар.06
апр.06
май.06
июн.06
Мониторинг PSI (Регионы)
40%
Change
30%
RB
20%
Slight change
10%
No change
SF
0%
июн.05 июл.05
авг.05
сен.05
окт.05
ноя.05
дек.05
янв.06 фев.06 мар.06
апр.06
май.06 июн.06
2006 Модель пропуска первого
платежа







13% заемщиков относятся к категории NonStarters.
Нет платежей в течение первых 3 месяцев –
подозрение на мошенничество.
First Payment Default model
40,900 заемщиков с историей 6-14 месяцев
13 моделей
20% of lowest FPD scores eliminate 50% of NS
population
Combined cut-off will increase rejection by 5%,
eliminate 30% of NS
Модель пропуска первого платежа
development sample results
100%
cumulative bads
FPD score,
80% GINI 51
60%
40%
20%
0%
0%
20%
40%
60%
cumulative goods
80%
100%
2006 Разработка скоринга для
регионов









Региональный проект начат с использованием open
gates в регионах
После накопления 5-7K заявок проверить
эффективность московской модели в регионах
Применение московской модели в 5 избранных
регионах (25% open gates, 75% scored).
После накопления достаточной истории начата
разработка региональной модели.
262,700 заявок, 6-12 месяцев в работе
Требование – исключить переменную «тип
дополнительного документа» (интерфейс не передает).
Проверить новые переменные, появившиеся в анкете и
новом FE.
Первое применение Reject Inference.
Тестирование модели в разных регионах – регионы
разделены на 3 группы по величинам GINI, выбор cutoff с учетом требуемого процента отказов.
2006 Скоринг для регионов
GINI (development sample)
CFR score
GINI=47.7%
100%
cumulative bads
80%
60%
40%
CFMsc score in
selected regions
GINI=33.7%
20%
0%
0%
20%
40%
60%
cumulative goods
80%
100%
2006 Скоринг для регионов
34
100%
23
90%
39
66
80%
61
72
70%
63
60%
59
78
50%
74
40%
54
16
30%
2
20%
24
18
10%
0%
0%
70
64
20%
40%
60%
80%
100%
othe
rs
2006 Скоринг для регионов
oth
64
70
18
52
24
2
16
54
74
78
59
63
72
61
66
39
23
34
ALL
30%
GINI
35%
40%
45%
50%
55%
KS
60%
2006 Скоринг для регионов
G1
G2
G3
10%ttl cutoff %B at 10%ttl
%G at
max KS at
at score
cutoff
10%ttl cutoff
score
RegID
Frequency
Percent
GINI
KS
Region
78
10307
4,29
40,7%
29,8%
161
24,84%
7,79%
186
16
8899
3,7
42,2%
31,7%
148
22,15%
6,06%
180
ТАТАРСТАН
64
63
6995
11951
2,91
4,97
42,7%
43,2%
30,9%
31,8%
146
153
21,17%
23,94%
6,18%
6,81%
175
182
САРАТОВСКАЯ ОБЛ
САМАРСКАЯ ОБЛ
other
23304
45,8%
33,6%
153
26,24%
6,73%
178
All Other Regions in the
Development Sample
23
21089
8,78
46,1%
35,1%
155
24,73%
6,67%
182
КРАСНОДАРСКИЙ КРАЙ
61
16418
6,83
46,4%
34,6%
154
27,61%
6,65%
183
РОСТОВСКАЯ ОБЛАСТЬ
74
10218
4,25
47,0%
35,2%
146
21,66%
5,75%
183
ЧЕЛЯБИНСКАЯ ОБЛ
72
13034
5,42
47,6%
34,4%
148
27,44%
6,62%
180
ТЮМЕНСКАЯ ОБЛ
24
8801
3,66
48,0%
36,1%
141
24,43%
5,80%
172
КРАСНОЯРСКИЙ КРАЙ
70
7666
3,19
48,9%
36,1%
150
27,25%
6,84%
177
ТОМСКАЯ ОБЛ
54
8945
3,72
48,9%
36,4%
147
26,39%
6,50%
173
НОВОСИБИРСКАЯ ОБЛ
18
8101
3,37
49,1%
36,2%
141
27,53%
6,30%
168
УДМУРТСКАЯ РЕСПУБЛ.
34
21369
8,89
49,2%
36,9%
149
27,70%
6,37%
177
ВОЛГОГРАДСКАЯ ОБЛ
52
59
8571
10327
3,57
4,3
49,8%
49,8%
37,2%
36,9%
146
146
25,10%
27,15%
5,63%
5,61%
179
175
НИЖЕГОРОДСКАЯ ОБЛ
ПЕРМСКАЯ ОБЛ
66
17120
7,12
50,2%
36,4%
147
27,52%
6,38%
176
СВЕРДЛОВСКАЯ ОБЛ
39
2
18313
8897
7,62
3,7
52,9%
53,9%
39,4%
39,8%
150
159
32,46%
36,47%
7,33%
7,15%
171
182
КАЛИНИНГРАД. ОБЛ
БАШКОРТОСТАН
Г. САНКТ - ПЕТЕРБУРГ
Reject Inference



Не проводилось, когда в базе отказов
присутствовало большое количество
мошеннических заявок, которые
невозможно было выделить
автоматически.
Увеличивает время разработки модели на
1-2 недели.
В результате модель могут покинуть
некоторые переменные, GINI изменяется.
25
TAW
DPM
PPN
AGE
TIM
PLC
RGR
HGR
WGR
PRL
PLF
MAR
WAI
GEN
RLS
KIN
DUT
EDU
MOI
MPF
HSS
TRM
OAM
COM
WEE
RPF
CAN
RAI
CFL
HPF
AIS
JIS
RST
TDM
PRI
QTI
EXR
2006 Скоринг для регионов
IV before and after Reject Inference
30
after rejinf
before rejinf
20
15
10
5
0
июн.07
май.07
апр.07
мар.07
фев.07
янв.07
дек.06
ноя.06
окт.06
30+ %
сен.06
авг.06
июл.06
1+ %
июн.06
май.06
апр.06
мар.06
фев.06
янв.06
дек.05
ноя.05
окт.05
сен.05
авг.05
июл.05
июн.05
Lagged delinquency AUTO Москва
90+ %
20%
18%
16%
14%
12%
10%
8%
6%
4%
2%
0%
ию
07
.0
7
н.
07
ап
р.
ф
ев
к.0
6
30+ %
де
ок
т.
06
06
н.
06
06
1+ %
ав
г.
ию
ап
р.
.0
6
к.0
5
ф
ев
де
ок
т.
05
05
н.
05
ав
г.
ию
Lagged delinquency AUTO Регионы
90+ %
10%
9%
8%
7%
6%
5%
4%
3%
2%
1%
0%
2007 Скоринговая карта для
автокредитов








policy decision - приостановка продажи экспресскредитов в отдельных регионах / городах / точках
продаж – начиная с февраля 2007
Проверка эффективности экспертной карты для
dpd30+.
Лето 2007 - Разработка скоринговых моделей для
Москвы и регионов
Выбор Good/Bad флага – в результате решено
делать FPD model
17,800 заемщиков в Москве.
25,300 заемщиков в регионах.
Не убирать VIP (post-input изменение типа
клиента)
Bad rates by Regions on map – масштабное
мошенничество в некоторых регионах
2007 Скоринг для Автокредитов
Выбор целевой переменной
Bad Rates for AUTOLOANS
Total
flag1-var pw
flag3=240d pw-ALL
flag2=180d pw
NSRATE
0.4
0.35
3500
3000
2500
bad rate
0.3
0.25
2000
0.2
1500
0.15
1000
0.1
500
0.05
0
0
2005,
ноябрь
2006,
янв арь
2006,
март
2006, май
2006,
июль
2006,
сентябрь
2006,
ноябрь
2007,
янв арь
2007,
март
# heads (total booked)
0.45
КОНЕЦ
ВОПРОСЫ ?
Download