Модели бинарного выбора

реклама
Факультет менеджмента
Направление Управление проектами
Выполнили:
Анисимова М.
Тесленко В.
Шумович А.
Группы: 626, 627
НИУ ВШЭ , Москва, 2013
www.hse.ru
Модели бинарного выбора
- модель зависимости бинарной переменной (принимающей
всего два значения — 0 и 1) от совокупности факторов
photo
photo
Probit-
Logit1
pi 
1  e  zi
НИУ ВШЭ , Москва, 2013
Gompitpi  e
e z
photo
2
Алгоритм построения модели
Определение зависимой переменной и факторов
Определение зависимой переменной и факторов
,
photo
построение переменной Z, как линейной комбинации
независимых переменных
Построение уравнения для искомой вероятности события
photo
Проведение вычислений
(метод максимального правдоподобия)
Интерпретация результатов и исследование качества
photo
оценки
НИУ ВШЭ , Москва, 2013
3
Показатели качества моделей
Псевдо-коэффициент
детерминации
photo
Статистика
отношения
правдоподобия
Информационные
критерии
Показатели
photo
Доля правильных
прогнозов
Коэффициент
детерминации
МакФаддена
photo
НИУ ВШЭ , Москва, 2013
4
Показатели качества моделей
Статистика отношения правдоподобия
Вводится гипотеза: Н0: b1=b2=…=bn=0
LR  2(ln L0  ln L1 )
ln L1   ( yi ln pˆ i  (1  yi )(1  ln pˆ i )
i
n1
n1
ln L0  n1 ln  (n  n1 ) ln( 1  )
n
n
LnL1 – найденное значение
photo
логарифма функции
правдоподобия
LnL0 – логарифм
правдоподобия для
тривиальной модели ( с
включением только
константы)
photo
n – количество
переменных
n1 – количество переменных
со значением 1
pi – вероятность события
yi=1 при заданном значении
zi
photo
НИУ ВШЭ , Москва, 2013
5
Показатели качества моделей
Pseudo R 2  1 
1
2 L
1  ln 1
n L0
photo
1
ln L1
w1   ( yi  yˆiphoto
)2
n i
ln L0
1  pˆ i , pˆ  0,5
w
n
Pr edicted R 2  1  1
w0  
pˆ  1
w0
n
 pˆ i , pˆ  0,5
McFadden R 2  1 
photo
НИУ ВШЭ , Москва, 2013
6
Показатели качества моделей
Информационные критерии:
Акаике (AIC)
2 ln L 2k
AIC  

n
n
Шварца (SC)
SC  
2 ln L k ln( n)

n
n
Хэннана-Куинна (HQ)
HQ  
2 ln L 2k ln ln( n)

n
n
photo
photo
photo
НИУ ВШЭ , Москва, 2013
7
Преимущества и недостатки моделей:
Преимущества
1. Дает статистически
надежные результаты:
исправляет недостатки
линейной модели
2. Результаты легко
интерпретируются
3. Сравнительно
несложный метод
анализа.
НИУ ВШЭ , Москва, 2013
Недостатки
photo
1. Необходим
большой
размер выборки (>500)
2. Проблемы
мультиколлинеарности
photo
3. Минимум 10 исходов на
каждую
независимую
переменную
photo
8
Области применения моделей
Медицина
photo
Задачи
классификации
(скоринг в банке)
Области
Социология
photo
Маркетинговые
исследования
photo
НИУ ВШЭ , Москва, 2013
9
Области применения моделей: маркетинг
Изучение поведения покупателей
photo
Покупка - "1", клиент ушел без покупки - "0".
T – время проведенное в магазине;
Y – возраст клиента;
K – внешняя респектабельность клиента по 5-бальной
photo
шкале;
еi – отклонения
Покупкаi = a*Ti+b*Yi+c*Ki+ei
photo
НИУ ВШЭ , Москва, 2013
10
Пример №1
AIC
SC
HQ
Logit
1.231
1.297
1.258
Probit
1.232
1.298
1.259
Gompit
1.224
1.290
photo
1.251
Variable
Coefficient
Std. Error
z-Statistic
Prob.
X1
X3
X6
C
-1.442494
0.317345
-0.842427
2.043612
0.317002
0.151203
0.442136
0.776225
-4.550431
2.098804
-1.905358
2.632757
0.0000
0.0358
0.0567
photo
0.0085
McFadden R-squared
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Restr. deviance
0.115382
0.491541
1.232344
1.298541
1.259136
268.1797
НИУ ВШЭ , Москва, 2013
Mean dependent var
S.E. of regression
Sum squared resid
Log likelihood
Deviance
Restr. log likelihood
0.402010
0.458041
40.91139
-118.6182
photo
237.2364
-134.0898
11
Пример №1
Признак
Вероятность принадлежности
Мужчины
0,621
Женщины
0,296
Потребляющие алкоголь
0,732
Не потребляющие алкоголь
0,576
Удовлетворенные местом работы
0,869
Не удовлетворенные местом работы
0,87
photo
photo
y  1,782  0,988 x1  0,238 x3  0,593x6
3,444
-4,545
2,341
 2 , 321
R2
McFadden
НИУ ВШЭ , Москва, 2013
 0,122
photo
12
Пример №2 (ROC-анализ)
Чем выше рейтинг клиента, тем выше его кредитоспособность
положительный исход – успешное погашение займа, отрицательный –
дефолт по кредиту
photo
Чувствительность (политика рискованных кредитов)
• Доля истинно положительных примеров
photo
Специфичность (консервативная кредитная политика)
• Доля истинно отрицательных примеров, правильно
идентифицированных моделью
photo
НИУ ВШЭ , Москва, 2013
13
Пример №2 (ROC-анализ)
Порог
Чувствительность = 90,4%
• 90,4% благонадежных заемщиков
будут выявлены классификатором
Специфичность = 88,2%
• 11,8% недобросовестных
заемщиков получат одобрение в
выдаче кредитов
НИУ ВШЭ , Москва, 2013
Se, %
Sp, %
Se+Sp
|Se-Sp|
...
...
...
...
...
0.40
91.3
86.6
177.9
4.7
0.41
91.1
86.8
177.9
4.7
0.42
90.4
87.0
177.4
3.4
0.43
90.4
88.2
photo
178.6
0.44
89.8
88.4
178.2
1.4
0.45
88.6
88.6
177.2
0.0
0.46
88.0
89.0
177.0
1.0
0.47
88.0
89.3
177.3
1.3
0.48
87.6
89.5
177.1
1.9
0.49
87.6
90.1
177.7
2.5
0.50
87.0
90.3
177.3
photo
3.3
0.51
86.2
90.5
176.7
4.3
0.52
85.8
90.7
176.5
4.9
0.53
85.6
90.9
176.5
5.3
0.54
85.4
91.1
176.5
5.7
...
...
...
...
...
0.64
80.5
93.7
174.2
13.2
0.65
79.9
94.1
174.0
photo
14.2
0.66
78.9
94.1
173.0
15.2
...
...
...
...
...
2.2
14
Пример №3
Построение моделей оценки вероятности дефолта эмитента строительной
отрасли
• Цель: оценка кредитного риска эмитента корпоративных облигаций с
photo
применением методов имитационного моделирования.
• Зависимая переменная: вероятность дефолта
• Независимые переменные: финансовые коэффициенты (финансовой
photo
устойчивости, ликвидности, деловой активности),
внешнеэкономические переменные (динамика цен на недвижимость,
процентной ставки, ВВП и т.д)
• Отбор переменных: процедура пошагового включения объясняющих
photo
переменных в модель на основе вычисления парных коэффициентов
корреляции.
НИУ ВШЭ , Москва, 2013
15
Пример №3
Оцененная логит-модель
K
НИУ ВШЭ , Москва, 2013
Где T(Inv_fa) - прогноз
годового темпа роста
photoв
реальных инвестиций
основной капитал;
T(MIACR) – прогноз
годового прироста
процентной ставки на
межбанковском рынке от
двух до семи дне;
photo
FL - уровень финансового
рычага на последнюю
отчетную дату,
определенный как
отношение заемного
капитала к собственным
средствам эмитента.
photo
16
photo
photo
Выполнили:
Анисимова М.
Тесленко В.
photo
Шумович А.
Группы: 626, 627
НИУ ВШЭ , Москва, 2013
17
Скачать