Presentation_14012016

реклама
Основы применения
математической статистики в
анализе и оценке рисков
к.э.н., доцент
Ичкитидзе Ю.Р.
Этапы анализа и оценки
рисков
1. Предварительная постановка проблемы
2. Выбор результирующего показателя, подверженного риску
3. Разложение результирующего показателя на 2-3 фактора риска
4. Сбор необходимых данных о факторах риска
5. Построение факторной модели и количественная оценка
6. Экспертная оценка статистической модели
7. Формирование возможных сценариев
8. Итоговая оценка риска
Кейс #1. Модель долгосрочного
прогнозирования цен на недвижимость
1. Построить долгосрочный (на 20-30 лет) прогноз цены жилой
недвижимости в РФ
2. Результирующий показатель – цена жилой недвижимости за 1 м2
в С-Петербурге через 25 лет
3. Зависимость цены 1м2 (P)– от уровня арендной платы (R), её
ожидаемых темпов роста (g) и процентной ставки (r)
P
R
rg
Соотношение спроса и предложения, а также уровень реальных
доходов населения, инфляция, и доля ипотечных кредитов – всё это
уже учтено в формуле
4. Каждый из этих факторов (R, r, g) нам надо спрогнозировать
Кейс #1. Модель долгосрочного
прогнозирования цен на недвижимость
4.А. Гипотеза: арендная плата (R) есть функция от номинальных доходов
населения
Кейс #1. Модель долгосрочного
прогнозирования цен на недвижимость
4.Б. Исследуем соотношение «арендная плата (R)/уровень средних
доходов» в России и развитых странах
Гипотеза: с ростом реальных
доходов населения,
соотношение
«цена аренды/доходы»
будет стремиться к
среднеевропейскому уровню.
Кейс #1. Модель долгосрочного
прогнозирования цен на недвижимость
16%
14%
12%
10%
Уровень инфляции
4.B. В рамках базового сценария учтем тенденцию к снижению уровня
долгосрочных процентных ставок и инфляции в России. В качестве
альтернативных сценариев, рассмотрим возможность роста инфляции
и процентных ставок (NB: провоцирующих резкое сокращение ипотеки
как источника финансирования спроса на недвижимость)
8%
6%
тренд
4%
2%
Время
0%
янв.06
янв.08
янв.10
янв.12
янв.14
янв.16
Кейс #1. Модель долгосрочного
прогнозирования цен на недвижимость
5.А. Формируем в Excel факторную модель. Результат для базового
сценария представлен в табл. ниже
Прирост
реального
ВВП
Прирост
доходов
населения
Рублевая
процентная
ставка (r)
Ожидаемый
т.р. аренды
(g)
Соотношение
«аренда/
доходы»
Цена 1
к.кв.
(40м2)
млн. руб.
Цена 1
к.кв. (40м2)
тыс. долл.
США
1% в год
2,1% в год
10%
годовых
2% в год
0,85
5,955
113
В модели отражены 2 первичных фактора, определяющих будущую
арендную плату (R):
•уровень денежных доходов населения (зависит от т.р. реального ВВП);
•соотношение «арендная плата (R)/уровень средних доходов»;
Факторы процентная ставка (r) и ожидаемые темпы роста арендной платы
(g) оставлены без подробного разложения
Кейс #1. Модель долгосрочного
прогнозирования цен на недвижимость
5.Б. Построим таблицу чувствительности для базового сценария
Цена 1 к кв. (40
м2) млн. руб
r = 8%
r = 10%
r =12%
g = 0%
5, 955
4, 764
3, 970
g = 2%
7, 941
5, 955
4, 764
g = 4%
11, 911
7, 941
5, 955
Вывод: необъясненная вариация базового сценария составляет
20-30%
Кейс #1. Модель долгосрочного
прогнозирования цен на недвижимость
6. Полученные по модели результаты осмыслим на предмет
соответствия реальности, предоставим предварительные результаты на
критику экспертам
7. Сформируем от 3-х до 6-ти качественно различающихся сценариев
№ Сценария
Т.р.
реального
ВВП
Рост
доходов
населения
Процентна
я ставка
(r)
Т.р.
арендной
платы (g)
Цена/
доходы
Цена
(млн.
руб)
1. Базовый
1%
2%
10%
2%
0,85
5,955
2. Оптимист.
4%
7%
7%
2%
0,6
14,956
3. Пессимист.
- 5%
0%
10%
2%
0,6
3,922
4. Инфляц.
1%
15%
20%
6%
0,6
4,243
5. Сближен. с
Европой
2%
3%
10%
2%
0,4
3,663
Кейс #1. Модель долгосрочного
прогнозирования цен на недвижимость
700
600
500
тыс. руб. за м2
8. Итоговая оценка рисков
400
Общая
дисперсия
23,41
Межгрупповая
дисперсия
15,52
Внутригрупповая
дисперсия
7,89
Коэффициент
детерминации
66%
300
200
100
0
«К Европе»
«Инфляц..»
«Оптимист.»
«Базовый»
«Пессимист.»
Плотность распределения по
сценарию
Кейс #1. Модель долгосрочного
прогнозирования цен на недвижимость
0,6
0,5
0,4
0,3
0,2
0,1
Цена (тыс. руб за м2)
0
50
150
250
350
450
550
К Европе
Пессимистич.
Инфляцион.
Базовый
Оптимистич.
Низ
62,4
66,97
68,3
101,4
197,8
Среднее
91,2
97,7
106,2
148,3
389,9
Верх
128,9
137,8
157,7
209,5
685,6
Распределение случайной величины.
Характеристики распределения.
Математическое описание риска
Риск это вероятность наступления события и
величина ущерба/выгоды от наступления
события
n
p
pi
вероятность наступления i-го события,
Xi
ущерб/выгода от наступления i-го события
i
i 1
 p1
p

Риск   2
 ...
 pn
1
X1
X2
...
Xn
Риск
удобно
описывать
распределением
(плотностью
распределения) случайной величины
Характеристики
плотность
 (X ) распределения
функции распределения:
МX матожидание или среднее значение
DX дисперсия
ущерб «-»
выгода «+»
X

среднеквадратическое отклонение (СКО)
X 1

, X 1 квантили распределения
Характеристики распределения
случайной величины
(X )
Математическое ожидание
(среднее значение):
n
MX   pi  X i
i 1
для непрерывной случайной
величины:





X 1
0 MX
Дисперсия
n
DX     pi  ( X i  MX ) 2
2
i 1
DX   2  M [ X 2 ]  M [ X ]2
Среднеквадратическое
отклонение:
  DX 
n
 pi ( X i  MX ) 2
i 1

X 1
MX 
X
 F ( x)dx    ( x)  x dx



X 1 - квантиль (нижний) с вероятностью
альфа, значение, ниже которого
случайная величина не опустится с
вероятностью альфа

X 1 - квантиль (верхний) с вероятностью
альфа, значение, выше которого
случайная величина не поднимется с
вероятностью альфа
Пример #1
Статистика ущерба по страховым случаям по договорам
автострахования (ОСАГО), описывается следующим распределением:
Размер ущерба
До 40
тыс.
От 40
до 80
тыс.
От 80
до 120
тыс.
От 120
до 160
тыс.
От 160
до 200
тыс.
Свыше
200
тыс.
Число страховых
случаев за год
1205
946
735
402
147
45
Определить:
1.
2.
3.
4.
Средний размер выплаты по страховому случаю ОСАГО
Вариацию ряда (дисперсию, СКО)
Верхний квантиль распределения с вероятностью 0,15
Справедливый размер страховой нетто-премии, если всего заключённых за
прошлый год договоров страхования было 50,3 тыс.
Пример #2
Статистика годовой доходности от инвестиций на рынке акций
описывается следующим распределением:
Доходность
Ниже 16%
От -16
до -8%
От -8
до 0%
От 0 до
8%
От 8 до
16%
От 16
до 24%
От 24
до 32%
От 32
до 40%
Свыше
40%
Число
наблюдений
2
3
4
8
12
8
6
2
1
Определить:
1.
2.
3.
4.
Среднюю доходность инвестиций
Вариацию доходности (дисперсию, СКО)
Максимальный размер убытков с вероятностью 0,1 (квантиль)
Выгодно ли инвестировать в рынок акций, если безрисковая процентная
ставка составляет 7% годовых
Анализ связи случайных величин
Однофакторный
регрессионный анализ
Функциональная связь – каждому
значению признака-фактора
соответствует вполне определенное
значение признака результата
Статистическая связь – для каждого
значения признака-фактора Х признакрезультат Y может в определенных
пределах принимать любые значения с
некоторыми вероятностями.
Регрессия – зависимость среднего значения какой-либо случайной
величины от одной или нескольких независимых величин.
Эмпирическая и
теоретическая регрессии
Эмпирическая регрессия формируется
за счет аналитического разбиения
совокупности на группы и построения
«ломаной» линии тренда по средним
Теоретическая регрессия описывается
аналитической функцией регрессии
(линейная функция, парабола,
экспонента, логарифм, степенная и др.
Ковариация и коэффициент
корреляции
Линейный коэффициент парной корреляции – измеряет тесноту
линейной связи между признаком-фактором и признаком-результатом
x
y
cov (X,Y)
rx,y 
σx σy
 1  rx , y  1
- среднеквадратическое отклонение признака-фактора
- среднеквадратическое отклонение признака-результата
Коэффициент корреляции равный +/-1 характеризует
положительную/отрицательную функциональную связь
Ковариация
cov( X , Y )
– показатель совместной вариации признаков
1 N
cov( X , Y )  ( X  X )(Y  Y )  [( X i  X )(Yi  Y )]  X  Y  X  Y
N i 1
Пример #3
По данным, представленным в таблице:
а) построить эмпирическую и теоретическую функции регрессии;
б) рассчитать коэффициент корреляции;
в) сделать вывод о наличии/отсутствии статистической связи.
№ п.п.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Узнаваемость
бренда, %
5
25
46
25
40
95
15
25
48
35
93
90
25
10
15
Расходы на
рекламу, млн.
руб/год
120
136
153
145
143
168
173
185
156
150
188
210
245
275
300
Правило разложения
дисперсии
Общая дисперсия
 2:
Характеризует вариацию
признака во всей совокупности
под влиянием всех факторов
n
 
2
 (x  x )
i 1
i
0
Характеризует систематическую
вариацию, т.е. различия в величине
изучаемого признака под влиянием
признака-фактора
f
k
 
2
 fi
n
i 1
Межгруповая дисперсия  2 :
2
 (x
j 1
j
i 1
k
j 1
  ( xi  x0 ) 2  pi
i
 x0 )2  f j
f
n
k
  ( x j  x0 )2  p j
j 1
j
n – число элементов в изучаемой совокупности
k – число групп, на которые разбита изучаемая совокупность в зависимости от
состояния признака-фактора
xi – i-ый элемент изучаемой совокупности
x0– среднее значение xi в j-ой группе элементов изучаемой совокупности
x j – среднее значение xi по всей изучаемой совокупности
fi (fj) – частота i-го элемента (j-ой группы) в изучаемой совокупности
pi (pj) – частоcть i-го элемента (j-ой группы) в изучаемой совокупности
Правило разложения
дисперсии
2
Внутригрупповая дисперсия  j :
nj
Характеризует случайную
вариацию, т.е. часть вариации,
происходящую под влиянием
неучтенных факторов и не
зависящую от признака-фактора
 
2
j
 (x
2

x
)
 f ij
ij
j
i 1
nj
f
i 1
k
Средняя из внутригрупповых
2
дисперсий  :
 
2

j 1
Коэффициент детерминации 
характеризует силу влияния
признака-фактора на признак
результат.
2
i 1
 fj
f
  ( xij  x j ) 2  pij
ij
k
j 1
Правило разложения дисперсий:
2
j
nj
k
   2j  p j
j 1
j
 2   2  2
2

2  2

Анализ рядов динамики
Анализ рядов динамики
долговременная тенденция (тренд)
T
многолетние циклические колебания
Компоненты ряда
сезонные колебания
случайные колебания
Аддитивная модель
y
C
S
A
Мультипликативная модель
Y=T+S+A
y
t
Y=T∙ S∙ A
t
Выявление тенденций. Метод
аналитического выравнивания
Год
ВВП в
Трендовые
Время постоянных
значения
Квартал
ценах
I
II
III
IV
I
II
III
2008
2009
IV
I
II
III
IV
I
2010
II
III
IV
2011

t
y
~y
-15
-13
-11
-9
-7
-5
-3
-1
1
3
5
7
9
11
13
15
0
9,4
10,2
11,0
10,7
8,5
9,1
10,0
10,4
8,9
9,5
10,3
10,9
9,2
9,9
10,8
11,2
160
10
9,7
9,7
9,8
9,8
9,9
9,9
9,9
10,0
10,0
10,1
10,1
10,1
10,2
10,2
10,3
10,3
160
10
Средний уровень
y
11,5
11,0
10,5
10,0
9,5
9,0
8,5
8,0
-15 -13 -11 -9 -7 -5 -3 -1
n – нечетно iц 
n – четно
3
n 1
2
iцл 
n
i 
n
п
ц
t
1
7
9
11 13 15
tц  0 шаг h = 1
tцл  1
2
2
5
1
t 1
~y  a  b  t
п
ц
шаг h = 2
Выявление тенденций. Метод
аналитического выравнивания
Год
ВВП в
Трендовые
Время постоянных
значения
Квартал
ценах
I
II
III
IV
I
II
III
IV
I
II
III
IV
2008
2009
2010
I
II
III
IV
2011

t
y
~y
-15
-13
-11
-9
-7
-5
-3
-1
1
3
5
7
9
11
13
15
0
9,4
10,2
11,0
10,7
8,5
9,1
10,0
10,4
8,9
9,5
10,3
10,9
9,2
9,9
10,8
11,2
160
10,2
10,0
9,9
9,8
9,7
9,7
9,6
9,7
9,7
9,8
9,9
10,0
10,2
10,4
10,6
10,9
160
y
11,5
11,0
10,5
10,0
9,5
9,0
8,5
8,0
-15 -13 -11 -9 -7 -5 -3 -1
t
1
3
5
7
9
~
yt  a  b  t  c  t 2
11 13 15
Выявление тенденций . Метод
скользящих средних
Год
2008
2009
2010
2011
Скользящие
ВВП в
Время постоянных средние
Квартал
ценах
m3 m5
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
t
y
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
9,4
10,2
11,0
10,7
8,5
9,1
10,0
10,4
8,9
9,5
10,3
10,9
9,2
9,9
10,8
11,2
ŷ
–
10,2
10,6
10,1
9,4
9,2
9,8
9,8
9,6
9,6
10,2
10,1
10,0
10,0
10,6
–
окно усреднения
ŷ
–
–
10,0
9,9
9,9
9,7
9,4
9,6
9,8
10,0
9,8
10,0
10,2
10,4
–
–
y
11,5
11,0
10,5
10,0
9,5
9,0
8,5
t
8,0
0
2
6
8
10
t
m 1
2

m
рекомендуется принимать нечетным
4
3, 5, 7 и т.д.
yˆ t 
i t 
m 1
2
m
12
yi
14
16
Переход к стационарному ряду
ВВП в
Трендовые Отклонения
Время постоянных
значения от тренда
Год Квартал
ценах
2008
2009
2010
2011
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV

t
y
-15
-13
-11
-9
-7
-5
-3
-1
1
3
5
7
9
11
13
15
0
9,4
10,2
11,0
10,7
8,5
9,1
10,0
10,4
8,9
9,5
10,3
10,9
9,2
9,9
10,8
11,2
160
~y
10,2
10,0
9,9
9,8
9,7
9,7
9,6
9,7
9,7
9,8
9,9
10,0
10,2
10,4
10,6
10,9
160
z
-0,8
0,2
1,1
0,9
-1,2
-0,6
0,4
0,7
-0,8
-0,3
0,4
0,9
-1,0
-0,5
0,2
0,3
0
z
1,5
1,0
0,5
0,0
-0,5
-1,0
-1,5
-15 -13 -11 -9 -7 -5 -3 -1
t
1
z  y~
y
3
5
7
9
11 13 15
Выявление сезонных колебаний.
Метод индексов сезонности
z
1,5
Год
Квартал
Отклонения Сезонная
Время от тренда
волна
t
I
II
III
IV
I
II
III
IV
I
2008
2009
II
III
IV
2010
I
II
III
IV
2011

-15
-13
-11
-9
-7
-5
-3
-1
1
3
5
7
9
11
13
15
0
z
-0,8
0,2
1,1
0,9
-1,2
-0,6
0,4
0,7
-0,8
-0,3
0,4
0,9
-1,0
-0,5
0,2
0,3
0
ẑ
-1,0
-0,3
0,5
0,7
-1,0
-0,3
0,5
0,7
-1,0
-0,3
0,5
0,7
-1,0
-0,3
0,5
0,7
0
1,0
0,5
0,0
-0,5
-1,0
-1,5
-15 -13 -11 -9
t
-7
-5
-3
-1
1
m
 zij
5
7
9
11 13 15
m4
i 1
zˆ j 
3
m Аналитическая группировка
Период 2008
I
II
III
IV
-0,8
0,2
1,1
0,9
Индекс
2009
2010
2011 сезонности
-1,2
-0,6
0,4
0,7
-0,8
-0,3
0,4
0,9
-1,0
-0,5
0,2
0,3
-1,0
-0,3
0,5
0,7
Спасибо за внимание
Контакт: Юрий Ичкитидзе
[email protected]
Скачать