Основы применения математической статистики в анализе и оценке рисков к.э.н., доцент Ичкитидзе Ю.Р. Этапы анализа и оценки рисков 1. Предварительная постановка проблемы 2. Выбор результирующего показателя, подверженного риску 3. Разложение результирующего показателя на 2-3 фактора риска 4. Сбор необходимых данных о факторах риска 5. Построение факторной модели и количественная оценка 6. Экспертная оценка статистической модели 7. Формирование возможных сценариев 8. Итоговая оценка риска Кейс #1. Модель долгосрочного прогнозирования цен на недвижимость 1. Построить долгосрочный (на 20-30 лет) прогноз цены жилой недвижимости в РФ 2. Результирующий показатель – цена жилой недвижимости за 1 м2 в С-Петербурге через 25 лет 3. Зависимость цены 1м2 (P)– от уровня арендной платы (R), её ожидаемых темпов роста (g) и процентной ставки (r) P R rg Соотношение спроса и предложения, а также уровень реальных доходов населения, инфляция, и доля ипотечных кредитов – всё это уже учтено в формуле 4. Каждый из этих факторов (R, r, g) нам надо спрогнозировать Кейс #1. Модель долгосрочного прогнозирования цен на недвижимость 4.А. Гипотеза: арендная плата (R) есть функция от номинальных доходов населения Кейс #1. Модель долгосрочного прогнозирования цен на недвижимость 4.Б. Исследуем соотношение «арендная плата (R)/уровень средних доходов» в России и развитых странах Гипотеза: с ростом реальных доходов населения, соотношение «цена аренды/доходы» будет стремиться к среднеевропейскому уровню. Кейс #1. Модель долгосрочного прогнозирования цен на недвижимость 16% 14% 12% 10% Уровень инфляции 4.B. В рамках базового сценария учтем тенденцию к снижению уровня долгосрочных процентных ставок и инфляции в России. В качестве альтернативных сценариев, рассмотрим возможность роста инфляции и процентных ставок (NB: провоцирующих резкое сокращение ипотеки как источника финансирования спроса на недвижимость) 8% 6% тренд 4% 2% Время 0% янв.06 янв.08 янв.10 янв.12 янв.14 янв.16 Кейс #1. Модель долгосрочного прогнозирования цен на недвижимость 5.А. Формируем в Excel факторную модель. Результат для базового сценария представлен в табл. ниже Прирост реального ВВП Прирост доходов населения Рублевая процентная ставка (r) Ожидаемый т.р. аренды (g) Соотношение «аренда/ доходы» Цена 1 к.кв. (40м2) млн. руб. Цена 1 к.кв. (40м2) тыс. долл. США 1% в год 2,1% в год 10% годовых 2% в год 0,85 5,955 113 В модели отражены 2 первичных фактора, определяющих будущую арендную плату (R): •уровень денежных доходов населения (зависит от т.р. реального ВВП); •соотношение «арендная плата (R)/уровень средних доходов»; Факторы процентная ставка (r) и ожидаемые темпы роста арендной платы (g) оставлены без подробного разложения Кейс #1. Модель долгосрочного прогнозирования цен на недвижимость 5.Б. Построим таблицу чувствительности для базового сценария Цена 1 к кв. (40 м2) млн. руб r = 8% r = 10% r =12% g = 0% 5, 955 4, 764 3, 970 g = 2% 7, 941 5, 955 4, 764 g = 4% 11, 911 7, 941 5, 955 Вывод: необъясненная вариация базового сценария составляет 20-30% Кейс #1. Модель долгосрочного прогнозирования цен на недвижимость 6. Полученные по модели результаты осмыслим на предмет соответствия реальности, предоставим предварительные результаты на критику экспертам 7. Сформируем от 3-х до 6-ти качественно различающихся сценариев № Сценария Т.р. реального ВВП Рост доходов населения Процентна я ставка (r) Т.р. арендной платы (g) Цена/ доходы Цена (млн. руб) 1. Базовый 1% 2% 10% 2% 0,85 5,955 2. Оптимист. 4% 7% 7% 2% 0,6 14,956 3. Пессимист. - 5% 0% 10% 2% 0,6 3,922 4. Инфляц. 1% 15% 20% 6% 0,6 4,243 5. Сближен. с Европой 2% 3% 10% 2% 0,4 3,663 Кейс #1. Модель долгосрочного прогнозирования цен на недвижимость 700 600 500 тыс. руб. за м2 8. Итоговая оценка рисков 400 Общая дисперсия 23,41 Межгрупповая дисперсия 15,52 Внутригрупповая дисперсия 7,89 Коэффициент детерминации 66% 300 200 100 0 «К Европе» «Инфляц..» «Оптимист.» «Базовый» «Пессимист.» Плотность распределения по сценарию Кейс #1. Модель долгосрочного прогнозирования цен на недвижимость 0,6 0,5 0,4 0,3 0,2 0,1 Цена (тыс. руб за м2) 0 50 150 250 350 450 550 К Европе Пессимистич. Инфляцион. Базовый Оптимистич. Низ 62,4 66,97 68,3 101,4 197,8 Среднее 91,2 97,7 106,2 148,3 389,9 Верх 128,9 137,8 157,7 209,5 685,6 Распределение случайной величины. Характеристики распределения. Математическое описание риска Риск это вероятность наступления события и величина ущерба/выгоды от наступления события n p pi вероятность наступления i-го события, Xi ущерб/выгода от наступления i-го события i i 1 p1 p Риск 2 ... pn 1 X1 X2 ... Xn Риск удобно описывать распределением (плотностью распределения) случайной величины Характеристики плотность (X ) распределения функции распределения: МX матожидание или среднее значение DX дисперсия ущерб «-» выгода «+» X среднеквадратическое отклонение (СКО) X 1 , X 1 квантили распределения Характеристики распределения случайной величины (X ) Математическое ожидание (среднее значение): n MX pi X i i 1 для непрерывной случайной величины: X 1 0 MX Дисперсия n DX pi ( X i MX ) 2 2 i 1 DX 2 M [ X 2 ] M [ X ]2 Среднеквадратическое отклонение: DX n pi ( X i MX ) 2 i 1 X 1 MX X F ( x)dx ( x) x dx X 1 - квантиль (нижний) с вероятностью альфа, значение, ниже которого случайная величина не опустится с вероятностью альфа X 1 - квантиль (верхний) с вероятностью альфа, значение, выше которого случайная величина не поднимется с вероятностью альфа Пример #1 Статистика ущерба по страховым случаям по договорам автострахования (ОСАГО), описывается следующим распределением: Размер ущерба До 40 тыс. От 40 до 80 тыс. От 80 до 120 тыс. От 120 до 160 тыс. От 160 до 200 тыс. Свыше 200 тыс. Число страховых случаев за год 1205 946 735 402 147 45 Определить: 1. 2. 3. 4. Средний размер выплаты по страховому случаю ОСАГО Вариацию ряда (дисперсию, СКО) Верхний квантиль распределения с вероятностью 0,15 Справедливый размер страховой нетто-премии, если всего заключённых за прошлый год договоров страхования было 50,3 тыс. Пример #2 Статистика годовой доходности от инвестиций на рынке акций описывается следующим распределением: Доходность Ниже 16% От -16 до -8% От -8 до 0% От 0 до 8% От 8 до 16% От 16 до 24% От 24 до 32% От 32 до 40% Свыше 40% Число наблюдений 2 3 4 8 12 8 6 2 1 Определить: 1. 2. 3. 4. Среднюю доходность инвестиций Вариацию доходности (дисперсию, СКО) Максимальный размер убытков с вероятностью 0,1 (квантиль) Выгодно ли инвестировать в рынок акций, если безрисковая процентная ставка составляет 7% годовых Анализ связи случайных величин Однофакторный регрессионный анализ Функциональная связь – каждому значению признака-фактора соответствует вполне определенное значение признака результата Статистическая связь – для каждого значения признака-фактора Х признакрезультат Y может в определенных пределах принимать любые значения с некоторыми вероятностями. Регрессия – зависимость среднего значения какой-либо случайной величины от одной или нескольких независимых величин. Эмпирическая и теоретическая регрессии Эмпирическая регрессия формируется за счет аналитического разбиения совокупности на группы и построения «ломаной» линии тренда по средним Теоретическая регрессия описывается аналитической функцией регрессии (линейная функция, парабола, экспонента, логарифм, степенная и др. Ковариация и коэффициент корреляции Линейный коэффициент парной корреляции – измеряет тесноту линейной связи между признаком-фактором и признаком-результатом x y cov (X,Y) rx,y σx σy 1 rx , y 1 - среднеквадратическое отклонение признака-фактора - среднеквадратическое отклонение признака-результата Коэффициент корреляции равный +/-1 характеризует положительную/отрицательную функциональную связь Ковариация cov( X , Y ) – показатель совместной вариации признаков 1 N cov( X , Y ) ( X X )(Y Y ) [( X i X )(Yi Y )] X Y X Y N i 1 Пример #3 По данным, представленным в таблице: а) построить эмпирическую и теоретическую функции регрессии; б) рассчитать коэффициент корреляции; в) сделать вывод о наличии/отсутствии статистической связи. № п.п. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Узнаваемость бренда, % 5 25 46 25 40 95 15 25 48 35 93 90 25 10 15 Расходы на рекламу, млн. руб/год 120 136 153 145 143 168 173 185 156 150 188 210 245 275 300 Правило разложения дисперсии Общая дисперсия 2: Характеризует вариацию признака во всей совокупности под влиянием всех факторов n 2 (x x ) i 1 i 0 Характеризует систематическую вариацию, т.е. различия в величине изучаемого признака под влиянием признака-фактора f k 2 fi n i 1 Межгруповая дисперсия 2 : 2 (x j 1 j i 1 k j 1 ( xi x0 ) 2 pi i x0 )2 f j f n k ( x j x0 )2 p j j 1 j n – число элементов в изучаемой совокупности k – число групп, на которые разбита изучаемая совокупность в зависимости от состояния признака-фактора xi – i-ый элемент изучаемой совокупности x0– среднее значение xi в j-ой группе элементов изучаемой совокупности x j – среднее значение xi по всей изучаемой совокупности fi (fj) – частота i-го элемента (j-ой группы) в изучаемой совокупности pi (pj) – частоcть i-го элемента (j-ой группы) в изучаемой совокупности Правило разложения дисперсии 2 Внутригрупповая дисперсия j : nj Характеризует случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора 2 j (x 2 x ) f ij ij j i 1 nj f i 1 k Средняя из внутригрупповых 2 дисперсий : 2 j 1 Коэффициент детерминации характеризует силу влияния признака-фактора на признак результат. 2 i 1 fj f ( xij x j ) 2 pij ij k j 1 Правило разложения дисперсий: 2 j nj k 2j p j j 1 j 2 2 2 2 2 2 Анализ рядов динамики Анализ рядов динамики долговременная тенденция (тренд) T многолетние циклические колебания Компоненты ряда сезонные колебания случайные колебания Аддитивная модель y C S A Мультипликативная модель Y=T+S+A y t Y=T∙ S∙ A t Выявление тенденций. Метод аналитического выравнивания Год ВВП в Трендовые Время постоянных значения Квартал ценах I II III IV I II III 2008 2009 IV I II III IV I 2010 II III IV 2011 t y ~y -15 -13 -11 -9 -7 -5 -3 -1 1 3 5 7 9 11 13 15 0 9,4 10,2 11,0 10,7 8,5 9,1 10,0 10,4 8,9 9,5 10,3 10,9 9,2 9,9 10,8 11,2 160 10 9,7 9,7 9,8 9,8 9,9 9,9 9,9 10,0 10,0 10,1 10,1 10,1 10,2 10,2 10,3 10,3 160 10 Средний уровень y 11,5 11,0 10,5 10,0 9,5 9,0 8,5 8,0 -15 -13 -11 -9 -7 -5 -3 -1 n – нечетно iц n – четно 3 n 1 2 iцл n i n п ц t 1 7 9 11 13 15 tц 0 шаг h = 1 tцл 1 2 2 5 1 t 1 ~y a b t п ц шаг h = 2 Выявление тенденций. Метод аналитического выравнивания Год ВВП в Трендовые Время постоянных значения Квартал ценах I II III IV I II III IV I II III IV 2008 2009 2010 I II III IV 2011 t y ~y -15 -13 -11 -9 -7 -5 -3 -1 1 3 5 7 9 11 13 15 0 9,4 10,2 11,0 10,7 8,5 9,1 10,0 10,4 8,9 9,5 10,3 10,9 9,2 9,9 10,8 11,2 160 10,2 10,0 9,9 9,8 9,7 9,7 9,6 9,7 9,7 9,8 9,9 10,0 10,2 10,4 10,6 10,9 160 y 11,5 11,0 10,5 10,0 9,5 9,0 8,5 8,0 -15 -13 -11 -9 -7 -5 -3 -1 t 1 3 5 7 9 ~ yt a b t c t 2 11 13 15 Выявление тенденций . Метод скользящих средних Год 2008 2009 2010 2011 Скользящие ВВП в Время постоянных средние Квартал ценах m3 m5 I II III IV I II III IV I II III IV I II III IV t y 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 9,4 10,2 11,0 10,7 8,5 9,1 10,0 10,4 8,9 9,5 10,3 10,9 9,2 9,9 10,8 11,2 ŷ – 10,2 10,6 10,1 9,4 9,2 9,8 9,8 9,6 9,6 10,2 10,1 10,0 10,0 10,6 – окно усреднения ŷ – – 10,0 9,9 9,9 9,7 9,4 9,6 9,8 10,0 9,8 10,0 10,2 10,4 – – y 11,5 11,0 10,5 10,0 9,5 9,0 8,5 t 8,0 0 2 6 8 10 t m 1 2 m рекомендуется принимать нечетным 4 3, 5, 7 и т.д. yˆ t i t m 1 2 m 12 yi 14 16 Переход к стационарному ряду ВВП в Трендовые Отклонения Время постоянных значения от тренда Год Квартал ценах 2008 2009 2010 2011 I II III IV I II III IV I II III IV I II III IV t y -15 -13 -11 -9 -7 -5 -3 -1 1 3 5 7 9 11 13 15 0 9,4 10,2 11,0 10,7 8,5 9,1 10,0 10,4 8,9 9,5 10,3 10,9 9,2 9,9 10,8 11,2 160 ~y 10,2 10,0 9,9 9,8 9,7 9,7 9,6 9,7 9,7 9,8 9,9 10,0 10,2 10,4 10,6 10,9 160 z -0,8 0,2 1,1 0,9 -1,2 -0,6 0,4 0,7 -0,8 -0,3 0,4 0,9 -1,0 -0,5 0,2 0,3 0 z 1,5 1,0 0,5 0,0 -0,5 -1,0 -1,5 -15 -13 -11 -9 -7 -5 -3 -1 t 1 z y~ y 3 5 7 9 11 13 15 Выявление сезонных колебаний. Метод индексов сезонности z 1,5 Год Квартал Отклонения Сезонная Время от тренда волна t I II III IV I II III IV I 2008 2009 II III IV 2010 I II III IV 2011 -15 -13 -11 -9 -7 -5 -3 -1 1 3 5 7 9 11 13 15 0 z -0,8 0,2 1,1 0,9 -1,2 -0,6 0,4 0,7 -0,8 -0,3 0,4 0,9 -1,0 -0,5 0,2 0,3 0 ẑ -1,0 -0,3 0,5 0,7 -1,0 -0,3 0,5 0,7 -1,0 -0,3 0,5 0,7 -1,0 -0,3 0,5 0,7 0 1,0 0,5 0,0 -0,5 -1,0 -1,5 -15 -13 -11 -9 t -7 -5 -3 -1 1 m zij 5 7 9 11 13 15 m4 i 1 zˆ j 3 m Аналитическая группировка Период 2008 I II III IV -0,8 0,2 1,1 0,9 Индекс 2009 2010 2011 сезонности -1,2 -0,6 0,4 0,7 -0,8 -0,3 0,4 0,9 -1,0 -0,5 0,2 0,3 -1,0 -0,3 0,5 0,7 Спасибо за внимание Контакт: Юрий Ичкитидзе [email protected]