Министерство образования и науки РФ ФГАОУ ВПО «Казанский (Приволжский) федеральный университет» Институт управления, экономики и финансов И. И. Исмагилов Анализ финансово–экономических временных рядов Конспект лекций Принято на заседании кафедры экономико-математического моделирования Протокол № 1 от 18.09.2014 Казань – 2014 1 Лекция 1. Тема 1. Временные ряды и случайные процессы. Рекомендуемые информационные ресурсы: 1. Эконометрика - 2: продвинутый курс с приложениями в финансах: Учеб. / С.А.Айвазян, Д. Фантаццини; Московская школа экономики МГУ им. М.В. Ломоносова (МШЭ) - М.: Магистр: НИЦ ИНФРА-М, 2014. - 944 с.: 70x100 1/32. (п)ISBN 978-5-9776-0333-1, 100 экз. http://znanium.com/catalog.php?bookinfo=472607 2. Компьютерные технологии анализа данных в эконометрике: Монография / Д.М. Дайитбегов. - 3-e изд., испр. и доп. - М.: Вузовский учебник: НИЦ Инфра-М, 2013. - XIV, 587 с.: 70x100 1/16. - (Научная книга). (переплет)ISBN 978-5-9558-0275-6, 500 экз. http://znanium.com/catalog.php?bookinfo=365692 Вопросы для изучения: Временные ряды как реализации случайных процессов. Характеристики случайных процессов. Случайные процессы стационарные в узком смысле и стационарные в широком смысле. Белый шум и процесс случайного блуждания. ВР обычно в эконометрике рассматривают как выборку из последовательности случайных величин X t , где t принимает целочисленные значения от 1 до T. Эта совокупность случайных величин называется дискретный случайный (стохастический) процесс (СП). При фиксированном случае наблюдается конкретная реализация СП. Поэтому говорят, что наблюдаемый ВР является реализацией СП, или ВР порождается СП. Наиболее полной статистической характеристикой СП является совместная функция распределения или функция плотности распределения. В зависимости от их свойств выделяют два вида СП: стационарные и нестационарные. Под стационарностью понимается, что у СП некоторые свойства не меняются с течением времени. В соответствии с этим рассматривают два вида стационарности: 1) строгая стационарность (стационарность в узком смысле); 2) слабая стационарность (стационарность в широком смысле). СП строго стационарен, если сдвиг по времени не меняет ни одну из функций плотности распределения. СП называется порядка n, если он вполне определяется своими функциями распределения порядка п, но не определяется функциями распределения низшего порядка. 2 СП слабо стационарный, если у него математическое ожидание (МО) и дисперсия не зависит от времени, а автокорреляционная функция (автоковариационная функция) зависит только от разности моментов времени. Это СП второго порядка. Всякий строго стационарный процесс является слабо стационарным, обратное утверждение в общем случае неверно. ВР, порожденные СП, называются ВР строгой или слабой стационарности в зависимости от вида стационарности СП. В эконометрике имеют дело, как правило, одной реализацией ВР. Поэтому важно, чтобы он обладал свойством эргодичности. Стационарный ВР называется эргодическим, если он порожден эргодическим СП. Эргодический СП – это СП, для которого среднее по времени, полученное усреднением на достаточно большом, в пределе бесконечном, интервале по единственной реализации случайного процесса, сходится с вероятностью единица к соответствующей вероятностной характеристике, полученной усреднением по множеству реализаций. Важную роль при анализе и моделировании ВР имеют понятия белого шума и случайного блуждания. ВР называется белым шумом, если порожден процессом белого шума, имеющего нулевое математическое ожидание, постоянную дисперсию и нулевую автокорреляцию. Такой процесс заведомо слабо стационарный. Если случайные величины распределены нормально (гауссовый белый шум), то процесс стационарен также и в узком смысле. Отметим, что всякий слабо стационарный СП представим в виде линейной комбинации белых шумов с разными весовыми коэффициентами. Процесс случайного блуждания (авторегрессионый процесс с коэффициентом равным 1 задается так yt yt 1 t , где t - белый шум. Процесс случайного блуждания является нестационарным, так как дисперсия непостоянна, она меняется по времени. Про СП, аналогичные процессу случайного блуждания иногда говорят, что это процессы со случайным трендом, поскольку влияние каждого отсчета белого шума не затухает со временем. Лекция 2. Тема 3. Модели стационарных и нестационарных временных рядов. Рекомендуемые информационные ресурсы 1. Эконометрика - 2: продвинутый курс с приложениями в финансах: Учеб. / С.А.Айвазян, Д. Фантаццини; Московская школа экономики МГУ им. 3 М.В. Ломоносова (МШЭ) - М.: Магистр: НИЦ ИНФРА-М, 2014. - 944 с.: 70x100 1/32. (п)ISBN 978-5-9776-0333-1, 100 экз. http://znanium.com/catalog.php?bookinfo=472607 2. Компьютерные технологии анализа данных в эконометрике: Монография / Д.М. Дайитбегов. - 3-e изд., испр. и доп. - М.: Вузовский учебник: НИЦ Инфра-М, 2013. - XIV, 587 с.: 70x100 1/16. - (Научная книга). (переплет)ISBN 978-5-9558-0275-6, 500 экз. http://znanium.com/catalog.php?bookinfo=365692 Вопросы для изучения: Модели стационарных временных рядов: модель авторегрессии AR, модель скользящего среднего МА, модель ARMA. Методология Бокса– Дженкинса. Модель ARIMA -идентификация и оценивание параметров. Оценка порядка интегрируемости. Единичные корни и тесты Дикки-Фуллера на наличие единичных корней. При моделировании ВР рядов как реализаций СП на практике наиболее популярны модели типа MA, AR, ARMA и ARIMA. Приведем краткие сведения о них. В модели типа MA текущее значение стационарного случайного процесса второго порядка представляется в виде линейной комбинации текущего и прошедших значений ошибки, которая по своим свойствам соответствует «белому шуму». Модель скользящего среднего порядка m, то есть MA(m), записывается так: yt t 1 t 1 2 t 2 ... m t m , СП, порожденный такой моделью, является слабо стационарным. Для оценки коэффициентов модели записывается система уравнений, связывающая коэффициенты автокорреляции модели с ее параметрами. Однако система является нелинейной, и требует специальных итерационных методов решения. Исключением является модель MA(1): yt t 1 t 1 . AR модели основаны на предположении о том, что текущее значение процесса может быть выражено в виде линейной комбинации некоторого количества предыдущих его значений и случайной ошибки, обладающей свойствами «белого шума». Модель авторегрессии k-го порядка АR(k) имеет вид: yt 1 yt 1 2 yt 2 ... k yt k t . СП, порожденный такой моделью, в зависимости от значений коэффициентов может быть стационарным или нестационарным. Он стационарен лишь в том случае, если представим в виде MA(). На практике 4 часто используется модель АR(1): yt 1 yt 1 t . Условие стационарности: 1 1 . Построение модели требует решения двух взаимосвязанных задач: определения подходящего порядка модели (величины k) и оценки ее коэффициентов. Для оценки коэффициентов модели формируется система линейных уравнений Юла–Уокера. ARMA модели обозначаются ARMA(k,m) и имеют вид: yt 1 yt 1 ... k yt k t 1 t 1 2 t 2 ... m t m , где k - порядок авторегрессии, m- порядок скользящего среднего. СП, порожденный такой моделью, в зависимости от значений коэффициентов может быть стационарным или нестационарным. Стационарность процесса ARMA определяется только его AR частью. Поэтому условия те же, что и у процесса AR. Если ARMA процесс стационарен, то он обязательно имеет MA() представление. Оценивание параметров в два этапа. Сперва решением модифицированной системы уравнений Юла–Уокера вычисляются оценки неизвестных коэффициентов 1 ,…, k . После этого оцениваются другие параметры модели. Экономические ВР за редким исключением являются нестационарными. Нестационарность чаще всего проявляется в наличии неслучайной составляющей. Если случайный остаточный ряд, полученный вычитанием из исходного ряда его детерминированной составляющей, представляет собой стационарный ВР, то исходный ряд называется нестационарным однородным. Для описания таких ВР часто используется ARIMA(k,d,m) модели (модели Бокса-Дженкинса). ARIMA(k,d,m) модель используется для описания ВР, содержащих полиномиальный тренд и приводимых к модели ARMA(k,m) после взятия конечных разностей d-го порядка. Для определения вида ВР и определения порядка их интегрируемости d часто используются тесты единичного корня (тест Дики-Фуллера и расширенные тесты ДикиФуллера). Лекция 3 Тема 4. Авторегрессионые модели с распределенными лагами. Рекомендуемые информационные ресурсы 1. Эконометрика - 2: продвинутый курс с приложениями в финансах: Учеб. / С.А.Айвазян, Д. Фантаццини; Московская школа экономики МГУ им. М.В. Ломоносова (МШЭ) - М.: Магистр: НИЦ ИНФРА-М, 2014. - 944 с.: 5 70x100 1/32. (п)ISBN 978-5-9776-0333-1, 100 экз. http://znanium.com/catalog.php?bookinfo=472607 2. Компьютерные технологии анализа данных в эконометрике: Монография / Д.М. Дайитбегов. - 3-e изд., испр. и доп. - М.: Вузовский учебник: НИЦ Инфра-М, 2013. - XIV, 587 с.: 70x100 1/16. - (Научная книга). (переплет)ISBN 978-5-9558-0275-6, 500 экз. http://znanium.com/catalog.php?bookinfo=365692 Вопросы для изучения: Регрессионные динамические модели. Авторегрессионые модели с распред-ленными лагами (ADL) и его частные случаи. Интерпретация параметров модели ADL. Представление модели ADL в виде модели коррекции ошибок (ECM). Оценивание модели ADL. Понятие экзогенности. Причинность по Грэнджеру. Эконометрическая модель является динамической, если в данный момент времени t она учитывает значения входящих в нее переменных, относящиеся как к текущему, так и к предыдущим моментам времени, то есть отражает динамику переменных в каждый момент времени. Различают два типа динамических моделей. В моделях первого типа значения переменной за прошлые периоды времени (лаговые переменные) непосредственно включены в модель. В моделях второго типа динамическая информация учитывается в неявном виде. Модели включают переменные, отражающие ожидаемый или желаемый уровень результата, или один из факторов в момент времени t. Этот уровень является неизвестным и определяется на основании той информации, которая имеется в наличии на предшествующий момент времени t-1. Переменные, влияние которых характеризуется определенным запаздыванием, называются лаговыми переменными. В общем случае имеем модель авторегрессии и распределённого лага (ADL-модель, англ. autoregressive distributed lags) — модель временного ряда, в которой текущие значения ряда зависят как от прошлых значений этого ряда, так и от текущих и прошлых значений других временных рядов. Модель ADL(p,q) с одной экзогенной переменной имеет вид: Модель ADL(p,0) - это модель авторегрессии AR(p) (в общем случае, возможно с экзогенной переменной без лагов), а модель ADL(0,q) - это модель распределенного лага DL(q). 6 Модель естественным образом обобщается на случай нескольких экзогенных переменных . На практике для оценки подобных моделей часто используют методологию Бокса-Дженкинса для оценки авторегрессии и специальные приёмы для упрощения оценки распределенного лага. Для получения более обоснованных оценок моделей нужна информация о структуре лага. Эта структура может быть различной. При конечной структуре лага часто используется для оценивания модели используется метод Алмона. Второй популярный метод оценивания метод Койка. Этот метод применяется в модели с бесконечным лагом. Любую модель авторегрессии и распределенного лага можно представить в виде модели коррекции ошибок (англ. ECM, Error Correction Model). Модель коррекции ошибок это модель временных рядов, в которой краткосрочная динамика корректируется в зависимости от отклонения от долгосрочной зависимости между переменными. Таким образом, модель коррекции ошибок позволяет удобно объединить в рамках одной модели краткосрочную и долгосрочную динамику, а ее коэффициенты имеют содержательную экономическую интерпретацию. Важной значение представление в виде модели коррекции ошибок имеет для интегрированных временных рядов и тесно связано с понятием коинтеграции. Коинтеграция — свойство нескольких нестационарных (интегрированных) временных рядов, заключающееся в существовании некоторой их стационарной линейной комбинации. При построении рассматриваемого класса моделей важно установить причинность по Грэнджеру, формализующее понятие причинноследственной связи между временными рядами. Основная посылка - будущее не может быть причиной настоящего или прошлого, т.е. предшествующие значения "причины" должны оказывать ощутимое влияние на будущие значения "следствия" и притом прошлые значения "следствия" не должны оказывать существенного влияния на будущие значения "причины". Имеется тест Грэнджера на причинность, основанная на регрессии переменных на свои прошлые значения и прошлые значения предполагаемой "причины" и проверке гипотезы об одновременном равенстве нулю коэффициентов при прошлых значениях "причины". Если гипотеза не отвергается, то не признается наличие причинности по Грэнджеру. Одновременно с этим, проверяется обратная модель, когда вместо "причины" используется "следствие" и наоборот. Следует отметить, что результаты теста зависят от количества используемых лагов переменных. 7 Лекция 4 Тема 5. Многомерные модели временных рядов Рекомендуемые информационные ресурсы 1. Эконометрика - 2: продвинутый курс с приложениями в финансах: Учеб. / С.А.Айвазян, Д. Фантаццини; Московская школа экономики МГУ им. М.В. Ломоносова (МШЭ) - М.: Магистр: НИЦ ИНФРА-М, 2014. - 944 с.: 70x100 1/32. (п)ISBN 978-5-9776-0333-1, 100 экз. http://znanium.com/catalog.php?bookinfo=472607 2. Компьютерные технологии анализа данных в эконометрике: Монография / Д.М. Дайитбегов. - 3-e изд., испр. и доп. - М.: Вузовский учебник: НИЦ Инфра-М, 2013. - XIV, 587 с.: 70x100 1/16. - (Научная книга). (переплет)ISBN 978-5-9558-0275-6, 500 экз. http://znanium.com/catalog.php?bookinfo=365692 Вопросы для изучения: Структурная и приведенная формы многомерных моделей. Векторная авторегрессия (VAR). Идентификация VAR: структурная и сокращенная форма, проблема одновременности и идентификационные ограничения. Оценка векторной авторегрессии. Причинность по Гренджеру. Нестационарные временные ряды: коинтеграция, модель коррекции ошибок. Тестирование коинтеграции. Модель многомерного временного ряда обычно задается в виде уравнения для каждой из компонент, причем в виде объясняющих переменных будут выступать текущие и предыдущие значения, вообще говоря, всех компонент. Таким образом, модель будет представлена системой одновременных уравнений. Одновременность не дает напрямую использовать такой распространенный метод, как метод наименьших квадратов для оценки параметров многомерных моделей. Эта особенность не имеет специфики временных рядов, а относится именно к оценке одновременных уравнений. Система одновременных уравнений может быть представлена в структурной и приведенных формах. При приведенной форме все эндогенные переменные выражены через экзогенные переменные и случайные возмущения. Поэтому можно использовать МНК для оценки коэффициентов приведенной формы. Однако экономической интерпретации требуют коэффициенты структурной формы. Для нахождения коэффициентов структурной формы применяются два способа. 1. Косвенный метод наименьших квадратов. Методом наименьших квадратов оцениваем коэффициенты приведенной формы. После этого основной вопрос заключается в том, можно ли от коэффициентов 8 приведенной формы вернуться однозначно к структурным коэффициентам, которые и имеют содержательный смысл. Говорят, что система идентифицируема, если по коэффициентам приведенной формы можно однозначно вернуться к структурным коэффициентам. Иногда соответствующая система уравнений противоречива, иногда решения будут существовать, но не будут единственными. Существуют системы одновременных уравнений, в которых косвенный МНК приводит к однозначному результату. 2. Метод инструментальных переменных. В случае системы одновременных уравнений можно легко предложить набор инструментальных переменных. Они строятся как линейные комбинации экзогенных переменных, подобранные так, чтобы не было коррелированности инструментов и случайных возмущений. Этот метод тоже зависит от того, насколько идентифицируема оцениваемая система уравнений. При отсутствии лаговых переменных двумя относительно широко применяемыми вариантами этого подхода являются так называемые двухшаговый МНК и трехшаговый МНК. При оценивании моделей, состоящих из нескольких уравнений, надо попытаться разделить переменные на эндогенные и экзогенные. Иногда это разделение экономически оправдано, иногда не очень. Подход, который позволяет уйти от разделения переменных на экзогенные и эндогенные и избавиться от сложностей, связанных с одновременностью уравнений, заключается в переходе к векторной авторегрессии. Векторная авторегрессия (VAR) - это система эконометрических уравнений, каждая из которых представляет собой модель авторегрессии и распределенного лага (ADL). При этом ADL(p,p)-модель для i-го временного ряда будет иметь вид Система уравнений такого вида и есть модель векторной авторегрессии порядка p - VAR(p). Приведенная модель является замкнутой, в том смысле, что в качестве объясняющих переменных выступают только лаги эндогенных (объясняемых) переменных. Однако, ничто не мешает дополнить модель некоторыми экзогенными переменными и их лагами. Такую модель называют открытой. Если условие стационарности выполнено, и случайное возмущение обладает свойствами белого шума, то уравнения модели VAR(p) можно оценивать обычным методом наименьших квадратов. Причем каждое уравнение можно оценивать отдельно. Таким образом, оценивание моделей VAR(p) требует только многократного применения метода наименьших квадратов и легко реализуемо. Следовательно, VAR-модели свободны от ограничений структурных моделей. Тем не менее, проблема VAR-моделей 9 заключается в резком росте количества параметров с увеличением количества анализируемых временных рядов и количества лагов. Если исходные ряды являются нестационарными I(1)-рядами, то есть интегрированными первого порядка, то это означает, что исходные временные ряды будут коинтегрированными. Если ранг коинтеграции равен количеству переменных, то исходные временные ряды являются стационарными (не содержат единичных корней) и можно строить обычную VAR-модель. Если они интегрированные, но нет коинтеграции, то строится VAR для разностей соответствующего порядка. Если имеется коинтеграция, то строится векторная модель коррекции ошибок (VECM) Анализ коинтеграции имеет важное значение в теории анализа нестационарных временных рядов. Энгель и Грэнжер показали, что линейная комбинация двух или более нестационарных рядов может быть стационарной. Если такая стационарная линейная комбинация существует, то нестационарные временные ряды называются коинтегрированными. Стационарную линейную комбинацию называют коинтегрирующим уравнением и ее можно интерпретировать как соотношение долгосрочного динамического равновесия между переменными. Разработаны тесты на наличие коинтеграции для определения того, что коинтегрированна или нет группа нестационарных рядов. Среди популярных таких тестов тест Иохансена. Лекция 5 Тема 6. Модели временных рядов для волатильности. Рекомендуемые информационные ресурсы 1. Эконометрика - 2: продвинутый курс с приложениями в финансах: Учеб. / С.А.Айвазян, Д. Фантаццини; Московская школа экономики МГУ им. М.В. Ломоносова (МШЭ) - М.: Магистр: НИЦ ИНФРА-М, 2014. - 944 с.: 70x100 1/32. (п)ISBN 978-5-9776-0333-1, 100 экз. http://znanium.com/catalog.php?bookinfo=472607 2. Компьютерные технологии анализа данных в эконометрике: Монография / Д.М. Дайитбегов. - 3-e изд., испр. и доп. - М.: Вузовский учебник: НИЦ Инфра-М, 2013. - XIV, 587 с.: 70x100 1/16. - (Научная книга). (переплет)ISBN 978-5-9558-0275-6, 500 экз. http://znanium.com/catalog.php?bookinfo=365692 Вопросы для изучения: Модели временных рядов, включающие гетероскедастичность. Модели авторегрессии-условной гетероскедастичности ARCH. Обобщенные модели 10 авторегрессии-условной гетероскедастичности GARCH. модели GARCH. Тесты на наличие ARCH-эффектов. Модификации Традиционные модели временных рядов, такие как модель ARMA, не могут адекватно учесть все характеристики, которыми обладают финансовые временные ряды, и требуют расширения. Одна из характерных черт финансовых рынков — это то, что присущая рынку неопределенность изменяется во времени. Как следствие, наблюдается «кластеризация волатильности». Под этим имеется в виду то, что могут чередоваться периоды, когда финансовый показатель ведет себя непостоянно, и относительно спокойные периоды. Термин «волатильность» (volatility — англ. изменчивость, непостоянство) используется, как правило, для неформального обозначения степени вариабельности, разброса переменной. Формальной мерой волатильности служит дисперсия (или среднеквадратическое отклонение). Эффект кластеризации волатильности отмечен для, таких рядов как изменение цен акций, валютных курсов, доходности спекулятивных активов. Модель ARCH, т.е. модель с авторегрессионной условной гетероскедастичностью (autoregressive conditional heteroskedasticity), предложена Р. Энглом в 1982 г. для моделирования кластеризации волатильности. Пусть временной ряд представляет собой следующий процесс где — белый шум. Тогда как условное, так и безусловное математическое ожидание этого процесса будет равно нулю. Условная дисперсия данного процесса будет равна Смысл модели ARCH состоит в том, что если абсолютная величина ошибки модели оказывается большой, то это приводит к повышению условной дисперсии в последующие периоды, и наоборот. Таким образом, ARCH-процесс характеризуется инерционностью условной дисперсии (кластеризацией волатильности). Процесс ARCH имеет постоянное (нулевое) математическое ожидание и не автокоррелирован, то он является слабостационарным в случае, если у него есть дисперсия. Еще одно свойство ARCH-процессов состоит в том, что безусловное распределение ошибок имеет более высокий куртозис (т.е. более толстые хвосты и острую вершину), чем нормальное распределение. Это 11 свойство ARCH-процессов хорошо соответствует финансовым временным рядам, которые обычно характеризуются толстыми хвостами. Получить состоятельные оценки коэффициентов ARCH-процесса можно используя вышеприведенное представление квадратов ARCHпроцесса в виде авторегрессии. Более эффективные оценки получаются при использовании метода максимального правдоподобия. При применении ARCH-моделей к реальным данным было замечено, что модель ARCH(1) не дает достаточно длительных кластеров волатильности, а только порождает большое число выбросов. Для корректного описания данных требуется довольно большая длина лага, что создает трудности при оценивании. Модель GARCH (generalized ARCH) — обобщенная модель ARCH является альтернативной модификацией модели ARCH, позволяющей получить более длинные кластеры при малом числе параметров. Стандартным методом оценивания для моделей GARCH является метод максимального правдоподобия. Максимизируя функцию правдоподобия по неизвестным параметрам, получают оценки максимального правдоподобия для GARCH-процесса. С точки зрения прогнозирования перспективной является модель, сочетающая ARIMA с GARCH. Модель ARIMA в этом случае используется для моделирования поведения условного математического ожидания ряда, а GARCH — для моделирования условной дисперсии. 12