Перейти к версии для печати - Международный банковский

реклама
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Лабораторная работа 4
Оценка цикличности рядов посредством
преобразования Фурье
Цель работы: Спектральный анализ (СА) позволяет оценить наличие
циклических (сезонных) компонентов в имеющихся данных. Цель СА заключается
в декомпозиции сложного временного ряда с сезонными составляющими на
несколько синусоидальных функций определенной длины волны. По существу,
выполнение СА над временным рядом представляет собой прохождение
последнего через призму (аналогично свету) для того, чтобы идентифицировать
длины волн и важность основных циклических компонентов. В результате
применения СА можно определить несколько циклов различной протяженности в
рассматриваемом временном ряде, который на первый взгляд представляется
похожим на случайный шум.
Оглавление
Пакет Statistica, 6.0............................................................................................................1
Пакет Statgraphics, 5.1 .....................................................................................................8
Задание ..................................................................................................................................11
По пакету Statistica, 6.0 .............................................................................................11
По пакету Statgraphics, 5.1 ......................................................................................11
Пакет Statistica, 6.0
1. Открыть через меню File – Open – Datasets файл данных Sunspot . Данные
представляют собой наблюдаемые в период с 1749г. по 1924г. значения
солнечных пятен. От этой величины зависят погодные условия на Земле,
активность человека, телекоммуникации и прочие явления. В данной работе
необходимо проверить цикличность солнечной активности.
2. Из меню Statistics – Advanced Linear / Nonlinear Models (Статистики –
Расширенные линейные / нелинейные модели) выбрать Time Series /
Forecasting(Временные ряды / Прогнозирование) для отображения стартовой
панели Time Series Analysis(Анализ временных рядов) и открытия диалога.
Отметим, что в открытом файле имеется только одна переменная Spots (Пятна),
поэтому при открытии диалога эта переменная выбирается автоматически (рис. 1).
1
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Рис. 1. Стартовая панель
Далее щелкнуть кнопку Spectral (Fourier) analysis для отображения диалога
Fourier (Spectral) Analysis (Спектральный анализ Фурье) (рис. 2).
Рис. 2. Диалоговое окно спектрального анализа
Перед проведением СА построим график исходных данных. Файл данных в
качестве строк содержит соответствующие годы наблюдений, поэтому для
использования их на графике необходимо из опции Review series (Просмотр ряда)
2
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
указать метку Case names (Имена строк) в окне Label data points with (Метка
данных точек с ..). Далее выбрать опцию Scale X axis in plots manually (Масштаб Х
на графиках, вручную) и установить Min = 1 и Step (Шаг) = 10. Затем нажать
кнопку Plot (График) в окне Review highlighted variable (Просмотр высвеченной
переменной). График - на рис. 3.
Рис. 3. Исходный временной ряд
3. Полученный график имеет циклический характер и демонстрирует
отсутствие тренда. Вследствие этого необходимо в окне Transformation of input
series (Преобразование входного ряда), которое появляется при закладке
Advanced (Расширенная), указать метку Detrend (Отсутствие тренда). Очевидно,
что среднее значение ряда больше нуля, поэтому необходимо указать метку
Subtract mean (Вычитание среднего). В противном случае на графике
периодограммы может появиться большой выброс на нулевой частоте.
Теперь все готово для начала анализа. Необходимо щелкнуть ОК по кнопке
Single series Fourier analysis (Анализ Фурье единственного ряда), и на мониторе
отобразится
окно
диалога
Single
Series
Fourier
(Spectral)
Analysis
Results(Результаты спектрального анализа временного ряда).
3
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Рис. 4. Окно результатов спектрального анализа временного ряда
4. Просмотр результатов. В верхней части окна показаны некоторые
суммарные статистики для этого ряда и, кроме того, 5 наибольших пиков
периодограммы по частоте. Первые 3 пика имеют место при частотах: 0,0852;
0,0909 и 0,0114. Эта информация полезна при анализе очень длинных рядов
(например, содержащих порядка 100000 наблюдений), которые не могут быть
отображены на одном графике. Однако в этом случае может быть легко получена
периодограмма, при построении которой используется вся информация.
Периодограмма появляется после инициирования кнопки Periodogram при
открытой опции Quick (Быстрая) (рис. 5).
5. На периодограмме наблюдаются два явных пика, наибольший из которых
находится на частоте, равной примерно 0,09. Для просмотра значений всей
периодограммы необходимо перейти в опцию Advanced (Расширенная) и нажать
кнопку Summary (Суммарный). Результаты представлены в форме таблицы (см.
табл. 1). Параметр Frequency (Частота) представляет собой число циклов в
единицу времени (где каждое наблюдение рассматривается как занимающее
единицу времени).
Таким образом, частота, равная 0,0909 соответствует параметру Period
(Период, т. е. количеству единиц времени, необходимых для завершения одного
полного цикла), равному 11. Так как данные о солнечных пятнах представляют
ежегодные наблюдения, можно сделать вывод о наличии явно выраженного 11летнего цикла солнечной активности.
4
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Рис. 5. Периодограмма ряда
Таблица 1. Результат спектрального анализа
6. Спектральная плотность (СП). Обычно для получения оценок СП
используется сглаживание периодограммы, при котором также происходит
исключение случайных флуктуаций. Вид взвешенного скользящего среднего и
ширина окна сглаживания выбирается в окне Data windows for spectral density
estimates (Окна для оценок спектральной плотности), которое появляется при
включении расширенной (Advanced) опции. Для рассматриваемого примера
установим 5-точечное окно Хэмминга, после чего нажмем кнопку Spectral density
(Спектральная плотность) при включенной опции Review & plot (Просмотр и
график) (рис. 6).
5
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Рис. 6. Спектральная плотность
Два пика теперь видны более ясно. Можно просмотреть также значения
периодов, выделенных в этом временном ряду. Укажем при включенной опции
Review & plot (Просмотр и график) метку Period (Период) в окне Plot by (График),
определяющем горизонтальную ось графика, и нажмем кнопку Spectral density
(Спектральная плотность). Появившийся график (рис. 7) показывает зависимость
СП от периода (в годах), откуда ясно виден четкий 11-летний цикл в активности
солнечных пятен. Кроме того, имеется еще один более длинный примерно 80-90 летний цикл.
Рис. 7. Зависимость спектральной плотности от периода
7. Частотные окна позволяют найти область частот, которые дают наибольший
вклад в периодическое поведение ряда. Это может быть выполнено путем
6
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
сглаживания периодограммы посредством взвешенного скользящего среднего
(СС).
Положим, что окно СС имеет ширину m, которая обычно принимается нечетной.
Кроме того, между шириной окна и параметром р, определяющим часть данных,
которые «сужают» обрабатываемые данные в начале и конце ряда за счет
конечной ширины, существует соотношение: p= (m-1)/2.
Укажем наиболее распространенные в спектральном анализе окна:
 Окно Даниэля (окно с равными весами) – этот прием сглаживания
сводится
к
простому
(с
равными
весами)
преобразованию
значений
периодограммы. Каждая оценка СП вычисляется как среднее из m/2
предшествующих и m/2 последующих значений периодограммы.
 Окно Тьюки – здесь веса для взвешенного СС значений периодограммы
вычисляются по формуле:
wi  0,5  0,5 cos(j / p)
при
w j  w j при j  0.
j  0, p ,
 Окно Хэмминга – для каждой частоты веса для взвешенного СС значений
периодограммы определяются как
w j  0,54  0,46 cos(j / p) при j  0, p;
w j  w j при j  0.
 Окно Парзена – в этом случае веса на каждой частоте определяются
следующим образом
wi  1  6( j / p) 2  6( j / p) 3 при j  0, p / 2;
w j  2(1  j / p)3 при j  0.
 Окно
формуле
Бартлета
–
весовые
коэффициенты
w j  1  ( j / p)
при
здесь
рассчитываются
по
j  0, p
w j  w j при j  0.
За исключением окна Даниэля все весовые функции будут присваивать
большие значения весов наблюдениям, находящимся в центре окна, и по мере
удаления от центра веса становятся меньше. Во многих случаях различные окна
будут приводить примерно к одинаковым результатам, однако представляется
интересным провести анализ одного и того же ряда с использованием различных
окон.
7
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Пакет Statgraphics, 5.1
1. Открыть через меню File – Open – Open Data File файл данных Carsales
(Продажа машин). Данные представляют собой количество продаваемых машин (в
тыс. шт.) по месяцам на протяжении 6 лет.
2. Через Special – Time Series Analysis (Специальные – Анализ временных
рядов) перейти к опции Descriptive Methods (Описательные методы). В
появившемся окне выбрать в качестве переменной параметр «sales» (рис. 8).
Остальные поля окна оставить неизменными.
Рис. 8. Входное окно описательных методов
3. После выбора переменной нажать ОК, и на экране появятся результаты
вычисления.
Среди табличных опций, перечень которых появляется после нажатия желтой
клавиши в верхнем ряду, выбрать следующие:
 Analysis Summary (Итоговый анализ);
 Periodogram Table (Таблица периодограммы) .
В табл. 2 приводятся общие сведения об анализируемом ряде, в частности,
число наблюдений, выборочный интервал.
8
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Таблица 2. Сведения об анализируемом ряде
Здесь консультант (Advisor) дает следующий совет:
Эта процедура рассчитывает различные статистики и графики для выбранной
переменной «sales». Данные перекрывают 72 временных периода. Выбрать
соответствующие таблицы и графики с использованием необходимых опций.
В таблице 3 приводятся рассчитанные значения периодограммы
Таблица 3. Значения периодограммы
Консультант в этом случае дает следующий совет:
Эта таблица показывает значения ординат периодограммы для переменной
«sales». Периодограмма строится путем подгонки ряда синусных функций на
каждой из 36 частот. Ординаты равны квадрату амплитуд этих синусных функций.
Периодограмма может рассматриваться как анализ дисперсии по частоте, т. к.
сумма ординат равна общей исправленной сумме квадратов в таблице анализа
дисперсий. Периодограмма может быть построена путем выбора соответствующих
графических опций.
9
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
4. Из графических опций, перечень которых появляется после нажатия
третьей клавиши в верхнем ряду, выбрать следующие:
 Horizontal Time Sequence Plot (Горизонтальный временной график);
 Periodogram (Периодограмма).
На рис. 9 и 10 показаны, соответственно, исходный временной ряд и
периодограмма.
Рис. 9. Исходный ряд
Рис. 10. Периодограмма ряда
Анализ периодограммы четко указывает на наличие цикличности (сезонности)
в данном ряде.
10
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Задание
По пакету Statistica, 6.0
 Взять файл Series_g из имеющихся в пакете данных и провести
спектральный анализ для этой переменной.
 Построить графическое отображение СП в зависимости от периода при
различных типах окон и их протяженностях.
По пакету Statgraphics, 5.1
 Перенести данные файла Series_g в этот пакет и провести оценку наличия
сезонных компонентов. Определить период сезонности, если последняя имеется.
11
Скачать