Загрузил Albina Khamitova

analiz-samopodobnyh-svoystv-raznorodnogo-trafika

реклама
Психолого-педагогический журнал Гаудеамус, №2 (16), 2010
АНАЛИЗ САМОПОДОБНЫХ СВОЙСТВ РАЗНОРОДНОГО ТРАФИКА
Р.В. Суханов
ООО «Байтсервис», г. Москва, Россия
Процессы, обладающие самоподобными
свойствами, в отличие от других случайных
процессов, например пуассоновского, характеризуются наличием последействия. При
этом самоподобный процесс является пульсирующим, т. е. во время относительно низкой скорости поступления событий возможны большие всплески. Одним из важнейших
параметров, являющимся по сути индикатором и характеризующим степень самоподобия, является параметр Херста (H), впервые
введенным Гарольдом Эдвином Херстом.
В зависимости от значений параметра Херста
выделяют два типа случайных процессов:
– при 0 < = H < = 0,5 – случайный процесс не обладает самоподобием;
– при H > 0,5 – процесс обладает длительной памятью и является самоподобным.
С целью определения самоподобных
свойств трафика были проведены исследования в типовой сети провайдера: осуществлен
набор статистических данных разнородного
трафика, вычислены различными методами
значения параметра Херста и произведено
сравнение полученных результатов с вычис-
ленными подобным образом значениями Н
для случайного процесса – гауссовского шума.
Для представления табличных данных в
виде определенных значений использована
программа PRTG Traffic Grapher. Она позволяет фиксировать полученные значения трафика в файл формата «.csv», в котором данные разделены специальным знаком – разделителем, позволяющим импортировать их
в специальную программу для статистической обработки. В качестве последней использована SELFIS, разработанная Thomas
Karagiannis. Значения отсчетов идеального
гауссова шума для аналогичного исследования временного ряда были получены в этой
же оболочке с помощью программы Fractan,
разработанной В. Сычевым. Метод получения результатов основан на центральной
предельной теореме.
На рисунке 1 представлен агрегированный временной ряд в программе SELFIS с
общим количеством отсчетов равным 65 535,
представляющий собой замеры входящего
трафика, исследованного в сети провайдера
на протяжении нескольких суток.
Рис. 1. Статистика загрузки канала
Определим значение H для входящего
трафика семью способами [1; 2].
Метод расчета совокупного различия
(Aggregate Variance) показал значение параметра H = 0.836. На логарифмическом гра1
3. Механизмы развития инновационных процессов в эпоху информационного общества
фике (рис. 2) выборочная дисперсия относительно уровня агрегирования – прямолинейная зависимость с наклоном «B» больше,
чем -1. В этом случае H=1 + B/2.
Метод расчета нормированного размаха
показал значение H = 0.864.
На рисунке 3 приведена логарифмическая зависимость R/S статистики от числа
агрегированных точек.
Рис. 2. Результаты расчета методом совокупного различия
Рис. 3. Результаты расчета методом нормированного размаха
Метод расчета с использованием периодограмм (Periodogram) показал значение
H=0.955. На рисунке 4 приведена логарифмическая зависимость спектральной плотности временных рядов от частоты. Периодограма определяется:
,
где v – частота, N – длина временного
ряда, X – фактическое значение временного
ряда.
Рис. 4. Результаты расчета методом использования периодограмм
2
Психолого-педагогический журнал Гаудеамус, №2 (16), 2010
Метод расчета на основе абсолютных
моментов (Absolute Moments) показал значение H=0.733. Агрегированные значения X(m)
определяются, используя разные размеры
блоков m.
На логарифмическом графике (рис. 5)
уровень агрегирования в зависимости от
первого абсолютного момента агрегированного X (m) характеризуется прямой линией
с наклоном H-1.
Рис. 5. Результаты расчета методом на основе абсолютных моментов
Метод расчета разности остатков
(Variance of Residuals) показал значение H=1.160. На логарифмическом графике
(рис. 6) уровень агрегирования в зависимости от средней дисперсии остатков есть прямая с наклоном H/2.
Рис. 6 Результаты расчета методом разности остатков
Метод расчета энергии всплесков (AbryVeicth Estimator) дал значение H=0.989. Учет
энергии всплесков, в различных масштабах,
позволяет определить общую оценку Н.
Метод расчета минимальных значений
(Whittle Estimator) дал значение H=0.930.
Он основан на минимизации функции правдоподобия, которая применяется к периоду
временных рядов, дает оценку H и приводит зависимость на доверительном интервале.
Каждый из перечисленных выше семи
методов обладает своей точностью и погрешностью расчетов. Для минимизации
возникающих погрешностей при расчетах
общего среднего значения, а также в качестве дополнительного аргумента в пользу
предположения о самоподобном характере
трафика, исследованного в сети провайдера,
проведем вычисления тех же показателей на
основе автокорреляционной функции и
средней взаимной информации (по сути –
взаимная энтропия) с использованием программы Fractan.
Результаты расчетов Н с помощью программы Fractan приведены на рисунке 7.
Полученное значение H = 0.9649, фрактальная размерность D=2 – H=1.0351.
3
3. Механизмы развития инновационных процессов в эпоху информационного общества
Рис. 7. Показатели Херста исследуемого трафика
Процесс X принято считать самоподобным, если для достаточно больших k его автокорреляционная функция не вырождается
при m →∞, т. е. на всем протяжении
хастического) процесса, напротив, при m→∞
автокорреляционная функция вырождается.
Если же процесс строго самоподобен, то при
усреднении по блокам размера m его автокорреляционная функция существенно не
меняет своего значения. Это относится и к
средней взаимной информации.
Их характер изменения приведен на рисунке 8.
где процесс Х(m) получен усреднением
исходного процесса по неперекрывающимся
блокам размера m. У несамоподобного (сто-
Рис. 8. Характер зависимостей автокорреляционной функции и средней взаимной информации
4
Психолого-педагогический журнал Гаудеамус, №2 (16), 2010
Вычислим значение параметра Херста,
автокорреляционную функцию и среднюю
взаимную информацию для случайного
процесса – гауссовского шума и сравним
полученные результаты со значениями
для реального трафика. Для этого с помощью программы Fractan смоделируем
случайный процесс, по своим статистическим характеристикам (Mean, Variance, Std,
Skewness, Kurtosis) приближенный к реальному трафику сети провайдера, полученные
значения
импортируем
в
программу
SELFIS.
На рисунке 9 представлен полученный
агрегированный временной ряд с общим количеством отсчетов равным 33 322, представляющий собой случайные величины гауссовского шума.
Рис. 9. Агрегированный временной ряд для гауссовского процесса
Проведем вычисление значения H для
гауссовского шума ранее рассмотренными
выше семью способами.
Метод расчета совокупного различия
(Aggregate Variance) показал значение параметра H = 0.492 (рис. 10).
Рис. 10. Метод расчета совокупного различия для гауссовского процесса
Другие методы дают следующие результаты:
– метод расчета нормированного размаха – H = 0.517;
– метод расчета с использованием периодограмм – H = 0.502;
– метод расчета на основе абсолютных
моментов – H = 0.383;
– метод расчета на основе разности остатков – H = 0.506;
– метод расчета энергии всплесков – H =
0.544;
– метод расчета минимальных значений – H = 0.500.
Расчеты показателя Херста, проведенные с помощью программы Fractan, показали
5
3. Механизмы развития инновационных процессов в эпоху информационного общества
значение H = 0.3650, фрактальную размерность D=2-H=1.6350.
Полученные несколькими способами и разными программами значения оценок показателя
Херста (H) как для реального трафика, так и для
случайного процесса в виде гауссовского шума
сведены в таблицу 1, в которой приведены усредненные значения для всех методов расчета H.
Таблица 1
Усредненные значения оценок показателя Херста
Вид
трафика
Реальный
трафик
Гауссовский
шум
Методы оценки показателя Хэрста
ПО «SELFIS»
Абсол.
Разница
Энерг.
Мин.
моменты остатков всплесков значения
Сов.
различие
Норм.
размах
Период.
0.836
0.864
0.955
0.733
1.160
0.989
0.492
0.517
0.502
0.383
0.506
0.544
Как видно, для реального трафика среднее значение показателя Херста H=0.929, для
случайного гауссовского шума Н=0.476.
Таким образом, на основании полученных результатов можно сделать вывод о том,
что реальный разнородный трафик имеет
сложный характер, похожий на случайный,
но при этом обладает свойствами самоподобия, что позволяет применять алгоритмы и
методы эффективного использования ресур-
ПО
«Fractan»
Среднее
значение
Херста
0.930
0.964
0.929
0.500
0.365
0.476
сов телекоммуникационных сетей за счет
прогнозирования его поведения.
Литература
1. Петров В.В. Статистический анализ сетевого трафика. М., 2003.
2. Шелухин О.И., Тенякшев А.М., Осин А.В.
Фрактальные процессы в телекоммуникациях: монография / под ред. О.И. Шелухина. М.,
2003.
6
Скачать