Теория информационных систем кандидат технических наук, доцент

advertisement
Учебный курс
Теория
информационных
систем
Лекция 5
кандидат технических наук, доцент
Грекул Владимир Иванович
?
Объем продаж за
предыдущие 3 месяца
3000
Март
2 345 тыс.р
2500
Апрель
1 867 тыс. р
2000
2 480 тыс. р
1500
Май
?
?
?
1000
500
Какой объем продаж
следует ожидать в июне ?
0
март
апрель
май
июнь
Прогнозирование
Внешние факторы
Внутренние факторы
Процесс
Воздействие множества внешних и внутренних факторов
приводит к изменениям характеристик процесса, которые
можно рассматривать как случайные.
Задача прогнозирования – по имеющимся данным
оценить состояние процесса в будущем.
Прогнозируемые показатели
Объем продаж;
Параметры управления запасами;
Объем выпуска продукции;
Объем закупок;
Изменение числа клиентов;
И т.д.
Временной ряд последовательность упорядоченных во
времени числовых показателей,
характеризующих уровень состояния
и изменения изучаемого явления
Представление временных рядов
Графики
Таблицы
Временной
интервал
Значение
1
12
2
18
3
14
4
16
Значение
20
15
10
1
2
3
4
Время
Виды временных рядов
• Стационарные
• Нестационарные
 Содержащие тренд
 Содержащие сезонную составляющую
 Содержащие циклическую составляющую
Стационарный временной ряд
Нестационарный временной
ряд
Временной ряд с трендом
Отражает устойчивые средние изменения показателя
Временной ряд с сезонной
компонентой
Отражает колебания показателя с определенным
периодом
Временной ряд с
циклической компонентой
Отражает непериодические колебания показателя с
большой амплитудой
Прогнозирование для
стационарных процессов
На практике для стационарности ряда
достаточно выполнения трех условий:
E[yt] не зависит от t,
При N>30 прогноз оправдается с
вероятностью 0,75. (Для и нормального
D[yt] постоянная,
распределения - с вероятностью 0,95)
Cov[yt,ys] - функция t-s.
E[yt] 2 D(yt )
0,25
0,2
E[yt]
0,15
Прогноз
оправдается с
вероятностью 0
Прогноз
оправдается с
вероятностью
0,89 (0,997)
0,1
0,05
E[yt]3 D(yt )
0
0
5
10
E[yt]
15
20
25
Прогнозирование тенденции
изменения показателей
30
25
y = 0,5842x + 13,387
20
Y 15
10
=y(x)-Y
5
0
1
2
3
4
5
6
7
8
9
10
11
Х
Тенденцию (тренд) определяет линия, проходящая
максимально близко к точкам временного ряда
Типовые функции трендов
• Линейная
y(x)a*xb
• Степенная
y(x) a*x
• Показательная
y(x) a*b
• Экспоненциальная
y(x)a*ebx
• Гиперболическая
y(x)ab/x
b
x
(x
)
a
b
*
lg(
x
)
• Логарифмическая y
Различные виды тренда
Какую линию следует использовать?
Критерии оценки прогноза
Абсолютные величины
n

i
Средняя ошибка
МЕ
=0
Среднее
абсолютное отклонение
Значение
i1
n
n

i
MAD

i1
n
20
n
Среднеквадратичная
ошибка
15
+

i
-
MSE

10
2
i1
n
n

2
Стандартное отклонение ошибок
1
2
3
i
SDE

Время
i1
n-1
При использовании
среднеквадратичного
отклонения
функция является гладкой
и допускает аналитическое
исследование
При использовании
абсолютного значения
отклонения первая
производная имеет область
неопределенности , а вторая
равна бесконечности
30
6
25
5
20
4
n
 i
Среднеквадратичная ошибка
15
MSE

i1
n
3
10
n

2
5
2
i
Стандартное отклонение ошибок
1
0
-5
2
-5
-4
-3
-2
-1
0
1
2
3
4
5
SDE

0
-10
-1
-15
-2
-5
-4
-3
-2
-1
0
i1
1
n-1
2
3
4
5
Критерии оценки прогноза
Абсолютные величины
n
Средняя ошибка

i
МЕ
i1
n
n
Среднее абсолютное отклонение

i
MAD

i1
n
n
Среднеквадратичная ошибка

i
MSE

2
i1
n
n

2
Стандартное отклонение ошибок
Максимальное абсолютное отклонение
i
SDE

i1
n-1
MAXD

max(|
|)
Критерии оценки прогноза
Относительные величины
Процентная ошибка
Среднее процентной ошибки
Y
t
y
(
t)
PE
t
100
Y
t
n
PE
i
MPE
 i1
n
Абсолютное среднее процентной ошибки
n
PE
i
MAPE
 i1
n
Максимальная процентная ошибка
MAXPE

max(
PE
i)
Резкие колебания показателей
25
Клиенты
20
15
10
5
0
1
2
3
4
5
6
7
8
9
Недели
Построение прогноза с использованием линии тренда
эффективно только при наличии устойчивого и плавного
изменения показателя.
Если временной ряд содержит скачкообразные изменения
показателя, среднее и тренд не обеспечивают получение
достоверного прогноза.
10
Метод скользящего среднего
t
1
y
(
t
1
) 
Yi
N
i
t
N

1
Используется для построения
краткосрочных прогнозов
Позволяет:
• Учитывать наиболее актуальную
(недавнюю) информацию
• Оценить погрешность прогноза в
процессе его формирования
Скользящее среднее
1 3
y
(4
) 
Yi
3i3311
Скользящее среднее
Скользящее среднее
Скользящее среднее
Выявление смены тенденции
Область роста
Короткое среднее
располагается выше
длинного
Область спада
Короткое среднее
располагается ниже
длинного
Индикатор смены
тенденции
9,00
8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
0,00
1
2
3
Временной ряд
4
5
6
7
8
Короткое среднее
9
10
11
12
13
Длинное среднее
Прогноз для временного ряда с
сезонной составляющей
К сезонным относят все явления, которые обнаруживают в
своем развитии отчетливо выраженную закономерность:
устойчиво повторяющиеся колебания уровней (сезонную
волну).
Последовательность построения прогноза:

Определить период сезонной волны

Вычислить индексы сезонности Iсез для всех составляющих
моментов времени

Построить временной ряд, скорректированный с учетом
сезонности
Yбс = Yфакт : Iсез

Построить тренд Yтр

Построить прогноз Yпр = Yтр * Iсез
Корреляционный анализ
Используется для выявления связи между
величинами х и у. Связь существует, если
|rxy|~1.
Коэффициент корреляции:
N
r

xy
(x
X
)(
y
Y
)

i
1
i
i
N
(x
X
)

i
2
i
1
N
2
(
y

Y
)
i
i
1
Где: Х, Y – средние значения переменных.
Знак коэффициента корреляции отражает вид связи:
положительная или отрицательная (возрастает или убывает у при
росте х).
Коэффициент детерминации rxy2
отражает долю изменений у, обусловленную изменениями х.
Технология дисперсионного анализа
Исходные данные объединяются в две группы,
соответствующие различным значениям исследуемого
фактора (до и после изменения политики, в ночную и в
дневную смены…)
Вычисляются межгрупповая S1 и внутригрупповая S2
дисперсии
2 Nj
2
2
(
Y

Y
)
*2

j
j
1
S

1
2
1
2
(
y

Y
)


ij
j
j
1i
1
S

2
N

2
Оценивается дисперсионное отношение
S1
F 
S2
Если F>Fтабл, то исследуемый фактор оказывает
существенное влияние на значение показателя y
Определения дисперсионного анализа
Межгрупповая дисперсия S1 – отражает колебания
групповых средних Yj относительно общей средней Y
Внутригрупповая дисперсия S2 - отражает колебания
значения показателя y относительно групповых средних Yj
20
20
18
18
16
16
14
14
12
12
10
10
Y1
8
6
4
4
2
2
0
0
2
3
4
5
6
7
8
9 10 11 12 13
12,5
12
11,5
Y2
Y
10
9,5
9
8,5
8
1
2
Изменения показателя
при воздействии всех
факторов
11
10,5
8
6
1
13
3
4
5
6
7
8
9
y
при исключении
исследуемого фактора
10
1
2
Изменения групповых
средних
под воздействием
исследуемого фактора
При отсутствии существенного влияния
исследуемого фактора
Изменения показателя
при воздействии всех
факторов
y
при исключении
исследуемого фактора
фактически не зависят от воздействия
исследуемого фактора
Изменения групповых
средних
происходят фактически
только под воздействием
остальных факторов
Межгрупповая и внутригрупповая дисперсии приблизительно одинаковы
поскольку все случайные величины изменяются под воздействием одних и тех
же факторов, следовательно, принадлежат одной генеральной совокупности.
Множественная регрессия
Используется для выявления связи между величиной у
и множеством факторов
хj , j=1,M.
y    1 x1   2 x2  ...   M xM  

- остаток - погрешность аппроксимации.
Коэффициенты регрессии  - отражают линейную
корреляционную зависимость
между результирующей величиной и каким-либо из факторов
при средних значениях других факторов.
Литература
К. Карлберг, Бизнес-анализ с помощью Excel.
Г.П. Фомин, Математические методы и модели М Финансы и
статистика, 2001г
М.Г. Зайцев, Количественные методы в менеджменте М.,
АНХ,2001
Download