Учебный курс Теория информационных систем Лекция 5 кандидат технических наук, доцент Грекул Владимир Иванович ? Объем продаж за предыдущие 3 месяца 3000 Март 2 345 тыс.р 2500 Апрель 1 867 тыс. р 2000 2 480 тыс. р 1500 Май ? ? ? 1000 500 Какой объем продаж следует ожидать в июне ? 0 март апрель май июнь Прогнозирование Внешние факторы Внутренние факторы Процесс Воздействие множества внешних и внутренних факторов приводит к изменениям характеристик процесса, которые можно рассматривать как случайные. Задача прогнозирования – по имеющимся данным оценить состояние процесса в будущем. Прогнозируемые показатели Объем продаж; Параметры управления запасами; Объем выпуска продукции; Объем закупок; Изменение числа клиентов; И т.д. Временной ряд последовательность упорядоченных во времени числовых показателей, характеризующих уровень состояния и изменения изучаемого явления Представление временных рядов Графики Таблицы Временной интервал Значение 1 12 2 18 3 14 4 16 Значение 20 15 10 1 2 3 4 Время Виды временных рядов • Стационарные • Нестационарные Содержащие тренд Содержащие сезонную составляющую Содержащие циклическую составляющую Стационарный временной ряд Нестационарный временной ряд Временной ряд с трендом Отражает устойчивые средние изменения показателя Временной ряд с сезонной компонентой Отражает колебания показателя с определенным периодом Временной ряд с циклической компонентой Отражает непериодические колебания показателя с большой амплитудой Прогнозирование для стационарных процессов На практике для стационарности ряда достаточно выполнения трех условий: E[yt] не зависит от t, При N>30 прогноз оправдается с вероятностью 0,75. (Для и нормального D[yt] постоянная, распределения - с вероятностью 0,95) Cov[yt,ys] - функция t-s. E[yt] 2 D(yt ) 0,25 0,2 E[yt] 0,15 Прогноз оправдается с вероятностью 0 Прогноз оправдается с вероятностью 0,89 (0,997) 0,1 0,05 E[yt]3 D(yt ) 0 0 5 10 E[yt] 15 20 25 Прогнозирование тенденции изменения показателей 30 25 y = 0,5842x + 13,387 20 Y 15 10 =y(x)-Y 5 0 1 2 3 4 5 6 7 8 9 10 11 Х Тенденцию (тренд) определяет линия, проходящая максимально близко к точкам временного ряда Типовые функции трендов • Линейная y(x)a*xb • Степенная y(x) a*x • Показательная y(x) a*b • Экспоненциальная y(x)a*ebx • Гиперболическая y(x)ab/x b x (x ) a b * lg( x ) • Логарифмическая y Различные виды тренда Какую линию следует использовать? Критерии оценки прогноза Абсолютные величины n i Средняя ошибка МЕ =0 Среднее абсолютное отклонение Значение i1 n n i MAD i1 n 20 n Среднеквадратичная ошибка 15 + i - MSE 10 2 i1 n n 2 Стандартное отклонение ошибок 1 2 3 i SDE Время i1 n-1 При использовании среднеквадратичного отклонения функция является гладкой и допускает аналитическое исследование При использовании абсолютного значения отклонения первая производная имеет область неопределенности , а вторая равна бесконечности 30 6 25 5 20 4 n i Среднеквадратичная ошибка 15 MSE i1 n 3 10 n 2 5 2 i Стандартное отклонение ошибок 1 0 -5 2 -5 -4 -3 -2 -1 0 1 2 3 4 5 SDE 0 -10 -1 -15 -2 -5 -4 -3 -2 -1 0 i1 1 n-1 2 3 4 5 Критерии оценки прогноза Абсолютные величины n Средняя ошибка i МЕ i1 n n Среднее абсолютное отклонение i MAD i1 n n Среднеквадратичная ошибка i MSE 2 i1 n n 2 Стандартное отклонение ошибок Максимальное абсолютное отклонение i SDE i1 n-1 MAXD max(| |) Критерии оценки прогноза Относительные величины Процентная ошибка Среднее процентной ошибки Y t y ( t) PE t 100 Y t n PE i MPE i1 n Абсолютное среднее процентной ошибки n PE i MAPE i1 n Максимальная процентная ошибка MAXPE max( PE i) Резкие колебания показателей 25 Клиенты 20 15 10 5 0 1 2 3 4 5 6 7 8 9 Недели Построение прогноза с использованием линии тренда эффективно только при наличии устойчивого и плавного изменения показателя. Если временной ряд содержит скачкообразные изменения показателя, среднее и тренд не обеспечивают получение достоверного прогноза. 10 Метод скользящего среднего t 1 y ( t 1 ) Yi N i t N 1 Используется для построения краткосрочных прогнозов Позволяет: • Учитывать наиболее актуальную (недавнюю) информацию • Оценить погрешность прогноза в процессе его формирования Скользящее среднее 1 3 y (4 ) Yi 3i3311 Скользящее среднее Скользящее среднее Скользящее среднее Выявление смены тенденции Область роста Короткое среднее располагается выше длинного Область спада Короткое среднее располагается ниже длинного Индикатор смены тенденции 9,00 8,00 7,00 6,00 5,00 4,00 3,00 2,00 1,00 0,00 1 2 3 Временной ряд 4 5 6 7 8 Короткое среднее 9 10 11 12 13 Длинное среднее Прогноз для временного ряда с сезонной составляющей К сезонным относят все явления, которые обнаруживают в своем развитии отчетливо выраженную закономерность: устойчиво повторяющиеся колебания уровней (сезонную волну). Последовательность построения прогноза: Определить период сезонной волны Вычислить индексы сезонности Iсез для всех составляющих моментов времени Построить временной ряд, скорректированный с учетом сезонности Yбс = Yфакт : Iсез Построить тренд Yтр Построить прогноз Yпр = Yтр * Iсез Корреляционный анализ Используется для выявления связи между величинами х и у. Связь существует, если |rxy|~1. Коэффициент корреляции: N r xy (x X )( y Y ) i 1 i i N (x X ) i 2 i 1 N 2 ( y Y ) i i 1 Где: Х, Y – средние значения переменных. Знак коэффициента корреляции отражает вид связи: положительная или отрицательная (возрастает или убывает у при росте х). Коэффициент детерминации rxy2 отражает долю изменений у, обусловленную изменениями х. Технология дисперсионного анализа Исходные данные объединяются в две группы, соответствующие различным значениям исследуемого фактора (до и после изменения политики, в ночную и в дневную смены…) Вычисляются межгрупповая S1 и внутригрупповая S2 дисперсии 2 Nj 2 2 ( Y Y ) *2 j j 1 S 1 2 1 2 ( y Y ) ij j j 1i 1 S 2 N 2 Оценивается дисперсионное отношение S1 F S2 Если F>Fтабл, то исследуемый фактор оказывает существенное влияние на значение показателя y Определения дисперсионного анализа Межгрупповая дисперсия S1 – отражает колебания групповых средних Yj относительно общей средней Y Внутригрупповая дисперсия S2 - отражает колебания значения показателя y относительно групповых средних Yj 20 20 18 18 16 16 14 14 12 12 10 10 Y1 8 6 4 4 2 2 0 0 2 3 4 5 6 7 8 9 10 11 12 13 12,5 12 11,5 Y2 Y 10 9,5 9 8,5 8 1 2 Изменения показателя при воздействии всех факторов 11 10,5 8 6 1 13 3 4 5 6 7 8 9 y при исключении исследуемого фактора 10 1 2 Изменения групповых средних под воздействием исследуемого фактора При отсутствии существенного влияния исследуемого фактора Изменения показателя при воздействии всех факторов y при исключении исследуемого фактора фактически не зависят от воздействия исследуемого фактора Изменения групповых средних происходят фактически только под воздействием остальных факторов Межгрупповая и внутригрупповая дисперсии приблизительно одинаковы поскольку все случайные величины изменяются под воздействием одних и тех же факторов, следовательно, принадлежат одной генеральной совокупности. Множественная регрессия Используется для выявления связи между величиной у и множеством факторов хj , j=1,M. y 1 x1 2 x2 ... M xM - остаток - погрешность аппроксимации. Коэффициенты регрессии - отражают линейную корреляционную зависимость между результирующей величиной и каким-либо из факторов при средних значениях других факторов. Литература К. Карлберг, Бизнес-анализ с помощью Excel. Г.П. Фомин, Математические методы и модели М Финансы и статистика, 2001г М.Г. Зайцев, Количественные методы в менеджменте М., АНХ,2001