Основные классы ИС Бизнес-приложения: DSS-BI. продолжение www.econ.msu.ru

advertisement
Основные классы ИС
продолжение
Бизнес-приложения: DSS-BI.
www.econ.msu.ru
Необходимость СППР
• Ограниченная рациональность (не всегда рациональный
экономический выбор)
Herbert Simon "Models of Man": "boundedly rational agents
experience limits in formulating and solving complex problems and in
processing (receiving, storing, retrieving, transmitting) information"
 Трудно сформулировать целевую функцию
 Недостаточно данных
 Трудно обрабатывая данные получить требуемые информацию
и знания
• Огромный объем сведений = >> трудно переработать и
использовать для принятия экономических решений
Кафедра экономической информатики ЭФ МГУ
2
Decision Support Systems (DSS).
• Системы поддержки принятия решений
(СППР), основанные на:
Документах
Знаниях
Телекоммуникациях
Данных
Моделях
Кафедра экономической информатики ЭФ МГУ
3
DSS на данных: OLAP
• OLAP - Online analytical processing или оперативный
анализ информации. Эдгар Кодд, 1993.
• Концепция FASMI
 Fast (Быстрый) – 1-5 секунд на ответ
 Analysis (Анализ) – Всевозможные аналитические инструменты
без дополнительной настройки
 Shared (Разделяемый) – Безопасность, помехозащищенность
 Multidimensional (Многомерный) – Полная иерархичность и
многомерность
 Information (Информация) – Быстрый доступ к информации
Сводная таблица в EXCEL.
Рынок OLAP-систем
• Объем мировых продаж порядка $5 млрд.
• Основные производители:
Microsoft
Hyperion
Cognos
SAP
ORACLE
Кафедра экономической информатики ЭФ МГУ
5
Хранилище данных (Data
Warehouse).
• Билл Инмон:
" Хранилище данных — это предметноориентированное, привязанное ко времени
и неизменяемое собрание данных для
поддержки процесса принятия
управляющих решений".
Кафедра экономической информатики ЭФ МГУ
6
Хранилище данных.
Зачем строить хранилища данных — ведь они
содержат заведомо избыточную информацию, которая и
так "живет" в базах или файлах оперативных систем
(ERP, CRM…)?
1. Задача хранилища — предоставить "сырье" для
анализа в одном месте и в простой, понятной структуре.
2. Сложные аналитические запросы к оперативной
информации тормозят текущую работу компании,
надолго блокируя таблицы и захватывая ресурсы
сервера.
Кафедра экономической информатики ЭФ МГУ
7
ETL: Extracting, Transforming, Loading
Ростов
OLTP-БД1
London
OLTP-БД2
New York
данные биржи
ETL
Кафедра экономической информатики ЭФ МГУ
Хранилище
данных
8
Многомерный куб данных
•
•
Измерения (разрезы, атрибуты)







Дата
Товар или группа товаров
Супермаркет
Страна
Клиент
Договор
Менеджер
Показатели (факты, метрики)






Объем продаж
Остаток на счёте
Сумма проводки
Цена товара в чеке
Сумма дохода
Продолжительность телефонного
звонка
Основные инструменты OLAP
• Slice – формирование среза по измерению
• Rotate – изменение порядка представления
измерений
• Drill Up – переход к более
агрегированным данным
• Drill Down – переход к более
детализированным данным
Кафедра экономической информатики ЭФ МГУ
10
Базовые возможности
• Форматирование
• Итоги и агрегация
• Сортировка
• Фильтрация
• Визуальное представление
Базовые возможности - исходные данные
в формате MICROSTRATEGY
Кафедра экономической информатики ЭФ МГУ
12
Базовые возможности – сортировка по году,
региону и прибыли (profit)
Кафедра экономической информатики ЭФ МГУ
13
Базовые возможности – отбор по признаку
«недостижение прогнозного значения прибыли»
Кафедра экономической информатики ЭФ МГУ
14
Базовые возможности – итоги и
агрегация
Кафедра экономической информатики ЭФ МГУ
15
Базовые возможности – вычислимое
поле “Revenue Flag”
Кафедра экономической информатики ЭФ МГУ
16
Базовые возможности - визуализация
Кафедра экономической информатики ЭФ МГУ
17
Детализация и группировка
• Детализация (Drill-down)
Переход по иерархии вниз
• Группировка (Drill-up, Roll-up)
Переход по иерархии вверх
• Движение сквозь данные (Drill-across)
Переход в соседнюю иерархию
Детализация и группировка
Проекция и вращение
• Операция вращения куба данных (pivoting
and rotation)
• Операция проекции куба данных (slice and
dice)
Проекция и вращение
DSS на моделях: Data Mining
Data Mining - Интеллектуальный анализ данных
• Выявление закономерностей и связей







Кластеризация
Классификация
Ассоциация
Последовательность
Понижение размерности
Статистический анализ отклонений
Прогнозирование
• Визуализация результатов
Кластеризация
• Кластеризация – разбиения совокупности
объектов на однородные группы
• Характеристики кластера
Внутренняя однородность
Внешняя изолированность
Задача кластеризации
Классификация
• Классификация – отнесение объекта, к
одному из заранее известных классов
• Этапы классификации
Обучение
Процесс классификации
Задача факторного анализа (одна из
возможностей снижения размерности)
Основные принципы факторного
анализа
Прогнозирование
Прогнозирование – исследование перспектив
развития какого-либо процесса
Методы прогнозирования
• Регрессионные (моделирование)
• Методы классификации
Выводы.
• 1. Системы поддержки принятия решений (СППР) - в отличие от
трансакционных информационных систем - решают задачи анализа
функционирования и прогнозирования развития бизнеса,
относящиеся к классу неструктурированных или
полуструктурированных задач и являются АНАЛИТИЧЕСКИМИ.
• 2. OLAP – системы являются удобным и простым инструментом для
решения наиболее часто встречающихся задач оперативного анализа
данных о динамике бизнеса.
• 3. Системы класса Data Mining представляют удобную реализацию
наиболее часто используемых алгоритмов решения задач
статистического анализа: кластеризации, классификации, снижения
размерности, восстановления зависимостей и т.д..
• 4. Применение СППР направлено на повышение
конкурентоспособности бизнеса.
Кафедра экономической информатики ЭФ МГУ
29
Download