Что такое куб данных?

advertisement
Европейская экономическая комиссия
Организации Объединенных Наций
Статистический отдел
Значение баз данных в
процессе распространения
Стивен Вейл, ЕЭК ООН
Содержание




Как распространяется информация в
нынешнее время?
Достоинства и недостатки различных
подходов
Вводная о кубах данных
Зарекомендовавшие себя методы
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 2
Методы распространения



Веб-сайты статистических агентств 56
стран членов ЕЭК ООН были
осмотрены весной 2008.
Мы обратили внимание на системы и
форматы распространения данных.
Невозможно проверить версии вебсайтов на всех национальных языках.
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 3
Результаты
Инструменты Интернет
распространения
Количество
стран
%
Статичные html / pdf / word
страницы
29
51.8%
Таблицы в Excel
12
21.4%
Национальные программы баз
данных
17
30.4%
PC-Axis
12
21.4%
Statbank / PC-Axis
3
5.4%
SuperWEB
2
3.6%
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 4
Статичные html / pdf / word страницы
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 5
Статичные html / pdf / word
страницы

Преимущества
•
•
•
•

Быстро, легко и дешево в подготовке
Быстрый доступ к информации
Возможность объединять таблицы, графику и
тексты
Программы для просмотра html и pdf бесплатны
Недостатки
•
•
Только картинка – пользователи не могут легко
скачивать и обрабатывать данные
Ручное обновление
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 6
Таблицы в Excel
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 7
Таблицы в Excel

Достоинства
•
•

Пользователь может скачать и обработать
данные
Наиболее распространенный формат для
базового анализа данных
Недостатки
•
•
•
Программа Excel не из дешевых!
Ручное обновление
Пользователь должен скачивать весь файл
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 8
Выводные базы данных
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 9
Выводные базы данных

Достоинства
•
•
•
•

Интерактивность с гибкостью вывода
Удобство использования (обычно!)
Могут быть адаптированы к национальным
требованиям
Наличие некоторых универсальных систем
Недостатки
•
Могут быть достаточно дорогими для разработки и
обслуживания, в частности, если вы
разрабатываете собственную систему
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 10
Чего хотят пользователи?







Зависит от типа пользователя
Быстрый доступ к ключевым показателям
Возможности выбирать и обрабатывать данные
Возможность легкого экспорта в собственный пакет
программ для анализа
Графические визуализации (карты, схемы,..)
Соответствующие метаданные
Возможность использования нескольких языков
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 11
Что такое куб данных?
Многомерная конструкция,
содержащая информационные
точки, которые представляют
уникальные комбинации нескольких
классификаций одновременно
 Удобный вид хранения и
распространения данных

12 ноября 2009 г
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 12
Двухмерный куб
Год
Страна 2000
2001
2002
2003
AAA
123 456 124 567 125 678 126 789
BBB
987 654 988 654 989 654 999 654
CCC
35 789
12 ноября 2009 г
36 789
37 789
Стивен Вейл - Статистический отдел ЕЭК ООН
38 789
Слайд 13
Трехмерный
куб
12 ноября 2009 г
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 14
Можно ввести больше
измерений, но сложно это
отобразить!
12 ноября 2009 г
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 15
Почему кубы данных так важны




Многие статистические модели и системы
управления данными основаны на принципе
куба
Пользователи могут выбрать только
интересующие их данные
Кубы можно легко расширить, например, для
ввода значений дополнительных лет,
государств или других параметров
По крайней мере в теории, кубы могут иметь
неограниченное количество измерений
12 ноября 2009 г
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 16
Зарекомендовавшие себя
методы





Статические таблицы могут быть полезны
для ключевых показателей
Для детальных или больших баз данных,
позволять пользователям создавать и
настраивать свои собственные таблицы
Хранить информацию многомерными кубами
Предоставлять графические визуализации
Позволять пользователям скачивать
информацию в различных форматах
(включая SDMX)
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 17
Зарекомендовавшие себя
методы (2)



Связывать данные и метаданные
Делиться достижениями в
общедоступном окружении или сети, с
электронными форумами для
обсуждений и вопросов
Не пытайтесь изобрести колесо!
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 18
Спасибо за внимание
Вопросы?
07 May 2016
Стивен Вейл - Статистический отдел ЕЭК ООН
Слайд 19
Download