Пател Дж. 7 простых правил успешного внедрения BI

advertisement
7 ПРОСТЫХ ПРАВИЛ УСПЕШНОГО ВНЕДРЕНИЯ BI-СИСТЕМЫ РЕАЛЬНОГО
ВРЕМЕНИ
Витрины данных и BI-решения реальноãо времени óже не являются новинêой или росêошью.
Пройдя стадию первоначальноãо развития, таêие решения становятся наиболее
эффеêтивным в данный момент средством передачи информации, иãрающей êлючевóю роль
в поддержании êонêóрентоспособности в основных видах деятельности орãанизаций. Имея в
своем арсенале целый набор инстрóментальных средств, значительно распространившихся
за последние несêольêо лет и предлаãающих все от «êоробочных» решений до
нестандартных методов анализа данных, работа с BI-системой в режиме реальноãо времени
стала обыденным делом. Не смотря на это, реальное положение дел зачастóю отличается от
тоãо, êоторое мы можем себе представить.
Итаê, с êаêими сложностями вы можете столêнóться, выбирая BI-системó реальноãо времени
для своей орãанизации? Самые очевидные из них:
ƒ
Способность предоставлять пользователю аналитичесêие данные с высоêой
сêоростью во время обновления данных в витрине;
ƒ
Эêономичесêое обоснование применения BI-системы реальноãо времени;
ƒ
Влияние одной или более OLTP-систем (источниêов данных) на
производительность;
ƒ
Развитый ETL-инстрóментарий (выãрóзêа, преобразование и заãрóзêа).
Эти задачи лишь малая часть общей êартины. В процессе внедрения методов работы с
бизнес проеêтом в режиме реальноãо времени мы понимаем, что самой большой
сложностью встает не просто вопрос средств и технолоãий. Итаê, что это за сложности и,
соответственно, êаêим правилам нóжно следовать?
Следóет четêо определить понятие «режим реальноãо времени»
BI-систем реальноãо времени в чистом виде не сóществóет. Парадоêсально, но понятие «BIсистема реальноãо времени» таêже не является просто реêламной «óтêой». Определение
«реальноãо масштаба времени» зависит от насóщных информационных нóжд êонêретной
орãанизации. Для одних орãанизаций время отêлиêа в режиме реальноãо времени может
означать в течение минóты, в то время êаê рабочие ситóации в дрóãих орãанизациях моãóт
потребовать мãновенной реаêции оãраниченной несêольêими миллисеêóндами. В любом
слóчае, не забывайте óчитывать время на внесение изменений в исходной системе, на
процесс извлечения, преобразования и заãрóзêи данных, êэширование часто выполняемых
запросов. Каждый из этих шаãов óвеличивает общее время отêлиêа. Учитывая время,
затрачиваемое на интеãрирование данных и вывод возможноãо решения, данный режим
бóдет точнее назвать «приближенным ê реальномó масштабó». Однаêо большинство таêих
BI-систем работают в óсловиях моментальноãо принятия решения или с задержêой до
несêольêих минóт. Из праêтичесêих соображений не бóдет большой ошибêой назвать это
«реальным масштабом времени».
Самая сложная задача состоит в том, чтобы êоординировать ожидания êоллеêтива
пользователей, с первых стóпеней внедрения. Необходимо óдостовериться, что все
находятся на одинаêовом óровне понимания «реальноãо масштаба времени».
Необходимо различать понятия «предполаãаемо реальный масштаб
времени», «почти реальный масштаб времени» и «совсем не реальный
масштаб времени»
Сложно избежать недоразóмений в понимании тоãо, что êаждый элемент данных в витрине
данных, работающей в режиме реальноãо времени, должен обновляться в реальном
времени. Не êаждый элемент задачи требóет немедленноãо решения, несмотря на то, что
большая часть информации обрабатывается методами BI-системы в «истинно» реальном
времени. Вы можете, даже должны разделять ãлавные объеêты и элементы информации,
êоторые должны быть достóпны в реальном времени от тех, êоторые моãóт быть обновлены с
периодичностью в день, неделю, или месяц.
Рассмотрим ежемесячный анализ продаж теêóщеãо ãода. Механизм сбора информации,
отражающий фаêт продаж в витрине данных реальноãо времени, должен производить это
действие, êаê тольêо исходное приложение сообщит о данных изменениях. Однаêо, êаê
насчет частоты обновления данных о сотрóдниêах, осóществивших продажи?
Предположим, эти данные можно полóчить из системы óчета сотрóдниêов, в êоторóю время
от времени вносятся изменения, и эти данные не являются решающими для анализа продаж.
В таêом слóчае имеет смысл разделить данные о сотрóдниêах на две составляющие.
Отобрать из системы óчета сотрóдниêов основополаãающóю информацию (например,
идентифиêатор и êлюч) из всей совоêóпности данных от второстепенной таêой êаê отчество и
расположение офиса. Таêой способ орãанизации соêратит время процесса извлечения,
преобразования и заãрóзêи данных. Таê же, если вам требóются неêоторые отдельные фаêты
для ежемесячных отчетов, создавайте таêóю выборêó тольêо раз в месяц.
Нельзя выиãрать êросс с 50-ти фóнтовым мешêом за спиной! Следóет разработать менее
детальный набор данных для интеãрирования в реальном времени. Ключевым моментом
создания óспешных методов работы в витрине данных в режиме реальноãо времени является
четêое разãраничение междó частотой обновлений и выбором информации, êоторая должна
работать в реальном времени и êоторая может подождать. Эти требования необходимо
применить на ранних стадиях анализа и стадиях высоêоóровневой разработêи.
Не стройте мост на реêе, ãде есть переправа.
Фаêтичесêи, самый простой способ полóчить данные из любоãо исходноãо приложения в
режиме реальноãо времени считывать их с исходной системы в реальном времени. Однаêо
не êаждый администратор и разработчиê приложения оперативной обработêи транзаêций
моãóт это допóстить! Соответственно, выбор допóстимых изменений исходноãо приложения
оãраничен.
Большинство средств интеãрации данных в реальном времени имеют механизм êопирования
данных несоединенный с механизмом ãрóпповой интеãрации. Эти механизмы зачастóю идóт
по отдельной цене. Механизм êопирования данных в реальном времени транслирóет
протоêол базы данных, выполняя тем самым ее фóнêции. Эти средства облеãчают работó
êоманды разработчиêов, а механизмы тиражирования, предложенные поставщиêами баз
данных, моãóт оêазаться более простым и выãодным решением.
Альтернатива сборó данных в реальном времени может быть разработана на основе
триããеров базы данных. Если эта опция не снижает производительность и не óвеличивает
стоимость обслóживания, то это лóчший вариант, чем приобретение отдельноãо набора
средств, таê êаê и стоимость бóдет меньше и техничесêое обслóживание бóдет проще. Таêие
триããеры моãóт пересылать введенные изменения в исходной системе на отдельные óчастêи,
отêóда их бóдет считывать интеãрационная шина в реальном времени без óщерба
производительности исходной системы.
Наиболее вероятно, что объем и циêл обновления данных, êоторые необходимо собрать из
различных систем, под силó таêим стандартным методам процесса – ETL (извлечения,
преобразования и заãрóзêи данных) êаê триããерам, реплиêаторам, и неêоторым дрóãим
механизмам. Если происходит задержêа на несêольêо минóт в одном из альтернативных
механизмов, она не влияет на средства êопирования, работающих в реальном времени.
Эêономия несêольêих сеêóнд при полóчении информации может в итоãе не оправдать
стоимость и трóдоемêость внедрения специальных средств êопирования данных.
Таê что не стройте мост на реêе, ãде есть переправа.
Картинêа стоит тысячи слов (особенно при обновлении в реальном
времени)
Ключевым моментом методов работы с BI-системой в режиме реальноãо времени является
доставêа информации в реальном времени. Таê что нет ничеãо лóчше ãрафичесêоãо
изображения. Вследствие возросшеãо осознания важности визóализации данных для работы
с бизнес проеêтом, аналитичесêая инстрóментальная панель(Dashboard) теперь просто
необходима. В то время êаê цифровая и статистичесêая информация остается
основополаãающим способом представления данных, инстрóментальная панель является
идеальным средством расширения общеãо восприятия или определенной фóнêциональной
области. Коãда данные о продажах изменяются почти мãновенно, их ãораздо проще
интерпретировать при помощи визóальной инстрóментальной панели, нежели просто
статистиêи. Для большей точности, пользователям предоставлены «подсêазêи» на
инстрóментальной панели для полóчения детальной информации.
Расположите информацию правильно
Первые шаãи в разработêе BI-системы работающей в режиме реальноãо времени, êаê
правило, делаются в направлении доставêи нóжной информации в нóжное время. Это в
точности определяет важность своевременности и êорреêтности информации. Однаêо êóда
этó своевременнóю и нóжнóю информацию отсылать?
Несмотря на то, что методы работы с BI-системой в реальном времени позволяют
отправлять последние данные в виде традиционных отчетов или инстрóментальных панелей,
этоãо может быть не достаточно. Для вице-президента ãоловноãо отдела продаж, êоторый по
пóти ê своим основным êлиентам óспевает тольêо войти в системó своеãо портативноãо
êомпьютера, информация может быть недостóпна. Для таêих пользователей данная работа
не происходит в реальном масштабе времени в прямом смысле, если тольêо информация не
постóпает тóда, ãде она достóпна.
Использóя последние техничесêие разработêи доставить нóжнóю информацию в нóжное
место и время все леãче. Помимо традиционноãо êомпьютера BI-системы моãóт доставлять
отчеты или предóпреждения на КПК или дрóãие подобные средства. Прошли те времена,
êоãда «информация на êончиêах пальцев» была пределом человечесêоãо воображения,
реалия новой жизни – «информация перед ãлазами».
Ввидó быстроãо распространения технолоãии, исêóсство состоит в определении êритичесêих
ситóаций и предоставлении êратêих предóпреждений или выборочной информации,
основанной на различных информационных запросах пользователя. Нóжно особое
внимание в процессе рассмотрения требований пользователей на различных óровнях
орãанизации. Таê можно персонализировать и обеспечить требования безопасности,
óчитывая роль и обязанности êонêретноãо пользователя в данной орãанизации.
Возможно ли óãодить всем и всеãда?
Поисê ценной информации (Data Mining) и анализ(ad-hoc), óдовлетворяющий определенной
êонêретной ситóации, являются êлючевыми хараêтеристиêами традиционноãо хранилища
данных. В то же время, оба этих типа анализа влияют на производительность базы данных.
Это является основной сложностью фóнêционирования систем в режиме реальноãо времени,
таê êаê они выполняют обновление данных нарядó с доставêой отчетов в реальном времени.
Если пользователь обратится ê базе данных со слóчайным запросом, использóющим все
измерения таблиц данных за последние 5 лет, в то время êаê идет обновление данных,
производительность базы данных óпадет до êритичесêоãо минимóма. Помните, что
оãраничения на Data Mining и ad-hoc анализ следóет óстановить на этапе составления
требований пользователей.
Если обратиться ê предметной области Data Mining и ad-hoc анализа то станет очевидно,
что они не нóждаются в использовании самых последних сведений. Если пользователи
заинтересованы в изóчении тенденций ближайших пяти лет, поисêе взаимодействий междó
двóмя дисêретными поêазателями или даже в исследовании определенноãо элемента данных,
они моãóт использовать информацию дневной или даже месячной давности. Праêтичней
разделить области, ãде требóется работа в режиме реальноãо времени и ãде достаточно
витрины данных с периодичесêим обновлением. Без этоãо разделения вы бóдете пытаться
óãодить всем все время!
Что преобладает при работе в режиме реальноãо времени:
оперативные или аналитичесêие сведения?
Самый большой миф BI-решений то, что они должны ãотовить аналитичесêие отчеты, в то
время êаê основные бизнес приложения доставляют оперативные сведения. В
действительности же, типичные методы работы с BI-системой должны óдовлетворять и тем и
дрóãим нóждам. BI-система в реальном масштабе времени не является исêлючением.
Dashboards и предóпреждения рассчитаны не тольêо на рóêоводство высшеãо звена. Для
большинства орãанизаций типично, êоãда превалирóющая часть аналитичесêих отчетов и
исследований выполняется рóêоводителями техничесêих отделов среднеãо звена. В то же
время они отвечают за êонтроль над работой своих подразделений в реальном времени.
Малейшее отêлонение от плана может решающим образом повлиять на итоã. Управляющие
среднеãо звена являются самыми аêтивными пользователями аналитичесêой и оперативной
отчетности.
Нарядó с вносимыми в режиме реальноãо времени изменениями в BI-системó, пользователи
имеют достóп ê самым последним оперативным сведениям. Это является преимóществом по
сравнению с традиционными методами работы с BI-системами, ãде пользователям
приходится ждать день, а то и больше, чтоб полóчит аналоãичнóю информацию,
содержащóюся в исходном приложении. Тщательное рассмотрение требований ê
оперативной отчетности на этапе составления списêа требований является êлючом ê
полóчению наибольших дивидендов с вложений в BI-системó, работающóю в режиме
реальноãо времени.
Несмотря на все вышесêазанное, êоманда разработчиêов часто фоêóсирóет свое внимание
тольêо на инстрóментах и технолоãиях. Неêоторые из вышеперечисленных тем оêазываются
за чертой пристальноãо изóчения на этапах составления требований и разработêи. В
следóющий раз, êоãда вашей орãанизации потребóется BI-система, работающая в режиме
реальноãо времени, примите ê сведению вышеóêазанные 7 правил.
Download