Каковы новейшие направления в сфере бизнес-интеллекта (BI)? Седьмой ежегодный отчет, составленный американской редакцией Intelligent Enterprise, посвящен основным факторам, определяющим архитектуру и способ реализации BI в сегодняшних организациях. Смогут ли дополнительные механизмы поиска, подключение семантики и управление мастер-данными изменить облик BI?

В ближайшие пять лет бизнес-аналитика в том виде, в каком мы ее знаем, исчезнет. Точнее, главное действие будет разворачиваться в другом месте. Кривая развития корпоративных систем ведет компании от чистой поддержки операционной деятельности к тому, чтобы встраивать в текущие процессы аналитические возможности. Недостаточно просто получать аналитическую информацию, на ее основе нужно действовать, и эта потребность остра как никогда. Рост зависимости каждого предприятия от внешних связей наряду со стремительным взлетом слабосвязанных вычислительных сред определяет исключительно интересное направление эволюции BI и создает необычайные возможности для BI-сообщества. Однако воспользоваться ими смогут лишь те, кому удастся приспособиться к меняющимся условиям.

В целом факторы, влияющие на будущее BI, можно подразделить на три категории:

  • новые возможности, включая поиск и управляемую навигацию, работу с мастер-данными, семантику и операционный BI;
  • технологические и архитектурные изменения, такие как сервисно-ориентированная архитектура, веб-сервисы, Ajax и интеллектуальные агенты реального времени;
  • факторы, внешние по отношению к BI-индустрии, — ПО с открытыми исходными кодами, рост кооперации бизнеса, закон Мура.
Рассмотрим их подробнее.

Новые возможности

1. Управляемый поиск и навигация. Навигацию инструменты BI обеспечивают посредством подсказок, помогающих составлять отчеты, OLAP-средств или «приборных досок» (дашбордов). Однако при этом предполагается, что пользователям известен предмет поиска и понятен смысл терминов, что они знают, откуда берутся значения данных и какими отношениями, явными и неявными, связаны все элементы. Увы, невысокий практический уровень применения BI показывает ошибочность такого предположения. Сравнительно слабые попытки информирования пользователей с помощью «метаданных» не идут дальше простейших определений элементов данных. По результатам когнитологических исследований, люди прибегают к процедуре многошаговой навигации только тогда, когда могут рассчитывать под конец найти то, что хотели. Чтобы BI-инструмент был способен привлечь и удержать интерес, необходимо предоставить пользователю возможность переориентировать данные, выбравшись из плена иерархий и таксономий, не соответствующих сфере его деятельности.

Введение в интерактивные BI-системы технологии поиска обещает улучшить эту ситуацию, что следовало бы сделать давным-давно. В перспективе нас ждет связывание структурированной аналитики с поисковыми возможностями по неструктурированному тексту. Однако реальных приложений придется еще год-два подождать. А это совсем не просто, если даже такие поставщики BI-систем, как Cognos и SAS, отвечая на интерес к полнотекстовому поиску, заключают партнерские соглашения с производителями поисковиков и систем контекстного анализа (например, с Google).

2. Управление мастер-данными (Master Data Management, MDM). Совместная работа со справочной информацией разных групп пользователей, включая как функциональные подразделения внутри компании, так и ее внешних партнеров, — идея безусловно правильная. Однако на «обладание» территорией MDM претендуют несколько областей прикладного ПО и управления данными, но развивается оно как независимое направление, отхватывая таким образом большой ку­сок у систем хранения — этой главной основы функционирования BI.

Объединение всех данных и обеспечение так называемой «единственной версии истины» — вот главное, чего обещают добиться разработчики систем хранения. Однако единственный и общий для всех набор мастер-данных слишком важен для организации, чтобы зарывать его в дебрях общего хранилища.

3. Семантика. Поскольку хранилище данных может играть лишь ограниченную роль в обеспечении возможностей MDM, обретают значимость семантические технологии. До «семантической паутины» (semantic web), в которой по замыслу Тима Бернерса-Ли станет возможен беспрепятственный обмен информацией, нам пока далеко, но технология, созданная для ее построения, выглядит многообещающе. Онтологии — это не только более богатый и гибкий способ представления определений, значений и отношений, но и возможность для компьютеров делать выводы. Утверждения, сделанные в рамках онтологии, способны образовать новый обширный ресурс «неявной» информации со своими собственными устойчивыми связями и отношениями.

Не все убеждены в перспективности онтологий. Пессимисты полагают, что логические выводы хорошо работают только там, где мы их и без того сейчас применяем, но никак не в новых областях. Семантические технологии популярны у разведчиков и военных, которые с их помощью, например, объединяют базы данных различных правоохранительных структур и органов безопасности. Тем не менее они наверняка станут значительной движущей силой для коммерческих предприятий — по крайней мере косвенно, поскольку «семантическую паутину» поддерживают Google, Yahoo и другие подобные сервисы, а значит, она постепенно проникает в любую компанию, где пользуются поиском в Интернете и интерпретируют его результаты. Таким образом, семантические технологии найдут дорогу к поиску и навигации, а со временем лягут в основу «перегруженных» систем метаданных.

Но какие проблемы могут подтолкнуть к попытке использования семантики непосредственно саму компанию? Вот, например, одна, очень интересная: большинство организаций существуют как тесно связанные группы, участники которых общаются между собой на языке, понятном внутри группы, но непонятном за ее пределами. При использовании аутсорсинга, офшора и других кооперационных процессов, в которых участвуют связи, выходящие за границы предприятия, взаимопонимание становится необходимым условием. К сожалению, отдельные группы или функциональные единицы редко соглашаются тратить время на создание исчерпывающих описаний всех элементов и сочетаний, необходимых для адекватного перевода и понимания. Они чувствуют, что это колоссальная работа, — и не ошибаются. Для создания семантических моделей более подходящим может оказаться вариант с постепенным развитием и автоматическим построением правил вывода. Современные модели позволяют организовать этот процесс без обязательного ручного кодирования в явной форме каждого правила.

4. Операционный BI. Хотя эта тема привлекает массу внимания — в том числе благодаря распространению технологий мониторинга деловой активности (business activity monitoring, BAM) и управления производительностью — сам операционный BI представляет собой классический пример так называемого «пограничного объекта», т. е. такого, который относится сразу к нескольким областям и в каждой рассматривается по-своему. В сферах классических систем хранения и BI была сделана попытка решить задачу отчетности по текущим операциям через добавление специального хранилища операционных данных (operational data store). Роль такого хранилища заключалась в интеграции «атомарных» данных, как правило, для последующей агрегации или подведения итога с использованием инструментов хранения, OLAP или BI.

К сожалению, сложности с разработкой хранилища операционных данных, которое отвечало бы требованию практически нулевой задержки, оказались по большей части непреодолимыми для существующей инфраструктуры хранилищ и наиболее популярных BI-средств. Для соединения текущих операций с аналитикой необходимо, чтобы аналитические инструменты были подняты до уровня систем поддержки операционной деятельности, а это при господствующих подходах недостижимо. Кроме того, до сих пор еще не выяснено, действительно ли хранилища операционных данных в состоянии обеспечить интегрированные данные, и таким образом является ли оно частью хранилища, связанной с остальными структурами данных в этом сооружении.

Да, большинство поставщиков баз данных в состоянии предложить близкий к реальному времени доступ к текущим данным на физическом уровне. По-видимому, дальше всех продвинулась компания Teradata, создав механизм, называемый Active Data Warehouse, в котором хранилище обеспечивает поддержку принятия операционных решений, причем производительность и частота обновления данных приближаются к показателям, наблюдаемым в транзакционных системах. Но в большинстве существующих BI-сред слабо поддерживаются запросы в реальном времени к федеративным хранилищам, объединяющим разнообразные источники операционных данных, — компонент, необходимый для поддержки бизнес-процессов в операционно-аналитических приложениях. Возможный выход — очень избирательно относиться к включаемым в рассмотрение оперативным данным и использовать для их сбора программы-агенты, в реальном времени извлекающие информацию об изменениях из очередей сообщений или системных журналов приложений.

В перспективе операционному BI, или, точнее, операционной аналитике, нужна такая же легкость и конфигурируемость, как сервисам. Выхватить кусочек исторических данных из хранилища, сопоставить его с текущей информацией для операционного процесса, может быть, динамически сгенерировать прогноз, основанный на анализе тенденций или даже на стохастической процедуре (такой, как моделирование методом Монте-Карло), получить различные варианты результата — мы должны иметь возможность делать всё это прозрачным образом и в квазиреальном времени. Конечно, для многих операционно-аналитических гибридов условия более мягкие, но спрос на аналитические сервисы повлечет разработку быстрых и компактных приложений.

Технологическая архитектура

И SOA, и веб-сервисы, и стандарты W3C, и Ajax пришли к нам благодаря взрыву в использовании Интернета. Протокол Ajax, который является критически важным элементом Web 2.0, за короткое время распространился по новым и существующим программам, обеспечив нам работу в визуальных средах с помощью одного лишь браузера. Кроме того, в Web 2.0 представляют большой интерес стандарты и инструменты коллективной работы, такие как RSS-каналы и социальные сети FOAF (Friend of a Friend) — и те и другие базируются на технологии «семантической паутины». Хорошо выполненный анализ принесет пользу только в том случае, если можно поделиться его результатами с коллегами и получить от них экспертную оценку. В роли достойного средства такого информационного обмена сейчас все чаще выступают блоги.

Наступление эры Web 2.0 ознаменовано также распространением лицензирования и дистрибуции ПО по схеме Google, с безверсионным обновлением. С другой стороны, существующая схема обновления версий BI-систем абсолютно не приспособлена к слабосвязанным динамическим средам. Сегодня даже в сравнительно простой BI-инфраструктуре менеджеру приходится модернизировать дюжину, если не больше, единиц ПО, каждую по своему графику. Это ведет к лишним простоям и непродуктивной трате усилий, не говоря уже о финансовых расходах.

Еще одной ресурсоемкой задачей BI является опрос баз данных в федеративной архитектуре. Однако в системах появляются встроенные технологии (например, необслуживаемые агенты), самостоятельно определяющие, что требуется найти и какой путь поиска самый эффективный. Агенты в состоянии автоматически выбирать правильные средства для передачи информации и результатов анализа. В прошлом при управлении программными инструментами нужно было держать в голове скудость ресурсов: никогда не было достаточно ни процессорной мощности, ни памяти, ни пропускной способности каналов. Сегодня дефицит отошел на второй план; гораздо важнее, как доказывает проблема опроса, находить и использовать информационные ресурсы.

Факторы, внешние по отношению к BI

Выходу BI на новые горизонты и к новым вариантам использования будут способствовать три внешних обстоятельства. Одно из них — движение за создание программ с открытыми исходными кодами. Однако пока неясно, сведется ли его влияние только к снижению цен на ПО или послужит началом для чего-то большего. Способно ли сообщество разработчиков скоординировать творческий потенциал своих участников и совершить подлинный прорыв в аналитических технологиях?

Два других фактора представляются более влиятельными — это продолжающийся рост кооперации бизнеса и закон Мура. Сегодня все организации, от совсем крошечных до гигантских, должны вести дела с партнерами и клиентами в электронной форме. Раньше один большой клиент, такой как торговая сеть Wal-Mart, или производитель вроде Procter & Gamble мог диктовать формат электронного обмена между предприятиями. Те, кто к ним присоединялся, вынуждены были вкладывать значительные средства в поддержку фирменных технологий — систем для мэйнфреймов, EDI (electronic data interchange, взаимообмен электронными данными) и т. п.; не присоединившиеся выталкивались с рынка.

С укреплением открытых стандартов и удешевлением технологии ценовой барьер опустится почти до нулевой отметки, и в электронной коммерции сможет участвовать практически кто угодно. Сейчас камнем преткновения в кооперации бизнеса является обеспечение эффективного обмена достоверной информацией между всеми участниками. Найти общий язык было довольно сложно даже для подразделений внутри одной компании, и это еще труднее, когда бизнес-партнеры связываются друг с другом по Интернету. А ведь информация должна корректно интерпретироваться в реальном времени.

В этом новом мире неприемлемы решения прошлого века, такие как «единственная версия истины» для хранилищ данных. Для взаимодействия в бизнес-среде глобальной кооперации ведущие организации в поисках гибких адаптируемых решений должны выйти за пределы традиционных подходов BI и хранилищ данных.

Наконец, как можно в обсуждении мегатрендов не коснуться закона Мура? Выше уже упоминалось, что BI и хранилища данных достигли зрелости в период, когда технические инновации ограничивались дефицитом ресурсов: они создавались в этих условиях, так что ограничения по производительности “зашиты” в тело BI-продуктов. Сейчас пришло время радикально пересмотреть основные методологии BI. Кеширование, виртуальные хранилища, федеративное распределение запросов, автономные агенты, доступ к базам оперативной информации в реальном времени — всё это становится сейчас более простым и должно быть встроено в новый BI. Такие действия помогут компаниям уменьшить задержки и снизить жесткость решений.

От солистов к ансамблям

Как упоминалось в начале, с погружением аналитики в системы ERP, CRM, управления человеческими ресурсами и т. п. BI уже невозможно рассматривать как отдельное направление. Разделение между аналитическими механизмами и поддержкой текущих операций, искусственное с самого начала, продемонстрировало свою неэффективность: менеджерам и другим работникам было сложно связывать результаты анализа с решением и действием, а пожирающие массу времени и денег пробелы в общем рабочем процессе оставались незакрытыми.

И встроенная аналитика, и композитные приложения, и операционный BI ведут нас к дальнейшему объединению обработки операционных и аналитических данных. Поскольку SOA все чаще выступает в качестве основы прикладных систем, поставщики станут продавать небольшие аналитические модули-сервисы, решающие конкретные задачи. Монолитные наборы BI-приложений с высокой стоимостью рабочего места утратят благосклонность заказчиков — равно как и BI, и «стеки» хранилищ данных, грубо сшитые из технологий разных поколений. Рыночное преимущество перейдет к новым, менее обширным продуктам, а из сравнительно старых в лучшем положении окажутся те, которые обеспечивают конкретные функции: визуализацию, моделирование методом Монте-Карло или другими стохастическими методами, отраслевую аналитику.

Если BI до сих пор не оправдал всех ожиданий, то только потому, что эти инструменты слишком крупны: потенциальные пользователи регулярно от них отказывались в пользу не столь грандиозных альтернатив. На мой взгляд, BI должен завоевать сердца и умы, улучшив связь с современными компонентными архитектурами. Ни управляемый поиск, ни абстрагирование от физического представления данных не привлекут достаточного внимания. Многоуровневые иерархии хранилищ данных красиво выглядят только на слайдах PowerPoint. Они не впишутся в будущее — там будут доминировать довольно плоские архитектуры, характерные для SOA. Развитые организации не станут приветствовать типичные архитектуры данных, напоминающие по виду слоеный торт, а предпочтут набор сервисов, связанных между собой органичными равноправными отношениями.