Предприятия, умеющие извлекать прибыль из оптимальных бизнес-процессов, все больше полагаются на ИТ и все более зависимы от доступности и производительности приложений. Своевременно устранить, а тем более предотвратить инциденты, связанные с производительностью приложений, становится все сложнее, так как усложняются сами архитектуры приложений и инфраструктуры. Для полноценного мониторинга бизнес-систем необходимо использовать инструменты, позволяющие, с одной стороны, измерять и оценивать эффективность бизнес-транзакций, а с другой – связывать шаги этих транзакций с набором предоставляемых сервисов и состоянием всех компонентов инфраструктуры, участвующих в предоставлении ИТ-сервиса.

BSM для BPM

Реализуя подход BPM к своему бизнесу, компании выходят на уровень зрелости, когда бизнес и ИТ начинают лучше понимать друг друга.

Для формирования этого понимания важную роль играет термин «бизнес–сервис» (Business Service): цепь деловых операций (транзакций), выполнение которых опирается на ИТ-приложения, функционирующие благодаря ИТ-инфраструктуре.

Как и «ИТ-сервис» в ITSM, понятие «бизнес-сервис» – абстракция, позволяющая формализовать и количественно оценить влияние ИТ на бизнес, дать сотрудниками ИТ видение ценности для бизнеса каждой транзакции в каждый момент времени, что позволяет наилучшим образом распределить приоритеты деятельности ИТ как в оперативной, так и в стратегической перспективе.

Business Service Management (BSM) – концепция, описывающая подход к мониторингу бизнес-сервисов, позволяющий связать конкретные элементы или шаги транзакций с подлежащими ИТ-сервисами и инфраструктурой.

В традиционном понимании, отраженном в ITIL, считается, что ИТ предоставляют бизнесу ряд услуг в виде инфраструктуры, приложений и транспортов между ними, на которые опираются шаги бизнес-процесса. ИТ технически контролируют качество предоставляемой услуги по оговоренным параметрам и полностью уверены, что услуга предоставляется нормально. Если цепочка бизнес-процесса опирается на ряд работающих услуг, то бизнес-процесс функционирует. А его «наполнение» – дело бизнеса. Однако в ряде случаев мониторинга всего набора параметров работы ИТ-систем, предоставляющих ИТ-сервис, недостаточно для уверенности, что бизнес-процесс выполняется в нормальных рамках. Например, Web-портал доступен, сервисы активны, система обработки заказов работает, но с портала заказы не поступают. Это проблема бизнеса или ИТ? И как убедиться, что сам по себе бизнес-процесс доступен?

Особенно это важно в цепочках «машина–машина» без участия человека и на границах зон ответственности (между разными компаниями и т. п.). Нередки случаи, когда две системы, по всем параметрам и внешним признакам нормально работающие и имеющие друг с другом полностью функционирующий канал, перестают обмениваться сообщениями, что «лечится» только перезагрузкой. Безусловно, у этого должна быть корневая причина, но за время ее диагностики такое «зависание» может повториться еще не раз. Для компаний, чьи бизнес-транзакции опираются на ИТ, наличие и бизнес-наполнение транзакций должны являться основной метрикой для мониторинга предоставляемых сервисов со стороны ИТ. Например, такое-то количество денег должно проходить минимально через такую-то точку за 1 час. Меньшее количество должно генерировать сигнал для проверки работоспособности цепочки.

Концепция BSM предполагает взаимно увязать бизнес-параметры работы процессов организации и качество предоставляемых ИТ-услуг. Мировые лидеры рынка и многие компании, предлагающие свои продукты в области оптимизации ИТ-услуг, с усердием продвигают данную концепцию. Однако видение и набор решений в этой области у таких компаний, как BMC, IBM, HP пока весьма отличаются. Очевидно, что решения лидеров базируются на наборе существующих продуктов, и основные отличия заключаются в подходах и глубине их интеграции в единое решение.

В общем можно выделить такой набор компонентов.

  • Системы «раннего предупреждения»: пассивный мониторинг параметров транзакций на выделенных рабочих местах и активные генераторы транзакций:
    • генерация синтетических транзакций, эмулирующих работу пользователей. Постоянный контроль доступности всей цепочки того или иного бизнес-процесса, независимо от того, происходят ли в ней реальные бизнес-транзакции или нет, позволяет контролировать и оценивать во времени общую доступность бизнес-процесса и отдельных его шагов. Системы такого класса позволяют и бизнесу и ИТ быть уверенными, что бизнес-процесс функционирует в целом, и в случае сбоя начать устранять его последствия до того, как он существенно повлияет на бизнес. Такие системы, кроме того, позволяют сравнить параметры отклика систем в разные моменты времени: в пиковые часы и в выходные, а также накопить статистику доступности процесса на протяжении долгого времени для оценки нормальных параметров. Сложная сторона применения данной технологии – необходимость писать сценарии для «виртуального пользователя» и регулярно их корректировать при изменении бизнес-процесса. Хорошей практикой могло бы стать использование сценариев тестирования для последующего мониторинга (после их небольшой модификации). Это позволит резко сократить трудоемкость и повысить надежность такого способа мониторинга;
    • агенты, контролирующие отклик систем на рабочем месте выделенных пользователей. Real User Monitoring. Мониторинг составляющих конкретной транзакции выделенного «типового» пользователя позволяет в случае возникновения претензий к производительности системы, ее отклику быстро локализовать проблему за счет наличия подробной технической информации по каждому действию пользователя. Системы такого класса позволяют точно «отлавливать» провалы в производительности и использовать эту информацию для анализа проблем. Многие производители ПО с технологией «клиент–сервер» частично встраивают такие функции в клиентскую часть.
  • Процессы ITSM: инциденты, проблемы, знания:
    • связанное управление инцидентами, проблемами и знаниями в целях быстрого обнаружения решений аналогичных проблем. Традиционно важнейшим элементом предоставления качественных ИТ-услуг является организация службы Service Desk в ИТ, регистрация всех обращений в привязке к услугам, выстраивание и автоматизация процессов управления инцидентами, проблемами, изменениями, знаниями. О ценности подхода ITSM и службы Service Desk сказано много. Регистрация инцидентов, проблем и процедур их устранения позволяет быстро находить решения «похожих» неисправностей, произошедших в прошлом. Системы мониторинга транзакций и ИТ-инфраструткры должны быть настроены таким образом, чтобы информация о возникновении любых инцидентов в первую очередь генерировалась автоматически, а не по факту обращения пользователя. В случае своевременной реакции ИТ и быстрого устранения инцидента пользователь вообще не должен почувствовать провала в предоставлении услуги.
  • Инструменты корреляции и мапинга транзакций с конкретными сервисами и инфраструктурой на основе сервисно-ресурсной модели:
    • Transaction Mapping, Service Discovery. По мере усложнения архитектуры приложений и компонентов инфраструктуры становится все сложнее поддерживать в актуальном состоянии сервисно-ресурсную модель, на основании которой происходит привязка тех или иных компонентов инфраструктуры к предоставляемым услугам и поддерживаемым бизнес-процессам. Для первоначального обнаружения и поддержания в актуальном состоянии сревисно-ресурсной модели требуется применять автоматизированные инструменты анализа архитектуры приложений, организации транзакций, инвентаризации взаимосвязей в инфраструктуре. Четкая актуальная модель связи ресурсов и сервисов позволяет автоматически локализовать инциденты и максимально быстро подключать к устранению функциональных специалистов. Привязка инцидентов к конкретному набору бизнес-транзакций позволяет приоритизировать работу ИТ по их устранению не только в порядке критичности услуг, но и в порядке бизнес-ценности той или иной транзакции для бизнеса в данный момент. Кроме того, точная модель позволяет в автоматизированном режиме анализировать влияние тех или иных компонентов инфраструктуры на бизнес при принятии решений о внесении изменений;
    • CMDB (Configuration Management Data Base) – база данных конфигурационных единиц (КЕ). Хранилище информации об элементах инфраструктуры, их взаимосвязях, услугах и т. п.
  • Инструменты мониторинга инфраструктуры и сбора данных о производительности и событиях в привязке к конкретным транзакциям (без реализации традиционной для ИТ-мониторинга функции автоматизированного мониторинга состояния ИТ-инфраструктуры, сбора и накопления данных о производительности невозможно эффективно контролировать состояние предоставляемых ИТ-услуг и предупреждать негативное развитие событий):
    • мониторинг серверов, систем, виртуальных сред позволяет в любой момент быть уверенным, что все системы, на которые опирается тот или иной сервис, доступны и функционируют с достаточным качеством (производительностью). События, влияющие на предоставление услуги, сразу же могут инициировать действия администраторов или автоматизированных систем по нормализации ситуации, что позволит во множестве случаев избежать возникновения инцидентов по вине инфраструктуры;
    • сбор исторических данных по производительности, событий в привязке к сервисам и транзакциям. Анализ данных производительности систем на протяжении времени эксплуатации позволяет анализировать отклонения количественных параметров от их нормальных значений и уделять особое внимание системам с такими отклонениями при повседневном мониторинге;
    • накопление информационной среды для анализа произошедших событий и поиска первопричин инцидентов. Основная проблема в поиске корневых причин произошедших инцидентов – невозможность их воспроизвести. Наличие информации о событиях и состоянии систем и связей перед инцидентом и во время инцидента может помочь быстро обнаружить корневую причину.
  • Инструменты формирования отчетности и «погружения» в данные. Возможность получить общую абстрактную «картинку» состояния качества работы бизнес-транзакций и ИТ-услуг и при необходимости «погрузиться» в более глубокие слои данных в отношении «подозрительных» приложений или систем крайне необходима для повседневной эксплуатации бизнес-критичных сервисов и при анализе произошедших неисправностей.

Независимо от того, «откуда» предоставляется ИТ-услуга – собственно ИТ, из частного или публичного облака, из аутсорсинга, – теперь всегда необходимо, чтобы приоритеты для провайдера устанавливались исходя из бизнес-влияния, которое возможно только при связанном взаимодействии компонентов решения BSM. Лишь в этом случае можно быть уверенным, что приоритеты в развитии и поддержке бизнес-сервисов будут совпадать у ИТ и бизнес-подразделений.

BSM – это не продукт и не система. Скорее, это путь

Каждая организация может иметь свои приоритеты и свои «узкие места» в ИТ-инфраструктуре, приложениях, бизнес-процессах. Те или иные компоненты BSM могут оказаться наиболее полезными в конкретный период времени. Вместе с ростом степени зрелости организации в отношении процессов, технологий все большее значение приобретает связанное и объединенное общими целями и стратегией управление бизнес-операциями и ИТ-операциями. Это требует от ИТ и бизнеса прозрачного понимания влияния каждого элемента ИТ на бизнес организации в определенные моменты. Движение к такой прозрачности со стороны ИТ становится возможным по мере внедрения и интеграции в единое решение компонентов Business Service Management.

Ссылки на документы:

Wikipedia: http://en.wikipedia.org/wiki/Business_service_management
Market Overview: Application Performance Management, Q4 2011, Forrester Recearch