Контроль, обнаружение и устранение неисправностей в работе сервисов и технической инфраструктуры телекоммуникационной компании обеспечиваются, в том числе, внедрением систем мониторинга. В компании «ВымпелКом» огромная и в некотором смысле уникальная ИТ-инфраструктура, состоящая из разнородных систем различных вендоров. Об опыте внедрения систем мониторинга и о постепенной трансформации самого этого понятия в бизнесе нам рассказали Антон Саввин, руководитель департамента развития систем поддержки операций, и Борис Борисов, руководитель службы развития систем технического и сервисного мониторинга.

Intelligent Enterprise: Расскажите, пожалуйста, что вы понимаете под словом «мониторинг» и какие услуги считаете особенно приоритетными и востребованными для мониторинга?

Антон Саввин: Многие охотно употребляют слово «мониторинг», не всегда задумываясь над смыслом этого слова. А между тем его очень просто понять, обратившись к циклу качества «Plan->Do->Check->Act». Иными словами, одну четвертую своей деятельности мы посвящаем планированию, затем выполняем запланированное, проверяем результат и намечаем дальнейшее корректирующее действие. Так вот, именно проверка результата и выполнение корректирующего действия — это и есть мониторинг. Для более глубокого понимания давайте зададимся вопросами «зачем?», «как?» и «что?». Итак, по порядку.

Зачем мониторим? Вся бизнес-деятельность делится на операции и развитие. В операционной области мониторинг помогает найти отклонение от нормы и воздействие для восстановления нормального уровня качества. Здесь он является ключевой частью процессов поддержки бизнеса. В части развития мониторинг помогает проанализировать тренды и выработать эффективное изменение, улучшающее качество.

Как мониторим? Чтобы эффективно организовать процесс, для мониторинга создают отдельные подразделения. Если бизнес требует непрерывного контроля и быстрого восстановления неисправностей в работе сервисов, то необходим онлайн-мониторинг, а создаваемое подразделение (центр мониторинга) работает в режиме 24×7. Если операционная деятельность требует периодического контроля, то мониторинг строится по прин­ципу офлайн, а подразделение (аналитический центр, департамент качества и т. д.) работает в режиме 5x8. Это влечет за собой серьезные различия в требованиях к системам автоматизации мониторинга.

Что мониторим? Характер мониторинга во многом определяется способом снятия значений показателей. Если вы встраиваете в техническую инфраструктуру пробники, выполняющие в данном случае функцию термометра, то речь идет о так называемом техническом, или «ресурсном», мониторинге. Он способен покрывать практически любую интересующую область, но, к сожалению, малоинформативен с точки зрения восприятия процесса в целом. Что может сказать врач, измерив лишь температуру пациента?

В современном сложном и высокотехнологичном бизнесе все больше распространяется так называемый сервисный, или End-To-End, мониторинг. Это попытка автоматически эмулировать действия реальной системы, например транзакцию абонента. Для бизнеса это очень сильный инструмент, поскольку он дает возможность взглянуть на получаемый сервис глазами клиента компании. Однако за такую возможность приходится платить сложностью реализации и большой стоимостью регионального распространения. Успех, как всегда, в «золотой середине», в искусстве умело сочетать небольшое количество проактивных мониторинговых транзакций с большой базой данных результатов пассивных наблюдений.

Невозможно и нецелесо­образно мониторить все. «Заигравшись» в мониторинг, мы рискуем серьезно увеличить расходы на инфраструктуру бизнеса. Здесь очень важно вовремя остановиться, согласовав с бизнесом только ключевые критичные показатели и области самого мониторинга. Так, например, сервисным мониторингом в первую очередь надо покрывать все высокодоходные услуги, как стандартные услуги связи, так и широкий спектр VAS-услуг, услуги электронной и мобильной коммерции. В части же «ресурсного» мониторинга можно и нужно пытаться охватить все элементы инфраструктуры (бизнес-приложений, серверов, сетевых элементов и др.)

От элементов технической инфраструктуры зависит работоспособность клиентских сервисов. Как вы выявляете влияние элементов инфраструктуры на восприятие клиентами качества сервисов?

Антон Саввин: Дей­ствительно, без внедренного процесса управления конфигурациями построить высокоэффективную систему мониторинга очень сложно. Необходимо учитывать зависимости (связи) между физической инфраструктурой и сервисами, которые эта инфраструктура предоставляет, а что еще более сложно — между этими техническими сервисами и сервисами, которые получают клиенты, и тем, как эти клиентские сервисы реализуются уже в продуктах компании. Может сложиться впечатление, что успех знания и влияние инфраструктуры на бизнес полностью лежат в области CMDB. Казалось бы, наполняйте ее вовремя, и будет вам счастье. Однако на практике это далеко не так. Во-первых, связь двух элементов в CMDB — это далеко не всегда связь «причина — следствие». Предлагаем каждому поразмышлять на эту тему самостоятельно. Во-вторых, если вы посчитаете количество связей, требуемых к учету, то поймете, что ни один ручной процесс управления изменениями с этой задачей не справится. Советуем быть очень осторожными в попытках создать стройную ресурсно-сервисную модель.

Борис Борисов: Успех и здесь кроется в «золотой середине», в искусстве умело сочетать минимально необходимые данные инвентарного учета инфраструктуры с бизнес-правилами, которые ложатся в программный код систем мониторинга и в сочетании с данными из CMDB дают возможность выполнять поиск корневой причины аварии. Кроме того, необходимо четко разделять два понятия — сервисный каталог и реальное его отражение для конкретных установок (инстансов) в CMDB. Каталог действительно может включать сложные связи, но только лишь для понимания устройства бизнес-продуктов. Что касается реальной картины, то просто заметим: сервис должен отображаться в CMDB только в момент начала его реального предоставления клиенту. Нет клиента — нет сервиса.

Существуют ли дополнительные инструменты анализа информации, собранной в ходе мониторинга?

Борис Борисов: Да, конечно. К числу этих инструментов относятся зонтичные системы мониторинга, позволяющие свести работу с разновендорными событиями в один экран в виде списков и мнемо­схем. Именно с помощью систем такого класса обеспечиваются и быстрота обнаружения корневой причины аварии, и удобство работы сотрудников.

Как, по вашему мнению, система оценки KPI помогает взаимодействовать с бизнес-подразделениями компании, какие KPI наиболее эффективны и интересны с этой точки зрения?

Борис Борисов: В первую очередь это, безусловно, KPI, связанные с доступностью критичных бизнес-приложений. Критерий доступности — пожалуй, главный, но не единственный показатель качества. Говоря об ИТ как о сервисном подразделении, безусловно, можно выделить основной показатель — CSI (Customer Satisfaction Index). Это прямая оценка пользователей вашей работы, которую никакие технические показатели не заменят. А при формальном обсуждении очень важно договориться о количестве и порогах показателей в SLA. Это своего рода искусство.

Как вы видите развитие процесса и систем мониторинга в перспективе на пять-десять лет?

Антон Саввин: Основными тенденциями развития мониторинга, на наш взгляд, будут движения:

  • от мониторинга ресурсного к сервисному; от наблюдений к управлению;
  • от мониторинга локального к связанному; от мониторинга реактивного к проактивному.

Бизнес все больше становится сервисно ориентированным. Простота и качество оказываются решающими при завоевании клиентских сердец. Появился модный термин CEМ (Customer Experience Management). Поэтому, хотим мы этого или нет, но на бизнес нам надо уметь смотреть глазами клиента. Соответственно в сервисном мониторинге все больший и больший удельный вес начнет занимать область End-To-End мониторинга, а в «ресурсном» мониторинге детализация любой аналитики до клиента, сервиса и транзакции станет нормой.

Структуры современных предприятий все больше и больше становятся «плоскими», что влечет за собой повышенные требования к ИТ-инфраструктуре и делегирование управленческих решений сотрудникам-специалистам. В части мониторинга это должно привести к превращению подразделений-наблюдателей в центры управления, а учетных бизнес-приложений — в управляющие. Для телекома это повышение доли автоматизированного включения услуг.

В выигрыше, с одной стороны, будут те, кто сумеет быстро определять влияние событий на качество сервиса, верно приоритизировать эти события и оперативно назначать «правильных» людей для решения возникших проблем. От систем мониторинга это потребует хорошо написанных бизнес-правил, опирающихся на актуальную информацию CMDB. Но, с другой стороны, выигрывает не тот, кто быстро бежит тушить пожар, а тот, кто соблюдает правила противопожарной безопасности. При организации поддержки бизнеса компании будут все больше вкладываться в создание подразделений сервисных менеджеров с акцентом на проактивный онлайн-мониторинг трендов. Это очевидная демонстрация общеизвестных лозунгов «Лучшее лечение — это профилактика» и «Мудрый не попадает в ситуацию, из которой умный выходит с честью».