Открытые Технологии Существует ряд специфических проблем, возникающих только потому, что контроль параметров функционирования ИТ-инфраструктуры предприятий выполняется неэффективно. Для бизнеса в целом — это довольно крупные прямые и косвенные финансовые потери, связанные с простоями или некорректной работой ИТ-сервисов. Для бизнес-пользователей — это недоступность критичных бизнес-приложений и вынужденная потеря времени при выяснении причин возникновения проблем.

Проблемы возникают и у самих ИТ-служб, которые не располагают средствами мониторинга работы ИТ-систем. Они вынуждены получать первичную информацию об инцидентах от неподготовленных пользователей, тратят избыточные усилия на диагностику повседневных ситуаций и при этом лишены возможности оперативно реагировать на аварии. Так как они не обладают результатами систематических наблюдений состояния информационных систем, им сложно обосновать необходимость модернизации и оценить положительный эффект от ее проведения. В результате ИТ-службы, лишенные средств контроля ИТ-инфраструктур, не могут обеспечить требуемую эффективность поддержки бизнес-процессов.

Современные компании пытаются использовать средства мониторинга. Однако по статистике очень большое количество внедрений систем мониторинга на предприятиях фактически заканчиваются провалом — точнее, их либо ликвидируют «за ненадобностью», либо просто прекращают использовать. А все дело в том, что поддерживать систему мониторинга в актуальном состоянии — это отдельная, непрерывная и непростая задача, с которой не в состоянии справиться многие ИТ-службы.

Осознав эту проблему, специалисты компании Открытые Технологии разработали и предложили заказчикам SaaS-службу мониторинга ИТ-инфраструктуры предприятия. Чтобы работать с ней, клиент должен всего лишь установить у себя не слишком требовательный к вычислительным ресурсам прокси-сервер (шлюз), который будет собирать техническую информацию о работе ИТ-систем компании и пересылать ее по безопасным каналам на наш постоянно доступный сервер системы мониторинга. Прокси-сервер развертывается очень быстро, снимая с плеч заказчика долгий процесс, связанный с закупкой, логистикой, выделением денег под аппаратное обеспечение. С нашего постоянно доступного сервера заказчик сможет 24 часа в сутки получать полную информацию о том, что происходит с его ИТ-инфраструктурой и сервисами.

Услуга мониторинга ИТ-инфраструктуры и приложений: архитектурное решение

Система мониторинга реализована на базе программного обеспечения с открытым кодом. Абсолютно все, что используется в предлагаемом решении — либо ПО с открытым кодом, либо собственные разработки компании Открытые Технологии.

Изначально программный продукт, служивший ядром разработки, обеспечивал бесперебойный мониторинг до 300–400 серверов, но для дальнейшего масштабирования был существенно модифицирован с помощью добавления в него дополнительных модулей.

Теперь решение выполняет не только инфраструктурный мониторинг -, который и так реализован в системном ПО практически любого производителя (т.е. мониторинг систем хранения данных, серверов, сетевых устройств, операционных систем и прочих инфраструктурных компонент), но еще и функциональный.

Инфраструктурный мониторинг
Инфраструктурный мониторинг

При функциональном мониторинге воспроизводятся либо действия пользователя, либо действия различного системного и прикладного ПО, осуществляются определенные операции и анализируются их результаты в соответствии с заранее выставленными пороговыми значениями. В результате заказчик получает фактическую оценку и отображение того, что происходит с ИТ-сервисом с точки зрения конечного пользователя в режиме реального времени.

Наконец, на основе ГОСТ разработан и реализован расчет интегрального показателя качества работы системы в целом. Это очень удобно, в том числе для руководителей службы эксплуатации — открыв соответствующую страницу, они сразу могут видеть, насколько качественно работает ИТ-система любого масштаба — сервис, портал, прикладной сервер, сервер ERP-системы и т.п.

Предлагаемая интегратором российским компаниям комплексная услуга мониторинга включает в себя систему веб-доступа к информации мониторинга, агенты и скрипты для сбора информации, возможность круглосуточного оповещения служб эксплуатации о событиях, мониторинг вычислительного и каналообразующего оборудования дата-центров, мониторинг программного обеспечения, возможность построения карты взаимосвязей инфраструктуры и сервисов, контроль соответствия внутренних SLA и возможность получения регулярной отчетности.

Функциональный мониторинг
Функциональный мониторинг

Использование данной разработки уже доказало свою эффективность. С помощью решения в течение года ИТ-департамент Правительства Москвы вел мониторинг электронных сервисов городских услуг, более 50 информационных систем и сотен объектов московского правительства. В среднем для каждой информационной системы было написано около 10–12 сценариев, которые выполнялись через определенный промежуток времени, в разных системах по-разному — на одних системах раз в три минуты, на других — раз в минуту и т.п. Таким образом, в любой момент времени заказчик мог получить полную информацию о том, как работают его сервисы, и видел интегрированный результат качества работы информационных систем. В случае возникновения инцидентов, связанных с перегруженностью системы или проблем с доступностью электронных сервисов, он получал сообщения об инциденте по электронной почте, смс, системам мгновенной интернет-связи или по телефону. Важно отметить, что система самостоятельно идентифицировала источник проблемы, и оповещение получала соответствующая служба — эксплуатации или разработки.

Опыт был признан положительным на всех уровнях, включая уровень руководителей департаментов города Москвы. И это вполне закономерно, ведь преимущества подобной системы мониторинга трудно переоценить — это и значительная экономия денег и времени (не нужно оплачивать лицензии и их поддержку, нет необходимости в дорогостоящем персонале экспертного уровня, отсутствует плата за ИТ-инфраструктуру под мониторинг, обеспечиваются сжатые сроки внедрения (от двух недель до двух месяцев), и объективность (система не может скрывать инциденты, не предъявляет ограничений на мониторинг, обеспечивает мониторинг функциональности, регулярную отчетность и информационную панель для руководителя и инженера), и эффективность (неограниченное масштабирование территория охвата сервиса, быстрый результат при минимуме затрат и возможность отказаться от услуги или ее части).

Пример интерфейса для руководителя ИТ
Пример интерфейса для руководителя ИТ

Как при помощи системы мониторинга решается проблема пиковых нагрузок на ИС?

Пиковые нагрузки бывают плановые — которые легко прогнозируемы и связаны, как правило, с определенной периодичностью бизнес-процессов, например, с завершением отчетного периода в конце каждой недели, месяца или квартала — и внеплановые, которые прогнозу не поддаются. При внеплановой нагрузке график текущего состояния ИС существенно отклоняется от базовой линии, и именно инструменты мониторинга способны определять такие внештатные ситуации и соответствующе реагировать на их возникновение — принимать меры, выполнять оповещение ответственного персонала. Что касается плановых нагрузок, то система мониторинга позволяет сконфигурировать пороговые значения для корректной обработки поведения ИС при возникновении плановой нагрузки.

Вот один из примеров возникновения плановой нагрузки — начало проведения массовых социальных кампаний, например, запись в детские сады через веб-портал городских услуг. При наступлении объявленной даты родители начинают записывать своих детей в детские сады, нагрузка на всю информационную систему резко возрастает, но с помощью системы мониторинга можно оперативно отследить узкие места в функционировании ИС, что позволяет принять срочные меры по наращиванию мощностей до того, как ИС перестала бы обслуживать граждан.

Часто причиной плановой нагрузки ИС становятся регулярные операции: в конце месяца, квартала, года, когда ИС обрабатывает большие объемы данных, например, аналитические отчеты. Для таких операций в эксплуатационной документации ИС выделены временные окна, в которые ИС, при штатной работе, должна завершить вычислительные операции. Предлагаемая система мониторинга позволяет сконфигурировать корректную обработку таких плановых нагрузок, а также уведомлять обслуживающий персонал, если ИС вдруг не выполнила вычислительные операции за отведенное ей время.

Пример интерфейса для руководителя службы эксплуатации
Пример интерфейса для руководителя службы эксплуатации

Можно ли предупредить крах информационной системы?

Крахи информационной системы предупреждать можно и нужно — именно так устроен проактивный подход к сопровождению систем, когда техническая служба занимается не обработкой уже возникших инцидентов, а работает над недопущением их возникновения.

Для этого необходимо заблаговременно отслеживать закономерности работы информационной системы, существующие тенденции увеличения показателей нагрузки, и задать системе мониторинга пороговые значения интенсивности загрузки ИС, при которых она должна срабатывать. Ведь когда наступит 100%-ная загрузка, будет поздно, и система не сможет обрабатывать пользовательские запросы. Следует настроить несколько уровней пороговых значений: низкий уровень, средний, высокий — это поможет заблаговременно принимать адекватные меры при малейших изменениях в поведении информационных систем.

Пример интерфейса для руководства
Пример интерфейса для руководства

Можно ли изменять и исправлять процессы ИС в реальном масштабе времени?

Представьте, что какие-то серверы вашей ИС часто бывают перегружены, периодически прекращает работу сетевое приложение или очень медленно открывается портал. Система мониторинга позволяет увидеть общее состояние параметров мониторинга сетевых интерфейсов, процессоров, оперативной памяти, жестких дисков и т.д. и сделать вывод о том, какая подсистема испытывает перегрузки. Эта информация помогает понять, в настройки какой именно подсистемы необходимо внести изменения, какому серверу нужно добавить процессоров, оперативной или дисковой памяти. Если проблема идентифицирована правильно, сайт станет открываться быстрее, производительность ИС увеличится, а значения параметров мониторинга, которые превышали допустимые значения, придут в норму.

Один из случаев — заметив, что приложение, работающее на базе Oracle, сильно замедлило свою работу, было изучено состояние параметров мониторинга и обнаружены большие объемы ввода-вывода на сервере баз данных Oracle. Причина была в том, что СУБД Oracle не хватало оперативной памяти, и оно интенсивно работало с жестким диском, что, разумеется, и сказалось на ее производительности. Службе эксплуатации было рекомендовано добавить оперативную память, и, когда они это сделали, проблема устранилась.

Чем обеспечивается объективность внешнего и аутсорсингового мониторинга?

К сожалению, внутренний мониторинг часто бывает необъективным — внутренним ИТ-специалистам заказчика может не хватать квалификации, или, что гораздо хуже, используя результаты мониторинга, внутренняя ИТ-служба может попытаться достичь неких дополнительных целей — например, скрыть от руководства имевшиеся инциденты, чтобы повысить показатели эффективности собственной деятельности, добиться закупки нового оборудования, когда вполне можно оптимизировать использование текущей инфраструктуры, и т.п.

Оператор, который выполняет внешний мониторинг, не имеет побудительных мотивов для сокрытия реальной картины событий, происходящих с ИС заказчика — в этом смысле он объективен, поэтому, когда возникают проблемы, служба внешнего мониторинга корректно идентифицирует источник их возникновения и оповещает всех ответственных лиц.

Выполняемый компанией Открытые Технологии аутсорсинг мониторинга в соответствии с моделью SaaS — это оптимальный вариант, существенно более удачный, чем развертывание собственных систем мониторинга заказчиком, связанное с закупкой лицензий, их поддержкой и сопровождением самой системы мониторинга.

Учтены ли требования импортозамещения?

Практически каждый крупный западный производитель имеет у себя в линейке продуктов собственную систему мониторинга. Это развитые, многофункциональные и, разумеется, дорогие системы. Однако, в текущей политической и экономической ситуации прежде всего востребованы недорогие решения, которые не являются продуктами западных производителей.Решение компании Открытые Технологии создано на базе программного обеспечения с открытым исходным кодом и на базе собственных разработок. В нем не используется ни одного проприетарного продукта. Исходные коды программных продуктов системы мониторинга открыты, с ними можно ознакомиться и убедиться в том, что решение не имеет никаких «недокументированных» закладок. Таким образом, продукт «Открытых Технологий» на 100% соответствует понятию «импортозамещение».

Обоснован ли финансово мониторинг ИС?

Изначально мониторинг создавался для того, чтобы уменьшить время простоя ИТ-систем в случае сбоев. При простоях бизнес-приложений компании несут потери, в том числе финансовые. Практически любая компания способна оценить, какие убытки ей грозят при недоступности той или иной системы.

При использовании инструментов мониторинга заказчик получает своевременную информацию о недоступности ИС или скорейшем наступлении недоступности, если службой эксплуатации не будут предприняты срочные меры — например, освобождение вычислительных ресурсов, чтобы система оставалась доступной. Не так сложно подсчитать экономическую выгоду от того, что потеря не случилась, и система продолжила работать, а источник потенциальной проблемы удалось быстро ликвидировать.

Другие материалы раздела «Мониторинг ИТ-систем. Когда все под контролем»

Мониторинг информационных систем в Департаменте информационных технологий Москвы
Мониторинг информационных систем в Департаменте информационных технологий Москвы
Благодаря внедрению Департамент информационных технологий города Москвы обеспечил круглосуточный контроль над своими информационными ресурсами в том же режиме, как если бы проверку выполнял горожанин или представитель бизнеса, когда он обращается за государственной услугой. Независимость услуги мониторинга от эксплуатирующих организаций позволила получить объективную оценку качества функционирования московских информационных ресурсов и предотвратить сбои.
Мониторинг ИТ-инфраструктуры и приложений
Мониторинг ИТ-инфраструктуры и приложений
Профессионально организованный мониторинг — это эффективный инструмент оперативного реагирования на сбои информационных систем, их предотвращения и повышения производительности работы. В отличие от моновендорных систем мониторинга, предлагаемая услуга работает с решениями различных вендоров, объединяя их в единую систему. На каждом уровне мониторинга могут использоваться независимые от других уровней решения.
ОТ-Monix — инфраструктурный и функциональный мониторинг в одном решении
ОТ-Monix — инфраструктурный и функциональный мониторинг в одном решении
ОТ-Monix — это экономически эффективное решение, дающее регулярную независимую оценку функционирования информационных систем. В отличие от моновендорных систем мониторинга, предлагаемая услуга работает с решениями различных вендоров, объединяя их в единую систему. Одной из уникальных особенностей решения является подсистема функционального контроля информационных систем, дающая возможность проводить функциональное тестирование информационных систем, в том числе, имитировать деятельность различных типов пользователей и различных режимов функционирования. Экономия денег и времени на внедрение, объективность и эффективность решения доказаны на практике.