Deckhouse, разработчик продуктов для построения надёжной enterprise-инфраструктуры, запустил хранилище мониторинга (трассировки) жизненного цикла запросов или событий (трейса) в платформе наблюдаемости Deckhouse Observability Platform (DOP). Теперь команды разработки и эксплуатации ИТ-компаний могут управлять трассировками распределённых запросов на уровне платформы: с настройкой лимитов, прав доступа и встроенным мониторингом, без необходимости развёртывать отдельные решения для каждого сервиса.
Deckhouse Observability Platform — централизованная платформа наблюдаемости для гибридной и Kubernetes-инфраструктуры. Решение объединяет метрики, логи и трассировки приложений, физических серверов, виртуальных машин, сетей и Kubernetes-кластеров в одной системе.
Хранилище трейсов закрывает ключевую проблему микросервисных архитектур. В распределённой системе один пользовательский запрос проходит через множество сервисов, и при деградации или ошибке командам сложно быстро понять, где именно произошёл сбой. Без трассировок поиск первопричины занимает много времени, что увеличивает среднюю продолжительность восстановления сервисов.
Внедрение хранилища трейсов в DOP сокращает время на поиск причин инцидентов: trace ID связывает спаны всех сервисов в единую цепочку, позволяя мгновенно увидеть путь запроса. Решение упрощает отладку распределённых систем — инженеры получают подробную информацию о поведении приложения, длительности выполнения команд и последовательности вызовов. Локализация проблемы становится объективной: сразу видно, в каком сервисе возникла задержка и какая команда ответственна за её устранение, что снижает количество споров при инцидентах.
Особое внимание уделено надёжности и управляемости самого компонента. В DOP реализован внутренний мониторинг хранилища трейсов, который включает сбор ключевых метрик: нагрузка, ошибки, задержки, потребление ресурсов и состояние операций записи и чтения. Для визуализации состояния хранилища предусмотрены специализированные дашборды, ускоряющие локализацию проблем инфраструктуры наблюдаемости. Система алертинга автоматически оповещает о деградации или отказе по заданным условиям, сокращая время реакции команды и не позволяя проблеме остаться незамеченной.
«Мы добавили в DOP хранилище трейсов, чтобы закрыть важную задачу в микросервисной среде: быстро понять, где в цепочке сервисов возникла ошибка. Для нас было важно сделать не просто хранение трейсов, а управляемый компонент платформы — с возможностью гибкой настройки, лимитами, правами доступа и внутренним мониторингом состояния. Это избавляет команды от необходимости собирать и поддерживать отдельные решения, делая работу с трассировками предсказуемой и удобной», — Константин Аксёнов, директор департамента разработки Deckhouse компании «Флант».
Централизованное хранилище поддерживает длительное хранение данных с гибкой настройкой прав доступа и аудитом всех событий.
Источник: компания «Флант»










