Сравнение решений по мониторингу
Обзор рынка
Рынок решений для ИТ-инфраструктуры заметно вырос, однако российские разработчики, стремясь догнать западные аналоги по функциональности, нередко упускают вопросы надежности и качественных подходов к мониторингу. Необходимы новые методы мониторинга, способные эффективно отслеживать современные системы и приложения.
Сегодня выделяется несколько ключевых трендов, которые влияют на рынок мониторинга.
|
Сертификация ФСТЭК На рынке появляется такая потребность, и ряд вендоров уже имеют такую сертификацию или находятся в процессе получения. Повышение безопасности Большинство вендоров систем мониторинга ускоряют обновление и доработку продуктов при выявлении критических уязвимостей. Для проверки кода на уязвимости в Open Source решениях привлекаются внешние специализированные компании. |
ИИ-ассистенты ИИ-ассистенты начинают включать в базовый функционал систем наблюдаемости с целью оптимизации задач:
Ускоренный поиск проблем и формирование предложений по их разрешению за счет анализа событий и их контекста. |
|
AI-powered Observability Вендоры платформ наблюдаемости начинают активнее внедрять ИИ-функции, чтобы помочь компаниям ускорить процесс обработки телеметрии, получить более быстрый результат и сократить издержки при работе с платформами наблюдаемости. Улучшаются функции и алгоритмы выявления нетипичных отклонений в работе ИТ-систем, анализа первопричин сбоев, корреляции технических и бизнес-метрик, прогнозирования надежности работы или использования ресурсов. |
AI Observability Мониторинг и оптимизация работы ИИ-приложений становится важным процессом. Платформы наблюдаемости начинают предоставлять функции для отслеживания и оптимизации работы таких приложений.
|
|
Выделение вспомогательных типов телеметрии Основные три типа телеметрии (метрики, логи, трейсы) дополняются вспомогательными. Например:
|
Meta и Cross-мониторинг У компаний все чаще возникает потребность отслеживать работу компонентов самих систем мониторинга, которые обеспечивают мониторинг важных ИС. |
|
Заимствование функций между различными классами систем В ряд систем мониторинга интегрируются функции систем анализа информационной безопасности, поскольку инциденты информационной безопасности могут влиять на надежность ИС. |
Развитие Low-code/No-code Автоматизация процессов обработки мониторинговых данных, пользовательских действий и других операций. Low-code/No-code подходы оптимизируют с помощью функций ИИ. |
|
Развитие Observability-подхода (наблюдаемость) Компании не просто внедряют новые инструменты, а меняют процессы и подход к мониторингу. О наблюдаемости думают уже на этапе разработки. Системы мониторинга превращаются в платформы для анализа инфраструктуры, приложений и безопасности. |
Выделение основных элементов построения наблюдаемости Растет потребность в решениях, которые используют элементы:
|
Сегодня руководители хотят видеть работу ИТ-сервисов и бизнес-приложений в компактном и удобном формате. Это ускоряет принятие решений, улучшает точность прогнозов, повышает надежность и снижает расходы на поддержку инфраструктуры.
Сравнение решений по мониторингу
Вендор | Решение | Год основания | Входит в Реестр ПО | AI/ML | SaaS | Подход |
|---|---|---|---|---|---|---|
Пруфтек ИТ | Artimate | 2024 | Event Intelligence Solutions | |||
Группа Астра | Астра Мониторинг | 2024 | Monitoring | |||
ИНИТИ | Initi Solo | 2007 | Monitoring | |||
Glaber | Glaber | 2018 | Monitoring | |||
Tibbo Systems | AggreGate Network Manager (NM) | 2008 | Monitoring | |||
UDV Group | UDV ITM | 2018 | Monitoring | |||
Лаборатория Числитель | Пульт | 2023 | Monitoring | |||
РОССИННО | Центральный Пульт (Saymon) | 2012 | Monitoring | |||
VolgaBlob | Smart Monitor | 2014 | Monitoring | |||
Монк Диджитал Лаб | Monq | 2019 | Monitoring | |||
НТЦ Веллинк | wiSLA | 2008 | Monitoring | |||
КОМС | C-View | 2015 | Monitoring | |||
Prometheus | Prometheus | 2012 | Monitoring | |||
Victoria Metrics | VictoriaMetrics | 2018 | Monitoring | |||
Zabbix SIA | Zabbix | 2005 | Monitoring | |||
Геларм | Gelarm Infrastructure Management System (GIMS) | 2017 | Monitoring | |||
РР-ТЕХ | ИндексЛог | 2023 | Observability | |||
Рускомтехнологии | Ключ-АСТРОМ | 2014 | Observability | |||
Proto Group | Proto Observability Platform | 2014 | Observability | |||
ХайперСофтЛаб | GMonit | 2021 | Observability | |||
Т-Банк | Sage Observability | 2019 | Observability | |||
Elastic NV | Elastic Stack | 2012 | Observability | |||
Grafana | Grafana Stack | 2014 | Observability |
ИИ в системах мониторинга и наблюдаемости
Системы мониторинга и платформы наблюдаемости обладают широкой функциональностью, но детальная оценка надежности систем на микросервисных или монолитных архитектурах по-прежнему требует значительных усилий — анализа логов, метрик, трейсов, поиска первопричин сбоев. Многие рутинные задачи (настройка уведомлений, создание дашбордов, анализ запросов) можно автоматизировать с помощью ИИ, сокращая простои и операционные затраты.
Сейчас платформы наблюдаемости развивают ИИ-функции в трех направлениях: предиктивный ИИ (прогнозирование аномалий и использования ресурсов), причинный ИИ (автоматический поиск первопричин сбоев) и генеративный ИИ (формирование запросов и дашбордов на естественном языке через LLM-ассистентов).
Мнение эксперта
Существующие системы мониторинга не всегда эффективно отслеживают доступность и производительность ИТ-систем. Поэтому в приоритете проекты по миграции и расширению систем мониторинга, повышению надежности ИС и обоснованию экономического эффекта от перехода на новые решения.
Главное для бизнеса — понимание надежности всех ИС и бизнес-приложений на базе согласованных SLO/SLA, а также влияния состояния ресурсов на пользователей и финансовые показатели.
Для этого компании все чаще совместно используют системы мониторинга и платформы наблюдаемости:
- Мониторинг работает по предопределенным правилам и подходит для статических инфраструктур;
- Наблюдаемость ориентирована на динамические среды и бизнес-приложения — позволяет анализировать телеметрию и быстро находить проблемы без заранее заданных правил.
Вендоры расширяют функциональность своих продуктов, в том числе за счет ИИ. Особенно это актуально для платформ наблюдаемости, где объем данных и типов телеметрии слишком велик для анализа без автоматизации.

Растет интерес к созданию и адаптации ресурсно-сервисных моделей (РСМ) для ключевых ИС с их консолидацией в единой консоли — подход, характерный для систем мониторинга.
Для динамических инфраструктур востребовано построение карт сервисов и приложений (Service Map/Application Map) на базе распределенной трассировки — ключевая функция платформ наблюдаемости, ускоряющая поиск проблем и анализ влияния изменений на надежность ИС.
Дополнительно следует сказать о решениях класса DCIM, которые отчасти закрывают вопросы мониторинга аппаратной составляющей ЦОД и решают вопросы сокращения расходов на эксплуатацию ЦОД:
- Например, DCImanager (Группа Астра) и Smart DCIM (РОССИННО) имеют готовые шаблоны мониторинга с помощью протоколов Redfish, IPMI, SNMP и других, и имеют поддержку со стороны производителей оборудования;
- СДИ Базис имеет широкие возможности технического учета ресурсов ЦОД, включая телеком и инженерную инфраструктуру, а также имеет эксклюзивные возможности по визуализации объектов ЦОД и имеет библиотеку цифровых моделей для более чем 80 тыс. типов оборудования (фасады оборудования, энергопотребление, вес, габариты, тепловыделение, порты, слоты, совместимые модули и другие параметры).
- Infravision — построен на базе Open Source решения Netbox, но имеет встроенные функции автоматического обнаружения объектов инфраструктуры по различным протоколам и из коробки поддерживает российские и иностранные платформы виртуализации, СХД, аппаратное обеспечение и т.д. А также имеет собственных агентов под Windows/Linux/macOS/Android.
Мы предполагаем, что решения класса DCIM могут быть использованы совместно с системами мониторинга для повышения надежности сервисов и снижения затрат.
Мы подразделяем решения на две группы в зависимости от используемого подхода (Monitoring/Observability).
|
Мониторинг (Monitoring) |
|
Позволяет наблюдать и понимать состояние систем с помощью предопределенного набора правил мониторинга. Они позволяют обнаруживать известный набор режимов сбоев (known-unknowns), то есть нацелены на системы, которые достаточно статичны, и мы можем предугадать их поведение. Как правило, используется для мониторинга нединамических инфраструктур. |
|
Наблюдаемость (Observability) |
|
Решения выступают инструментом для анализа телеметрии и быстрого поиска и устранения проблем в работе ИС без заранее предопределенного набора правил мониторинга. Они способны выявлять неизвестные заранее сбои (unknown-unknowns), то есть факторы, о которых в данный момент мы даже не подозреваем, но которые могут повлиять на надежность работы ИС. Решения нацелены на более глубокий мониторинг ПО и имеют функции профилирования кода, мониторинга действий реальных пользователей, автоматического определения первопричин сбоев. Потребность в решениях возникает, когда простой бизнес-приложения может значительно повлиять на финансовые показатели и создать репутационные риски. Системы на данный момент дополняют решения инфраструктурного мониторинга, но в некоторых сценариях перекрывают их функциональность, позволяя в единой консоли видеть как показатели работы приложения, так и ИТ-инфраструктуры. Поскольку данные решения нацелены на анализ большого потока данных, в таких решениях наиболее часто начинают быть востребованы ИИ-функции. |
Среди решений класса Monitoring особого внимания заслуживают прямые альтернативы Zabbix. При миграции на российские системы мониторинга можно рассмотреть три решения: Glaber, Пульт (Лаборатория Числитель), UDV ITM (UDV Group). Все решения находятся в Реестре отечественного ПО, соответствуют концепции импортозамещения и сохраняют привычный для конечных пользователей интерфейс.
Glaber используется в ряде крупных компаний, где функционирует в конфигурации высокой доступности между тремя дата-центрами.
Благодаря использованию БД ClickHouse для исторических данных решение показывает более высокую производительность в сравнении с Zabbix. Главная особенность продукта — акцент на производительности и минимизации обращений к СУБД.
Пульт — решение, архитектурно схожее с Glaber, использующее ClickHouse для исторических данных. В отличие от Glaber, вендор не изменяет внутренние функции Zabbix, а расширяет их внешними модулями, что обеспечивает более стабильную работу и лучшую совместимость.
Дополнительные возможности: расширенная отчетность, готовые шаблоны мониторинга с поддержкой вендора (Astra Linux, РЕД ОС, российские платформы виртуализации), модуль визуализации данных с гибкой ролевой моделью — аналог Grafana с поддержкой источников Пульт, Zabbix, Prometheus, VictoriaMetrics и базовой визуализацией РСМ.
Пульт — полностью коммерческий продукт, требующий лицензий на компоненты и объекты мониторинга. Сертификация ФСТЭК по четвертому уровню доверия (УД) ожидается в 4 квартале 2026 года.
UDV ITM сертифицирован ФСТЭК (6 УД) с акцентом на безопасность. Помимо стандартной функциональности Zabbix, включает модуль визуализации (ITM-VM), объединяющий все экземпляры решения в единой консоли.
Платформа Центральный Пульт (Saymon) позволяет строить как системы мониторинга, так и специализированные системы управления с высоким уровнем кастомизации. Решение объединяет существующие системы мониторинга в единой консоли. Встроенная CMDB и объектная модель позволяют строить РСМ, выявлять аномалии и определять корневые причины сбоев. Подсистема управления шаблонами мониторинга, аналогичная подходу SolarWinds, ускоряет постановку новых систем на мониторинг. Есть мобильные приложения под iOS и Android, а также возможность расширения внешними модулями (alertmanager, визуализация, автообнаружение объектов). Ограничения: платформа не развивается в сторону наблюдаемости, а анализ работы приложений проработан неглубоко.
Астра Мониторинг — платформа наблюдаемости с более современным технологическим стеком, чем решения на базе Zabbix. Включает готовые модули мониторинга для продуктов экосистемы (Astra Linux, ALD Pro, RuPost, RuBackup, Termidesk и др.) с лучшими практиками от вендора.
Платформа поддерживает подход IaC (конфигурация системы через код), eBPF для анализа приложений, работу с различными типами телеметрии (логи, метрики, трейсы), RUM и OpenTelemetry. Подход «единого агента» упрощает постановку систем на мониторинг. Для минимизации простоев предусмотрен функционал управления инцидентами (on-call менеджмент). Решение может выступать универсальным инструментом мониторинга как инфраструктуры, так и приложений.
Monq — популярное решение в крупных финансовых организациях или банках, изначально созданное для агрегации и анализа данных с локальных систем мониторинга в единой консоли с Low-code/No-code подходом к автоматизации. В версии 9 решение активно замещает функциональность систем типа Zabbix и движется в сторону платформы наблюдаемости: заявлена поддержка распределенной трассировки и непрерывного профилирования (3 квартал 2026 года) на базе собственных наработок.
Пока не хватает гибкого анализа телеметрии и связей данных, динамических карт сервисов, поддержки RUM и мониторинга мобильных приложений. При этом решение достаточно зрелое и позволяет обходиться без вспомогательных систем мониторинга, что дает экономический эффект.
В Monq 9 заявлены ИИ-корреляция событий и ИИ-ассистент на базе LLM для упрощения создания сценариев автоматизации. Сертификация ФСТЭК по 4 УД для версии 8.x планируется в 4 квартале 2026 года.
Для динамических инфраструктур (микросервисы, Kubernetes) предпочтительны VictoriaMetrics и Prometheus. Некоторые российские системы включают VictoriaMetrics, но не для замены отдельных инсталляций, а для расширения внутренних функций.
Активные пользователи Open Source редко переходят на решения вроде Initi Solo и AggreGate Network Manager (Tibbo Systems) из-за высоких затрат на миграцию и переобучение сотрудников. Initi Solo движется в сторону платформы наблюдаемости и имеет наработки по распределенной трассировке и непрерывному профилированию, однако динамическая отрисовка карт сервисов (Service Map) пока не реализована — текущее решение подходит только для статических инфраструктур.
В части Observability-платформ компании предпочитают коробочные решения с автоматической инструментацией кода, хотя без ручной инструментации не обходится — это взаимодополняющие механизмы. Основной отечественной платформой до недавнего времени выступал Ключ-АСТРОМ (ответвление Dynatrace), использующий ИИ для определения аномалий, анализа первопричин сбоев и автоматической адаптации пороговых значений.
К этому классу также относятся GMonit и Proto Observability Platform. Для максимального функционала выбирают Ключ-АСТРОМ, для более быстрого экономического эффекта с некоторой потерей в функциональности — GMonit и Proto Observability Platform.
Proto Observability Platform лицензируется по числу агентов (без привязки к конфигурации сервера) с опцией безлимитного покрытия. Платформа поддерживает 300+ технологий автоматической инструментации и имеет собственную консоль с интеграцией во внешние системы визуализации.
GMonit построен на современном стеке (ClickHouse+Grafana), включает готовые модули мониторинга 1С и SAP, базовые функции наблюдаемости с ИИ для определения аномалий и поиска корневых причин сбоев. Дорабатывается ИИ-ассистент на основе LLM, который ускорить решение вопросов в рамках инцидентов. Ограничения: обязательное использование встроенного экземпляра Grafana (внешний не подключить), лицензирование привязано к числу CPU и пользователей веб-сайта.
Отдельно выделяются Sage Observability (Т-Банк), Smart Monitor (VolgaBlob), Artimate (Пруфтек ИТ), GIMS (Геларм), WiSLA (Веллинк). Sage Observability выступает как система наблюдаемости, которая может собирать и анализировать все основные типы телеметрии из информационных систем компании. Также имеется нативная интеграция с решением FineDog (Т-Банк), которое выступает как инцидент-менеджмент и имеет ИИ-ассистента, предоставляющего быстрый доступ к важной информации в инцидентах из FineDog. Решения Sage Observability и Smart Monitor позиционируются аналогом Splunk и адаптированы к работе с большими объемами данных.
Sage обеспечивает принципы Site Reliability Engineering (SRE):
- Определение целей надежности — SLI, SLO, Error Budget;
- Возможности построения сервисной модели, модели здоровья и возможности по сбору и анализу событий безопасности.
Решение Smart Monitor объединяет мониторинг:
- Бизнес-процессов: профилирование действий пользователей в рамках бизнес-процессов, скоринга и других операций;
- Кибербезопасности: антифрод, автоматизированная оценка соответствия нормативным и корпоративным требованиям ИБ (модуль MITRE ATT&CK);
- ИТ-инфраструктуры: надежность систем, выявление первопричин сбоев на базе встроенного функционала построения РСМ.
Также решение Smart Monitor имеет ряд дополнительных модулей, включая модуль работы с распределенной трассировкой и ИИ-ассистента, который можно использовать для написания запросов с помощью естественного языка, что упрощает поиск и анализ данных. Решение сертифицировано ФСТЭК (4 УД), но в данный момент не соответствует всем критериям платформ наблюдаемости.
Если стоит задача импортозаместить продукты IBM Tivoli и использовать схожую логику работы системы мониторинга, то самым простым и быстрым вариантом перехода будет решение GIMS.
Для мониторинга инфраструктуры и каналов связи с анализом трафика — как это было реализовано в SolarWinds, PRTG и аналогах — стоит рассмотреть wiSLA. Продукт имеет готовую интеграцию с решением Artimate.
Artimate выступает вспомогательным инструментом для различных систем мониторинга и платформ наблюдаемости. Продукт решает вопрос интеллектуального анализа событий (EIS) с помощью ИИ и ML для ускорения и автоматизации обработки событий, что позволяет снизить нагрузку на персонал и сократить время простоя систем.
В некоторых проектах появляется необходимость использования дополнительных BI-систем для визуализации мониторинговых данных. Из российских решений компании выбирают Visiology. Наряду с этим, хотя многие системы имеют встроенные консоли и визуализацию, Grafana остается одним из самых востребованных инструментов в качестве универсального решения для визуализации.
ИИ-ассистенты на базе LLM уже помогают формировать запросы на естественном языке, создавать дашборды, анализировать телеметрию и предлагать действия при инцидентах. Однако их ответы сильно зависят от контекста вводных данных и основаны на предсказании наиболее вероятных сценариев — риск неточного результата сохраняется. ИИ позволяет переосмыслить работу инженеров, но не заменить их.

Не рекомендуем рассматривать наличие ИИ-функций как блокирующий фактор при выборе решений — пока это хорошее дополнение, а не гарантия результата.

Комментарии 0