Введение
Для бизнеса, где многое зависит от стабильной работы сервисов, каждая минута простоя – это убытки. Представим такую ситуацию: компания внедряет в инфраструктуру систему управления сетевым оборудованием. Все тесты пройдены, конфигурации выверены, сервис успешно запущен. И вдруг – сбой.
Начинается поиск причины: проблема в системе управления? в базе данных? в сети? в сервере? После долгих проверок выясняется, что программное обеспечение работает штатно, а причина – в серверном окружении. Закончилось место на дисках, один из процессов занял всю память и множество других причин.
В процессе сопровождения внедрений программных продуктов Eltex мы не раз убеждались: без слаженной работы инфраструктуры невозможно гарантировать работу приложения. И нужен инструмент для многофакторного контроля, который видит всю картину целиком.
Именно для этого мы создали систему мониторинга Peeper. Это комплексное решение, интегрированное в экосистему Eltex и отслеживающее специфические метрики его программных продуктов, а также ключевые характеристики серверного окружения, например метрики сети, Linux, Docker, баз данных.
Что в основе
При создании Peeper идея была проста: взять проверенные opensource-инструменты мониторинга и на их основе создать простую и удобную в использовании систему. Peeper основана на решениях Grafana, Victoria Metrics, Telegraf и др. Казалось бы, можно взять их из открытых источников и использовать для работы с программными продуктами Eltex. Тогда в чём же ценность Peeper?
В глубокой интеграции с продуктами Eltex, простоте развёртывания и эксплуатации. Главный недостаток opensource систем мониторинга – длительный и трудоёмкий процесс конфигурирования. Настроить комплексный мониторинг – задача нетривиальная: нужно понимать архитектуру системы, знать критические метрики, настроить шаблоны, определить пороги срабатывания алертов. Требуется экспертиза и в программных продуктах Eltex, и в стеке системы мониторинга. На практике это выливается в долгие часы на отладку и запуск.
Мы взяли эту задачу на себя. Peeper прост в развёртывании и эксплуатации. В системе уже настроены готовые профили и дашборды под каждый программный продукт Eltex, а состав специфических метрик и алертов определён на основе опыта сотен интеграций. Заказчик получает работающий мониторинг из коробки – без необходимости разбираться в тонкостях продукта и тратить много времени на настройку.
Главная задача системы – предотвратить аварии до того, как они случатся. Peeper непрерывно следит за всеми важными показателями и, когда замечает, что какой-то из них приближается к критическому уровню, сразу отправляет уведомление об этом.
Все данные о работе серверов и приложений сохраняются в единое хранилище. Когда нужно разобраться, почему произошёл сбой, с помощью Peeper можно вернуться назад во времени и посмотреть, что происходило перед аварией, во время неё и после. Все записи, графики и события собраны в одном месте, и можно проследить всю цепочку: что «отвалилось» первым, как это повлияло на другие части системы, почему не сработала защита.
Кроме того, Peeper даёт полную картину состояния системы изнутри. Видно все внутренние процессы, даже если снаружи все выглядит нормально.
Ключевые возможности:
- Простота внедрения и эксплуатации. Peeper разработан с фокусом на быструю установку и управление, что минимизирует затраты на поддержку.
Централизованный сбор данных. Система собирает ключевые данные, включая метрики производительности из установленных программных продуктов Eltex. - Визуализация. Встроенные инструменты позволяют наглядно представлять данные в виде интерактивных дашбордов, графиков и таблиц для быстрого анализа состояния системы.
- Проактивное оповещение. Гибкая система триггеров автоматически уведомляет о критических событиях или отклонениях в работе сервисов по заданным метрикам.
- Резервирование. Система автоматически создаёт резервные копии своей конфигурации, защищая от потери важной информации и обеспечивая быстрое восстановление.
На данный момент система поддерживает работу с тремя программными продуктами Eltex: системой управления сетевым оборудованием ECCM, IP-АТС ECSS-10 Softswitch и системой управления беспроводной инфраструктурой SoftWLC. В дальнейшем число поддерживаемых продуктов будет увеличиваться.
Архитектура
Peeper состоит из двух элементов:
- Peeper Client. Его задача – непрерывно собирать сотни метрик о состоянии сервера: показатели операционной системы Linux (нагрузка на CPU, использование оперативной памяти, дисковое пространство, сетевые счётчики и др.), состояние контейнеров Docker, специфические показатели программных продуктов Eltex. Устанавливается на тот же сервер, что и программная система Eltex, например ECCM, ECSS-10 Softswitch, SoftWLC. Peeper автоматически распознаёт продукт и подгружает соответствующий ему профиль мониторинга с преднастроенными метриками, дашбордами и правилами оповещений.
- Peeper Server. Устанавливается на отдельный сервер. Если у заказчика развёрнуто несколько серверов с продуктами Eltex, все метрики стекаются в единый интерфейс. Администратор видит целостную картину: какие серверы под нагрузкой, где аномалии, какие сложились тренды за определённое время.
Визуализация – на основе Grafana с кастомными дашбордами. Администратор видит все серверы с продуктами Eltex в едином интерфейсе. Можно переключаться между ними, сравнивать метрики, строить сводные дашборды.
Алерты можно отправлять в Telegram и на электронную почту. Когда метрика выходит за порог, инженер, следящий за инфраструктурой, сразу получает сообщение. При необходимости можно настроить уведомления и в другие каналы.
Peeper хранит собственную конфигурацию. Если система мониторинга выходит из строя, её можно восстановить из резервной копии вместе со всеми настройками дашбордов, правилами алертов и историческими данными.
Безопасность
Безопасность инфраструктуры – не пожелание, а обязательное требование. И мы учли это в Peeper.
Данные передаются с шифрованием по HTTPS методом Push. Клиентская часть сама инициирует отправку данных на сервер – не нужно открывать входящие порты на файрволле и разрешать внешние подключения к системе. Это соответствует сетевым политикам безопасности, так как не создаёт новых точек входа в защищённый контур.
Развитие
Peeper – новая система, и её развитие идёт параллельно с развитием софтовых продуктов Eltex. По мере появления новых решений или обновления существующих мы будем добавлять их поддержку и другие возможности в новые версии.
Что умеет Peeper на данный момент:
- Cбор, хранение метрик и логов
- Визуализация данных в виде дашбордов, графиков, диаграмм, таблиц, входящих в состав продукта
- Отправка алертов в случае срабатывания триггера по метрике
- Autodiscovery источников метрик
- Autoprovision дашбордов и алертов
- Готовые дашборды и алерты для каждого поддерживаемого программного продукта Eltex
- Системные дашборды и алерты для Linux, Docker, Postgres, MySQL (MariaDB)
- Мониторинг доступности и работоспособности сетевых сервисов
(HTTP/HTTPS, TCP, DNS, ICMP)
Заключение
Peeper – это наше видение того, каким должен быть мониторинг. Простым в развёртывании и повседневной эксплуатации, максимально интегрированным в экосистему и заточенным под специфику работы с программными продуктами Eltex.
Система работает из коробки, масштабируется по мере роста инфраструктуры и интегрируется с продуктами Eltex на глубоком уровне. Система включает специфические метрики и готовые дашборды, которые невозможно создать без понимания внутреннего устройства продуктов Eltex.
Протестируйте Peeper в своей инфраструктуре. Напишите нам, чтобы узнать подробности: eltex@eltex-co.ru