Администрирование крупного парка СУБД — трудоёмкая задача. При классическом подходе инженер получает оповещение из Prometheus, вручную просматривает дашборды Grafana, анализирует журналы, ищет закономерности и только потом создаёт задачу на исправление. Команда СберТеха автоматизировала этот цикл.
Разработано два ключевых инструмента. Monitoring_Checker_TT связывает Prometheus, Pipeliner (CI/CD-оркестратор СберТеха, аналог Jenkins) и TaskTracker (аналог Jira). Задания в Pipeliner по расписанию собирают метрики через Prometheus API с помощью PromQL-запросов и автоматически создают заявки. Для сбора данных создан кастомный экспортёр stdguard_pgexporter на основе ранее опубликованного pangolin_exporter. Он выполняет bash-команды и SQL-запросы из конфигурационных файлов stdguard_system.yaml и stdguard_queries.yaml каждые 15 минут. Экспортёр преобразует текстовые журналы СУБД в метрики Prometheus: подсчитывает ошибки (ERROR/FATAL/PANIC), блокировки (deadlock, lock timeout), размеры логов. Конфигурация также включает контроль соответствия внутренним стандартам: проверка имён объектов, комментариев, табличных пространств.
| Инструмент | Назначение | Ключевые компоненты |
|---|---|---|
| Monitoring_Checker_TT | Автоматическое создание заявок при инцидентах | Prometheus, Pipeliner, TaskTracker, stdguard_pgexporter |
| Analyze_Pangolin_AI | ИИ-диагностика и отчёт по метрикам | GigaChat, AI Hub API, Prometheus |
Второй инструмент — Analyze_Pangolin_AI. Он использует GigaChat через ИИ Hub API для анализа собранных данных и генерации отчёта по заданному шаблону. Это ускоряет диагностику Platform V Pangolin — реляционной СУБД, разработанной в СберТехе на базе PostgreSQL с доработками для усиленной безопасности и производительности. Комбинация двух решений позволяет не только быстро фиксировать инциденты, но и получать интерпретацию метрик с помощью ИИ, что снижает нагрузку на администраторов и сокращает время простоя. Внедрение подобной системы особенно актуально для крупных организаций с сотнями экземпляров БД, где ручной анализ становится узким местом.
Для сбора данных создан кастомный экспортёр stdguard_pgexporter, анализирующий журналы и SQL-запросы

