Автономный анализатор логов на локальной LLM: как инженер автоматизировал мониторинг

Подготовлено редакцией Malakhov AI

Habr AI·12 июн.·1 минРоссияКод

Роман Шубин, CTO и автор Telegram-канала Bash Days, запустил на облачном GPU Selectel (RTX 4090) локальную модель ИИ для анализа логов серверов — стоимость аренды от 131,77 рубля в час.

Кратко

—Инженер Роман Шубин настроил локальную LLM на облачном GPU Selectel для мониторинга логов.
—Система использует llama.cpp и работает автономно, отправляя уведомления при аномалиях.
—Запуск на собственном сервере обеспечивает полный контроль над данными и снижает затраты по сравнению с облачными API.
—Конфигурация: 8 vCPU, 32 ГБ RAM, RTX 4090 24 ГБ, 100 ГБ SSD.
—При необходимости можно использовать прерываемые серверы для экономии.

Глоссарий · 3 термина▾

llama.cpp: Библиотека для запуска LLM (больших языковых моделей) на локальном оборудовании с поддержкой GPU, позволяющая работать без сторонних API.
GPU-облако: Аренда виртуальной машины с графическим процессором для вычислительных задач, например, для запуска ИИ-моделей.
Selectel: Российский облачный провайдер, предоставляющий услуги аренды серверов, в том числе с GPU.

Роман Шубин, CTO и автор Telegram-канала Bash Days, столкнулся с задачей мониторинга двух физических серверов, используемых для хранения статики. Оборудование требует регулярной диагностики: диски, память выходят из строя не мгновенно, сначала появляются ошибки в логах. Чтобы избежать простоев, инженер решил автоматизировать процесс анализа с помощью локальной ИИ-модели.

В отличие от распространенных решений, таких как Ollama или LM Studio, Шубин выбрал llama.cpp и развернул все на облачном сервере Selectel с GPU NVIDIA GeForce RTX 4090 (24 ГБ видеопамяти), 8 vCPU, 32 ГБ RAM и 100 ГБ SSD. Сборка производится из исходников через git, cmake — никаких готовых образов, только терминал и компилятор. Итоговый агент анализирует логи и при обнаружении аномалий отправляет уведомления, заменяя ежемесячную ручную проверку.

Ключевое преимущество подхода — полный контроль над данными. Все запросы и результаты остаются внутри инфраструктуры, что критично для компаний, работающих с чувствительными данными. Стоимость аренды такого сервера начинается от 131,77 рубля в час, а при выборе прерываемых инстансов цена может быть значительно ниже.

Пока система используется только для логов конкретного клиента, но, по словам автора, архитектура позволяет масштабировать решение на другие серверы и типы данных. Остается открытым вопрос: насколько легко будет адаптировать агента к нестандартным форматам логов и какую точность демонстрирует модель на редко встречающихся ошибках. Впрочем, для типовых сценариев решение уже работает.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

Автономный анализатор логов на локальной LLM: как инженер автоматизировал мониторинг

Кратко

Читать дальше

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений