Пул-реквесты в команде High End Meta Backend «Леста Игры» висели по две недели. Команда обслуживает веб-инфраструктуру «Мира кораблей»: авторизацию, покупки, инвентарь, клановые сервисы — десятки микросервисов на Python и Go. Обязательный час командного Cross Review в неделю помогал разгребать очередь, но не решал проблему системно.
Тогда тимлид Данил Чечков решил автоматизировать процесс. Инструмент назвали Hephaestus — в команде прижилось «Гефестыч». Задача: автоматически анализировать diff из пул-реквеста, находить проблемы с качеством кода, безопасностью и производительностью, и оставлять комментарии без участия человека.
| Сервис | Интеграция с Git-платформами | Кастомизация инструкций | RAG по кодовой базе |
|---|---|---|---|
| ai-review (Nikita-Filonov) | GitLab, GitHub, Bitbucket, Azure DevOps, Gitea | ✅ | ❌ |
| PR-Agent / Qodo Merge OSS | GitHub, GitLab, Bitbucket, Azure DevOps | ✅ | ⚠️ только enterprise |
| kodus-ai (Kodus) | GitHub, GitLab, Bitbucket, Azure Repos | ✅ | ✅ |
| code-review-gpt | только GitHub | ✅ | ❌ |
| Codedog | GitHub + GitLab | ✅ | ❌ |
| Sweep AI | только GitHub | ✅ | ✅ (лицензия BSL-1.1) |
Перед стартом команда рассмотрела три пути. Первый — закрытые платформы вроде CodeRabbit или Codium: работают хорошо, но код уходит на внешние серверы, что неприемлемо для игровой компании с чувствительными данными. Второй — готовые open-source решения, например github/ai-review или PR-Agent. Они появились примерно тогда, когда Гефестыч уже интегрировали в рабочий процесс, и сегодня авторы рекомендуют начинать именно с них — это экономит сотни человеко-часов. Третий путь — написать собственную обёртку поверх self-hosted модели. Команда выбрала третий.
Для работы модели нужна видеокарта с VRAM около 24 ГБ — в команде используется RTX 4090.
В компании уже работал OpenWebUI — интерфейс для взаимодействия с LLM с открытыми весами во внутренней сети. Он предоставляет OpenAI-совместимый API, что позволяет в будущем безболезненно сменить модель. Для запуска нужна видеокарта с VRAM около 24 ГБ — команда использует RTX 4090. Модель qwen3-coder:30b, по оценке авторов, уверенно находит smelly code, проблемы безопасности и узкие места производительности, даже не имея полного контекста проекта.
Но именно здесь начались проблемы. Первая и главная: API OpenWebUI для загрузки документов и их преобразования в векторы для RAG оказался синхронным. Команда обнаружила это поздно — уже после полной интеграции функционала. На малом количестве файлов всё работало, статус-коды возвращались корректные. Под реальной нагрузкой выяснилось, что в базу знаний попадает значительно меньше файлов, чем отправляется. Пришлось переписывать асинхронный код в синхронный на ходу. Авторы прямо предупреждают: если планируете масштабировать систему на несколько департаментов с ежедневными запусками — сразу переходите на ollama, llama.cpp или vllm, минуя OpenWebUI API.
Вторая ошибка — самописный клиент к API. Ради нескольких эндпоинтов команда не захотела подключать стороннюю библиотеку и написала свой клиент. Сейчас они рекомендуют использовать Pydantic AI: это готовый конструктор для работы с LLM, который берёт на себя большую часть инфраструктурной логики.
Архитектурно Гефестыч работает так: в LLM подаётся diff пул-реквеста, а через эмбеддеры прогоняется вся кодовая база исходной ветки. Это даёт модели контекст проекта и повышает качество ревью, но увеличивает время обработки. Авторы признают: даже при асинхронной обработке ревью занимает заметное время, и оптимизация скорости остаётся в планах.
Для тех, кто выбирает между готовыми open-source решениями, команда составила сравнительную таблицу. PR-Agent поддерживает GitHub, GitLab, Bitbucket и Azure DevOps, интегрируется с JIRA и GitHub Issues, допускает кастомизацию инструкций. kodus-ai добавляет RAG по кодовой базе и интеграцию через MCP. github/ai-review проще в настройке, но не поддерживает корпоративную базу знаний. Большинство остальных решений работают только с GitHub и не имеют RAG.
Важный контекст: LLM-ревью в команде — не замена человеческому, а дополнение к уже выстроенным процессам. CI/CD, линтеры, форматтеры, единообразная архитектура и покрытие unit-тестами — всё это было на месте до появления Гефестыча. Автоматический ревьюер берёт на себя рутинные замечания, освобождая людей для содержательного обсуждения архитектурных решений.


