ИИ-ревьюер кода за 3 дня: как Content ИИ встроил агента в Pull Request

Подготовлено редакцией Malakhov AI

Habr AI·11 июн.·2 минРоссияКод

Команда Content ИИ собрала ИИ-ревьюера кода и встроила его в процесс Pull Request за три дня — без готовых SaaS-сервисов, на собственной интеграционной прослойке поверх LLM-агента. Спустя месяц использования стало понятно, что качество замечаний зависит не от модели, а от объёма контекста, который ей передают.

Кратко

—Инструмент запускается как отдельный шаг CI/CD на каждый Pull Request и оставляет inline-комментарии с уровнями критичности: critical, major, minor, info.
—Архитектура: Python-скрипт в Docker-контейнере забирает diff через API, передаёт контекст LLM-агенту в non-interactive режиме и публикует ответ обратно в PR.
—Structured output в формате JSON — обязательное условие: без него нельзя стабильно парсить ответ и привязывать замечания к конкретным строкам diff.
—Режим передачи полных файлов (не только diff) дал заметно лучшее качество замечаний; следующий шаг — работа с полным репозиторием при условии умного кэширования.
—ИИ-ревьюер не блокирует merge: разработчик может согласиться с замечанием, исправить код или закрыть его как нерелевантное.

Глоссарий · 6 терминов▾

non-interactive mode: Режим работы ИИ-агента, при котором ему передают промпт и получают ответ без ручного диалога — удобно для автоматизации в CI/CD.
structured output: Формат ответа модели в виде строго заданной структуры (например, JSON), который можно надёжно разобрать программно без ручного парсинга текста.
diff: Файл с изменениями кода: показывает, какие строки были добавлены, удалены или изменены Pull Request.
inline-комментарий: Замечание, привязанное к конкретной строке или диапазону строк в коде, отображается прямо в интерфейсе Pull Request.
gatekeeper: Роль инструмента или проверки, без прохождения которой невозможно слить код в основную ветку.
CI/CD: Непрерывная интеграция и доставка — автоматизированный конвейер сборки, тестирования и развёртывания кода при каждом изменении.

Автоматизировать код-ревью с помощью ИИ пробуют многие команды, но большинство упирается в одно: готовые сервисы заточены под GitHub и GitLab, а корпоративные CI/CD-системы остаются за бортом. Команда Content ИИ обошла это ограничение, написав тонкую интеграционную прослойку поверх уже используемого внутри компании LLM-агента.

Архитектура MVP намеренно простая. На каждый Pull Request в CI запускается отдельный шаг: Docker-контейнер с Python-инструментом забирает через API diff и метаданные PR, собирает контекст, передаёт его LLM-агенту в non-interactive режиме и публикует ответ обратно в PR в виде inline-комментариев. Python-обвязка при этом ничего не знает про ревью кода — она только готовит контекст и парсит ответ. Вся «ревьюерская» логика живёт в промпте и в модели. Такое разделение позволяет менять LLM без переписывания инфраструктуры.

Режим контекста	Стоимость по токенам	Качество замечаний	Статус
Только diff	Минимальная	Низкое — модель не видит окружающий код	Используется
Полные файлы с изменениями	Средняя	Заметно выше — видны соседние методы и контекст вызова	Используется
Полный репозиторий	Высокая	Ожидается максимальное	Запланировано, заблокировано размером репо

Одним из ключевых инженерных решений стал structured output: модель возвращает строго JSON с полями summary, file_path, line_start, line_end и severity. Это решает сразу несколько проблем — ответ стабильно парсится, замечание можно точно привязать к строкам diff и подсветить прямо в интерфейсе PR, а уровни критичности (critical, major, minor, info) дают разработчику понятный приоритет. Без структурированного вывода построить полноценный инструмент практически невозможно: свободный текст модели нельзя надёжно разобрать на отдельные замечания.

Промпт у команды базовый: модель просят сосредоточиться на багах, логических ошибках, проблемах безопасности и качества кода, игнорировать стилистику и форматирование, писать комментарии по-русски. Но быстро выяснилось, что качество замечаний определяется не столько формулировками промпта, сколько тем, сколько контекста получает модель. Команда протестировала три режима: только diff (дёшево, но модель «слепа» к окружающему коду), полные файлы с изменениями (хороший компромисс — модель видит соседние методы и контекст вызова) и полный репозиторий (запланированный следующий шаг, пока заблокирован размером репо в несколько гигабайт).

Главный вывод месяца использования: когда ИИ-ревьюер ошибается, причина почти всегда не в качестве модели, а в недостатке контекста. Типичный пример — внутренние библиотеки с названиями функций, похожими на стандартные, но с другим поведением. Модель, не зная об этом, генерирует ложные замечания. Решение — давать больше контекста, а не менять модель.

С точки зрения процесса инструмент сделан ассистентом, а не блокировщиком: шаг ИИ-ревью обязателен к запуску хотя бы раз, но не блокирует merge. Разработчик может согласиться с замечанием, поправить код или закрыть его как нерелевантное. Это осознанный выбор: пока у модели есть ложные срабатывания, превращать её в жёсткий gatekeeper нельзя. Переход к более строгой роли возможен по мере накопления данных о точности замечаний и снижения доли ошибок.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Продолжить по разделам

ИИ-ревьюер кода за 3 дня: как Content ИИ встроил агента в Pull Request

Кратко

Читать дальше

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений