Паттерн двух окон: как разделить роли архитектора и разработчика между ИИ-агентами

Habr AI·7 мая·2 минРоссияКод

Claude Code в роли разработчика и GPT-5.5 в роли архитектора — такая связка позволяет ловить дыры в ТЗ до начала реализации и выходить из дебаг-тупиков, в которые один агент заводит сам себя. Суть паттерна — не в выборе модели, а в жёстком разделении ролей между двумя независимыми сессиями.

Кратко

—Один LLM-агент в одной сессии накапливает инерцию и защищает однажды выбранное решение — свежего взгляда от него не получить.
—Окно архитектора настраивается на скептицизм: ревьюит ТЗ, ловит противоречия, задаёт уточняющие вопросы — и не пишет код.
—Окно разработчика (например, Claude Code) работает с кодовой базой, ведёт многошаговые рефакторинги и выполняет команды через инструменты.
—Схема работает и на одной модели — два Claude с разными системными промптами — и в смешанном варианте с разными моделями.
—На рутинных задачах (утилитные скрипты, мелкие правки) двойная схема избыточна: накладные расходы на координацию превышают пользу.

Глоссарий · 6 терминов▾

LLM-агент: Языковая модель, которой дан доступ к инструментам (файлам, терминалу, API) и которая выполняет многошаговые задачи автономно, а не просто отвечает на вопросы.
Системный промпт: Инструкция, которая задаётся модели до начала диалога и определяет её роль, стиль и ограничения на протяжении всей сессии.
MCP-сервер: Model Context Protocol — стандарт подключения внешних инструментов (файловой системы, баз данных, API) к ИИ-агенту, позволяющий модели выполнять действия за пределами текстового диалога.
Claude Code: Версия модели Claude от Anthropic, оптимизированная для работы с кодовыми базами: чтения репозиториев, рефакторинга и выполнения команд через инструменты.
Acceptance criteria: Критерии приёмки — конкретные условия, при выполнении которых задача считается завершённой; часть технического задания.
Edge case: Граничный сценарий — нетипичная или крайняя ситуация, которую система должна обрабатывать корректно, но которую легко упустить при проектировании.

Разработчики, которые работают с ИИ-агентами на постоянной основе, рано или поздно замечают одну и ту же проблему: агент, начавший двигаться в сторону решения X, будет уточнять X, защищать X и искать аргументы за X. Это не дефект конкретной модели — это системное свойство любого LLM, работающего в одной сессии. Контекст накапливается, инерция растёт, дистанция исчезает.

Паттерн двух окон решает эту проблему через разделение ролей. В одном окне — агент-архитектор, чья задача сводится к критике: он читает ТЗ, ищет противоречия, задаёт уточняющие вопросы и не пишет ни строчки кода. Системный промпт настраивается явно на скептицизм. В другом окне — агент-разработчик, который работает с кодовой базой: читает репозиторий, ведёт многошаговые рефакторинги, правит файлы, взаимодействует с инструментами через MCP-серверы, терминал и git. Между двумя окнами нет общего контекста — и это намеренно: каждый агент смотрит на задачу свежо.

Окно	Модель (пример)	Задачи	Чего не делает
Архитектор	GPT-5.5 (высокое мышление)	Ревью ТЗ, поиск противоречий, уточняющие вопросы, критика архитектуры, свежий взгляд при дебаге	Не пишет код, не имплементирует
Разработчик	Claude Code	Чтение кодовой базы, рефакторинги, правка файлов, работа с инструментами (git, терминал, MCP)	Не критикует ТЗ, не задаёт архитектурных вопросов

Автор паттерна использует Claude Code в роли разработчика и GPT-5.5 в режиме высокого мышления в роли архитектора. Выбор объясняется разным «характером» моделей по умолчанию: GPT-5.5 в режиме высокого мышления берёт паузу и разбирает проблему подробно, тогда как Claude Code склонен к быстрому «понял, делаю». Впрочем, схема работает и на одной модели — два экземпляра Claude с разными системными промптами дают сопоставимый результат.

Окно архитектора настраивается на скептицизм: ревьюит ТЗ, ловит противоречия, задаёт уточняющие вопросы — и не пишет код.

Практически окно архитектора закрывает несколько сценариев. Главный — ревью ТЗ до начала реализации: размытые acceptance criteria («система должна работать быстро» — насколько быстро?), противоречия между секциями, забытые сценарии ошибок, вопросы «что если null?» и «что если двое одновременно?». Агент-разработчик в той же роли работает мягче — он оптимизирован на то, чтобы помочь сделать, и чаще латает дыры в ТЗ догадками вместо того чтобы остановиться и спросить. Второй сценарий — выход из дебаг-тупика: когда час ушёл на одну логическую ветку гипотез и она не работает, описание проблемы в чистое окно архитектора без накопленного контекста часто даёт угол, который в первом окне не рассматривался. Третий — критика архитектурных решений на уровне словесного описания подхода, до написания кода.

Схема не универсальна. На рутинных задачах — утилитные скрипты на час, понятные тесты, мелкие правки в существующих фичах, эксплоративный код на этапе «попробовать-выкинуть» — накладные расходы на координацию двух агентов превышают пользу. Координация занимает 5–10 минут на цикл: автор передаёт информацию между окнами вручную, не прокидывая переписку целиком. На крупной задаче это время растворяется; на мелкой — ощутимо.

Стоимость схемы — две подписки или удвоенные токены. По оценке автора, она окупается одной поломкой в продакшене, которую архитектор поймал на этапе ТЗ. Следующий логичный шаг, который он пока не тестировал, — третье окно с ролью «безопасника» или «продуктовика»: первый смотрит на систему с позиции «как это сломать», второй спрашивает «а зачем это вообще нужно».

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Читать также

Habr AI·3 часа назад

Норны из Creatures: как британский программист-самоучка строил искусственную жизнь в 90-х

«Архитех ИИ» выпустила российский аналог OpenRouter с защитой персональных данных

Россия

CNews·8 часов назад

«Архитех ИИ» выпустила российский аналог OpenRouter с защитой персональных данных

Брокман раскрыл долю в OpenAI на $30 млрд — в ходе суда по иску Маска

Стартапы

RB.ru·2 дня назад

Брокман раскрыл долю в OpenAI на $30 млрд — в ходе суда по иску Маска

Продолжить по разделам