Встроенный Deep Research в ChatGPT и Claude удобен, но плохо поддаётся контролю: непонятно, сколько источников просмотрено, нельзя задать глубину анализа, а счётчик оставшихся запросов в ChatGPT вообще не отображается. Подписка уровня Pro стоит $100 в месяц — дорого, если нужна только эта функция. Разработчик mikemelanin решил собрать собственный инструмент на доступных API и опубликовал результат под названием Deep Research Codex.

Основа проекта — open-source библиотека GPT Researcher, поверх которой написан wrapper с собственным runner-ом. Для веб-поиска используется Tavily: это search API, ориентированный на agentic- и RAG-сценарии. У Tavily есть бесплатный стартовый уровень — регистрация без карты и API-кредиты на месяц, которых хватает для личных экспериментов. LLM-вызовы идут через AWS Bedrock и Claude через Bedrock — автор выбрал эту связку не из принципиальных соображений, а потому что там уже были доступные кредиты. GPT Researcher поддерживает других провайдеров, так что бэкенд можно заменить.

ПараметрЗначение по умолчаниюЧто задаёт
breadth4Ширина охвата темы — количество направлений
depth2Глубина погружения по каждой ветке
concurrency4Количество параллельно выполняемых задач

Рабочий процесс выглядит так: пользователь пишет запрос в Codex обычным языком, система сначала запускает prefilter — превращает сырой текст в структурированный бриф с темой, целью, контекстом, ключевыми вопросами и scope. Только после подтверждения стартует веб-поиск. Это позволяет остановиться до дорогого прогона, если система неверно поняла задачу.

Инструмент строится поверх open-source GPT Researcher с Tavily для веб-поиска и AWS Bedrock как LLM-бэкендом.

Три ключевых параметра управляют самим исследованием: breadth задаёт ширину охвата темы, depth — глубину погружения по каждой ветке, concurrency — количество параллельных задач. В дефолтном профиле стоят значения 4, 2 и 4 соответственно. Например, тема «ИИ-агенты в клиентской поддержке» распадается на ветки «экономика поддержки», «качество ответов», «интеграции», «риски» — и по каждой системa формирует уточняющие вопросы и follow-up направления. Итог собирается в markdown-отчёт со ссылками на источники.

Инструмент запускается как skill внутри Codex или напрямую через shell-скрипт research.sh. Поддерживаются флаги для генерации отчёта на русском языке (--ru), запуска только prefilter без веб-поиска (--prefilter-only), чтения задачи из файла (--file) и возобновления с сохранённого prefilter-состояния. Репозиторий опубликован на GitHub по адресу github.com/mikemelanin/deep-research-codex.

Подобные self-hosted решения появляются на фоне роста интереса к агентным системам: пользователи хотят контролировать не только результат, но и сам процесс — сколько источников просматривается, по каким веткам идёт поиск, сколько токенов тратится. Встроенные инструменты крупных платформ намеренно скрывают эти детали ради простоты. Deep Research Codex идёт в обратную сторону: меньше магии, больше воспроизводимости.