Встроенный Deep Research в ChatGPT и Claude удобен, но плохо поддаётся контролю: непонятно, сколько источников просмотрено, нельзя задать глубину анализа, а счётчик оставшихся запросов в ChatGPT вообще не отображается. Подписка уровня Pro стоит $100 в месяц — дорого, если нужна только эта функция. Разработчик mikemelanin решил собрать собственный инструмент на доступных API и опубликовал результат под названием Deep Research Codex.
Основа проекта — open-source библиотека GPT Researcher, поверх которой написан wrapper с собственным runner-ом. Для веб-поиска используется Tavily: это search API, ориентированный на agentic- и RAG-сценарии. У Tavily есть бесплатный стартовый уровень — регистрация без карты и API-кредиты на месяц, которых хватает для личных экспериментов. LLM-вызовы идут через AWS Bedrock и Claude через Bedrock — автор выбрал эту связку не из принципиальных соображений, а потому что там уже были доступные кредиты. GPT Researcher поддерживает других провайдеров, так что бэкенд можно заменить.
| Параметр | Значение по умолчанию | Что задаёт |
|---|---|---|
| breadth | 4 | Ширина охвата темы — количество направлений |
| depth | 2 | Глубина погружения по каждой ветке |
| concurrency | 4 | Количество параллельно выполняемых задач |
Рабочий процесс выглядит так: пользователь пишет запрос в Codex обычным языком, система сначала запускает prefilter — превращает сырой текст в структурированный бриф с темой, целью, контекстом, ключевыми вопросами и scope. Только после подтверждения стартует веб-поиск. Это позволяет остановиться до дорогого прогона, если система неверно поняла задачу.
Инструмент строится поверх open-source GPT Researcher с Tavily для веб-поиска и AWS Bedrock как LLM-бэкендом.
Три ключевых параметра управляют самим исследованием: breadth задаёт ширину охвата темы, depth — глубину погружения по каждой ветке, concurrency — количество параллельных задач. В дефолтном профиле стоят значения 4, 2 и 4 соответственно. Например, тема «ИИ-агенты в клиентской поддержке» распадается на ветки «экономика поддержки», «качество ответов», «интеграции», «риски» — и по каждой системa формирует уточняющие вопросы и follow-up направления. Итог собирается в markdown-отчёт со ссылками на источники.
Инструмент запускается как skill внутри Codex или напрямую через shell-скрипт research.sh. Поддерживаются флаги для генерации отчёта на русском языке (--ru), запуска только prefilter без веб-поиска (--prefilter-only), чтения задачи из файла (--file) и возобновления с сохранённого prefilter-состояния. Репозиторий опубликован на GitHub по адресу github.com/mikemelanin/deep-research-codex.
Подобные self-hosted решения появляются на фоне роста интереса к агентным системам: пользователи хотят контролировать не только результат, но и сам процесс — сколько источников просматривается, по каким веткам идёт поиск, сколько токенов тратится. Встроенные инструменты крупных платформ намеренно скрывают эти детали ради простоты. Deep Research Codex идёт в обратную сторону: меньше магии, больше воспроизводимости.


