Самодельный Deep Research поверх GPT Researcher и Codex

Подготовлено редакцией Malakhov AI

Habr AI·17 июн.·2 минРоссияКод

Разработчик под ником mikemelanin опубликовал на Habr инструкцию по сборке локального аналога Deep Research на базе open-source библиотеки GPT Researcher — с управляемыми параметрами поиска и запуском через Codex. Проект решает проблему лимитов и непрозрачности встроенных функций ChatGPT и Claude.

Кратко

—Встроенный Deep Research в ChatGPT стоит от $100/мес, а лимиты запросов нигде не отображаются.
—Инструмент строится поверх open-source GPT Researcher с Tavily для веб-поиска и AWS Bedrock как LLM-бэкендом.
—Параметры breadth, depth и concurrency позволяют явно задавать ширину и глубину исследования.
—Перед запуском веб-поиска система формирует prefilter-бриф: тема, цель, ключевые вопросы, scope.
—Репозиторий доступен на GitHub, Tavily предоставляет бесплатные API-кредиты без привязки карты.

Глоссарий · 7 терминов▾

Deep Research: Режим работы ИИ-ассистента, при котором система самостоятельно разбивает тему на подвопросы, ищет информацию в нескольких источниках и собирает структурированный отчёт — в отличие от одного быстрого ответа.
GPT Researcher: Open-source библиотека на Python, реализующая автономный агент для веб-исследований: разбивает запрос на подзадачи, ищет источники и синтезирует итоговый отчёт.
Tavily: Search API, оптимизированный для использования в агентных системах и RAG-пайплайнах: возвращает структурированные результаты поиска, удобные для дальнейшей обработки LLM.
AWS Bedrock: Облачный сервис Amazon, предоставляющий доступ к различным LLM — в том числе Claude от Anthropic — через единый API без необходимости разворачивать модели самостоятельно.
RAG: Retrieval-Augmented Generation — подход, при котором LLM перед генерацией ответа получает релевантные фрагменты из внешних источников, что снижает число ошибок и галлюцинаций.
Codex: Агентная среда OpenAI для написания и выполнения кода, поддерживающая пользовательские skills — внешние скрипты, которые можно вызывать из чата обычным языком.
prefilter: Предварительный шаг в Deep Research Codex, на котором система преобразует свободный запрос пользователя в структурированный бриф перед запуском веб-поиска.

Встроенный Deep Research в ChatGPT и Claude удобен, но плохо поддаётся контролю: непонятно, сколько источников просмотрено, нельзя задать глубину анализа, а счётчик оставшихся запросов в ChatGPT вообще не отображается. Подписка уровня Pro стоит $100 в месяц — дорого, если нужна только эта функция. Разработчик mikemelanin решил собрать собственный инструмент на доступных API и опубликовал результат под названием Deep Research Codex.

Основа проекта — open-source библиотека GPT Researcher, поверх которой написан wrapper с собственным runner-ом. Для веб-поиска используется Tavily: это search API, ориентированный на agentic- и RAG-сценарии. У Tavily есть бесплатный стартовый уровень — регистрация без карты и API-кредиты на месяц, которых хватает для личных экспериментов. LLM-вызовы идут через AWS Bedrock и Claude через Bedrock — автор выбрал эту связку не из принципиальных соображений, а потому что там уже были доступные кредиты. GPT Researcher поддерживает других провайдеров, так что бэкенд можно заменить.

Параметр	Значение по умолчанию	Что задаёт
breadth	4	Ширина охвата темы — количество направлений
depth	2	Глубина погружения по каждой ветке
concurrency	4	Количество параллельно выполняемых задач

Рабочий процесс выглядит так: пользователь пишет запрос в Codex обычным языком, система сначала запускает prefilter — превращает сырой текст в структурированный бриф с темой, целью, контекстом, ключевыми вопросами и scope. Только после подтверждения стартует веб-поиск. Это позволяет остановиться до дорогого прогона, если система неверно поняла задачу.

Инструмент строится поверх open-source GPT Researcher с Tavily для веб-поиска и AWS Bedrock как LLM-бэкендом.

Три ключевых параметра управляют самим исследованием: breadth задаёт ширину охвата темы, depth — глубину погружения по каждой ветке, concurrency — количество параллельных задач. В дефолтном профиле стоят значения 4, 2 и 4 соответственно. Например, тема «ИИ-агенты в клиентской поддержке» распадается на ветки «экономика поддержки», «качество ответов», «интеграции», «риски» — и по каждой системa формирует уточняющие вопросы и follow-up направления. Итог собирается в markdown-отчёт со ссылками на источники.

Инструмент запускается как skill внутри Codex или напрямую через shell-скрипт research.sh. Поддерживаются флаги для генерации отчёта на русском языке (--ru), запуска только prefilter без веб-поиска (--prefilter-only), чтения задачи из файла (--file) и возобновления с сохранённого prefilter-состояния. Репозиторий опубликован на GitHub по адресу github.com/mikemelanin/deep-research-codex.

Подобные self-hosted решения появляются на фоне роста интереса к агентным системам: пользователи хотят контролировать не только результат, но и сам процесс — сколько источников просматривается, по каким веткам идёт поиск, сколько токенов тратится. Встроенные инструменты крупных платформ намеренно скрывают эти детали ради простоты. Deep Research Codex идёт в обратную сторону: меньше магии, больше воспроизводимости.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Червь для Microsoft Copilot распространяется через скрытый текст в документах Word

Продолжить по разделам

Самодельный Deep Research поверх GPT Researcher и Codex

Кратко

Читать дальше

7 месяцев вайбкодинга: один разработчик, семь проектов и 3 тысячи пользователей

«Мои слова должны быть моими»: Хэнк Грин о нездоровом использовании ИИ

Червь для Microsoft Copilot распространяется через скрытый текст в документах Word