Платформа Claude Managed Agents, запущенная в апреле 2025 года, получила три новых инструмента, направленных на повышение надёжности ИИ-агентов в реальных задачах. Центральное место среди них занимает Dreaming — механизм, которого до сих пор не было в публичных агентных платформах крупных лабораторий.

Проблема, которую решает Dreaming, хорошо знакома разработчикам агентных систем: агент, выполняя однотипные задачи, раз за разом наступает на одни и те же грабли, потому что каждая сессия начинается с чистого листа. Долгосрочная память существует в разных реализациях, но механизма её систематической «очистки» и обогащения на основе накопленного опыта у большинства платформ нет. Dreaming закрывает этот пробел: процесс запускается асинхронно, читает существующее хранилище памяти и опционально до 100 прошлых сессий, удаляет дубликаты и устаревшие записи, а затем формирует новую, структурированную память. Исходное хранилище при этом остаётся нетронутым — откат возможен в любой момент. Поддерживаются модели Claude Opus 4.7 и Claude Sonnet 4.6; запустить процесс можно через интерфейс Claude Console, выбрав хранилище, модель и набор сессий для анализа.

ФункцияСтатусКлючевые параметры
DreamingResearch preview (по заявке)До 100 прошлых сессий; модели Opus 4.7 и Sonnet 4.6
OutcomesПубличная бетаДо 20 попыток исправления; изолированный оценщик
Multiagent OrchestrationПубличная бетаДо 20 агентов; до 25 параллельных потоков
MemoryПубличная бетаОбщее хранилище памяти для агентов

Второй инструмент — Outcomes — решает задачу верификации результатов. Разработчик описывает критерии успеха в виде рубрики: например, «CSV-файл содержит колонку price с числовыми значениями». Отдельный агент-оценщик проверяет выходные данные основного агента в изолированном контексте, не видя его цепочки рассуждений. Если результат не соответствует критериям, оценщик фиксирует расхождения и возвращает задачу на доработку. По умолчанию агент получает три попытки исправления, максимум — 20. Такой подход снижает риск «галлюцинаций» в финальном ответе: агент не может убедить оценщика логикой, которую тот просто не видит.

Outcomes позволяет задать рубрику успеха — отдельный оценщик проверяет результат агента и при несоответствии отправляет его на доработку до 20 раз.

Image description
Image description · Источник: The Decoder

Третий компонент — Multiagent Orchestration — переводит в публичную бету схему, при которой агент-координатор распределяет задачи между специализированными субагентами. Каждый субагент работает в собственном потоке с изолированным контекстом, своей системной инструкцией и набором инструментов, однако все они разделяют общую файловую систему. Координатор может раздавать задачи параллельно: например, одновременно отправить один агент на ревью кода, а другой — на написание тестов. Платформа поддерживает до 20 агентов и до 25 одновременных потоков.

Для отрасли эти изменения обозначают сдвиг в подходе к агентным системам: от одноразовых сессий — к агентам с накапливаемым опытом и встроенным контролем качества. Конкуренты Anthropic — OpenAI с платформой Assistants и Google с Agent Development Kit — также развивают инструменты для многоагентных сценариев, однако аналога Dreaming в их публичных продуктах пока нет. Dreaming остаётся в статусе research preview с доступом по заявке; остальные три функции — Outcomes, Multiagent Orchestration и Memory — открыты для всех разработчиков в рамках публичной беты.