Платформа Claude Managed Agents, запущенная в апреле 2025 года, получила три новых инструмента, направленных на повышение надёжности ИИ-агентов в реальных задачах. Центральное место среди них занимает Dreaming — механизм, которого до сих пор не было в публичных агентных платформах крупных лабораторий.
Проблема, которую решает Dreaming, хорошо знакома разработчикам агентных систем: агент, выполняя однотипные задачи, раз за разом наступает на одни и те же грабли, потому что каждая сессия начинается с чистого листа. Долгосрочная память существует в разных реализациях, но механизма её систематической «очистки» и обогащения на основе накопленного опыта у большинства платформ нет. Dreaming закрывает этот пробел: процесс запускается асинхронно, читает существующее хранилище памяти и опционально до 100 прошлых сессий, удаляет дубликаты и устаревшие записи, а затем формирует новую, структурированную память. Исходное хранилище при этом остаётся нетронутым — откат возможен в любой момент. Поддерживаются модели Claude Opus 4.7 и Claude Sonnet 4.6; запустить процесс можно через интерфейс Claude Console, выбрав хранилище, модель и набор сессий для анализа.
| Функция | Статус | Ключевые параметры |
|---|---|---|
| Dreaming | Research preview (по заявке) | До 100 прошлых сессий; модели Opus 4.7 и Sonnet 4.6 |
| Outcomes | Публичная бета | До 20 попыток исправления; изолированный оценщик |
| Multiagent Orchestration | Публичная бета | До 20 агентов; до 25 параллельных потоков |
| Memory | Публичная бета | Общее хранилище памяти для агентов |
Второй инструмент — Outcomes — решает задачу верификации результатов. Разработчик описывает критерии успеха в виде рубрики: например, «CSV-файл содержит колонку price с числовыми значениями». Отдельный агент-оценщик проверяет выходные данные основного агента в изолированном контексте, не видя его цепочки рассуждений. Если результат не соответствует критериям, оценщик фиксирует расхождения и возвращает задачу на доработку. По умолчанию агент получает три попытки исправления, максимум — 20. Такой подход снижает риск «галлюцинаций» в финальном ответе: агент не может убедить оценщика логикой, которую тот просто не видит.
Outcomes позволяет задать рубрику успеха — отдельный оценщик проверяет результат агента и при несоответствии отправляет его на доработку до 20 раз.

Третий компонент — Multiagent Orchestration — переводит в публичную бету схему, при которой агент-координатор распределяет задачи между специализированными субагентами. Каждый субагент работает в собственном потоке с изолированным контекстом, своей системной инструкцией и набором инструментов, однако все они разделяют общую файловую систему. Координатор может раздавать задачи параллельно: например, одновременно отправить один агент на ревью кода, а другой — на написание тестов. Платформа поддерживает до 20 агентов и до 25 одновременных потоков.
Для отрасли эти изменения обозначают сдвиг в подходе к агентным системам: от одноразовых сессий — к агентам с накапливаемым опытом и встроенным контролем качества. Конкуренты Anthropic — OpenAI с платформой Assistants и Google с Agent Development Kit — также развивают инструменты для многоагентных сценариев, однако аналога Dreaming в их публичных продуктах пока нет. Dreaming остаётся в статусе research preview с доступом по заявке; остальные три функции — Outcomes, Multiagent Orchestration и Memory — открыты для всех разработчиков в рамках публичной беты.



