Claude Fable 5 в агентных циклах: самокоррекция и память через несколько сессий

Подготовлено редакцией Malakhov AI

Habr AI·11 июн.·3 минРоссияКод

Claude Fable 5 справился с инженерным челленджем Parameter Golf примерно в шесть раз лучше Opus 4.7 — при условии, что модель работает в петле самокоррекции с независимым агентом-оценщиком. Инженеры Anthropic описали два паттерна, которые раскрывают возможности моделей класса Mythos.

Кратко

—На задаче Parameter Golf (обучение модели в 16 МБ за 10 минут на 8×H100) Fable 5 превзошёл Opus 4.7 в ~6 раз.
—Fable 5 делал ставку на структурные изменения архитектуры, а не на скалярную настройку — и преодолевал просадки от квантизации.
—На бенчмарке Continual Learning Bench 1.0 покрытие верификации у Fable 5 достигало 73%, у Opus 4.7 — медиана около 17%.
—Агент-верификатор в отдельном контекстном окне работает лучше самокритики модели — это подтверждено экспериментально.
—Примитив /goal в Claude Code и система Outcomes в CMA автоматизируют петли самокоррекции без ручного промптинга.

Глоссарий · 7 терминов▾

Петля самокоррекции (loop): Агентный паттерн, при котором модель выполняет действие, получает оценку результата из среды и повторяет цикл до достижения заданного условия.
Claude Managed Agents (CMA): Инфраструктура Anthropic для запуска долгих агентных задач: предоставляет агентскую обвязку, песочницу и систему оценки результатов.
Outcomes: Компонент CMA, который автоматически запускает агент-оценщик в отдельном контекстном окне для верификации результатов работы основного агента.
Parameter Golf: Open-source ML-инженерный челлендж: цель — обучить лучшую модель, умещающуюся в 16 МБ, менее чем за 10 минут на кластере 8×H100.
Continual Learning Bench 1.0: Бенчмарк для оценки способности агентов накапливать и использовать знания между независимыми сессиями.
Дистилляция памяти: Шаг в работе с агентной памятью: обобщение верифицированного вывода в общее правило, применимое к будущим задачам.
/goal: Примитив в Claude Code, позволяющий задать условие завершения задачи и запустить петлю самокоррекции без ручного управления каждым шагом.

Модели класса Mythos — к которым относится Claude Fable 5 — проектировались с расчётом на агентную работу: длинные горизонты планирования, устойчивость к промежуточным неудачам, способность накапливать знания между сессиями. Два паттерна, описанных инженерами Anthropic, показывают, как именно это работает на практике.

Первый паттерн — петли самокоррекции (loops). Идея проста: модель делает шаг, получает обратную связь из среды, корректирует действия и повторяет цикл до выполнения условия. Примитив /goal в Claude Code реализует эту схему напрямую. Для теста использовался Parameter Golf — open-source ML-инженерный челлендж: нужно обучить лучшую модель, которая умещается в 16 МБ, менее чем за 10 минут на кластере 8×H100. Агент редактирует файл train_gpt.py, запускает обучение, считывает лог и решает, какой эксперимент запустить следующим. Fable 5 и Opus 4.7 запускались через Claude Managed Agents (CMA) с доступом к self-hosted песочнице на 8×H100, каждый тест длился до 8 часов.

Модель	Задача Parameter Golf	Стратегия экспериментов
Claude Fable 5	~в 6 раз лучше Opus 4.7	Крупные структурные изменения архитектуры
Opus 4.7	Базовый результат	Скалярная настройка констант

Результат: Fable 5 улучшил обучающий пайплайн примерно в шесть раз лучше Opus 4.7. Разница в стратегии оказалась показательной. Opus 4.7 после первого удачного эксперимента переходил к скалярной настройке — менял константы, измерял, сохранял положительный результат. Fable 5 делал ставку на крупные структурные изменения архитектуры и демонстрировал устойчивость: например, преодолевал просадку от квантизации на пути к большему выигрышу. Отдельный момент — оценка результатов. Авторы зафиксировали, что модели плохо справляются с самокритикой собственных выводов. Решение — агент-верификатор в независимом контекстном окне. Система Outcomes в CMA реализует это автоматически: оценщик подтверждал выполнение всех девяти критериев рубрики, прежде чем позволить Claude завершить работу.

Fable 5 делал ставку на структурные изменения архитектуры, а не на скалярную настройку — и преодолевал просадки от квантизации.

Второй паттерн — управление памятью между сессиями. Для теста использовался Continual Learning Bench 1.0, опубликованный командой Парта Асавы. Задача: агент отвечает на последовательные вопросы с доступом к SQL-базе данных, каждый вопрос — отдельная агентская сессия. Память реализована через примонтированную файловую систему, общую между сессиями. Авторы описывают пять шагов эффективной работы с памятью: зафиксировать ошибку, разобраться в причине, верифицировать диагноз, дистиллировать его в правило, обращаться к правилу в будущих сессиях вместо повторного вывода.

Sonnet 4.6 останавливается на первом шаге: хранит список ошибок и открытых предположений, к предыдущим заметкам почти не обращается. Opus 4.7 доходит примерно до третьего шага: формирует справочник по схеме с пометками неопределённости, но покрытие верификации остаётся низким — 7–33% вопросов, медиана около 17%. Fable 5 в лучших запусках проходит всю прогрессию: покрытие верификации достигает 73% (22 из 30 вопросов), а выводы дистиллируются в общие правила, применимые к будущим задачам.

Оба паттерна указывают на одну логику проектирования агентных систем с Fable 5: вместо детального промптинга и ручного управления шагами эффективнее строить циклы, в которых модель самостоятельно корректируется по обратной связи из среды и управляет собственным контекстом. Это смещает роль разработчика — от написания инструкций к проектированию петель обратной связи и систем оценки.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Продолжить по разделам

Claude Fable 5 в агентных циклах: самокоррекция и память через несколько сессий

Кратко

Читать дальше

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений