Anthropic объявила о снятии экспортных ограничений на модель Fable 5, введённых администрацией Трампа в начале июня. Компания начнёт восстановление доступа к модели в среду на платформах Claude, а затем — на AWS, Google Cloud и Microsoft Foundry. Решение было принято после нескольких недель переговоров с Министерством торговли США.

Ограничения коснулись как Fable 5, так и более мощной модели Mythos 5. Причиной стала обеспокоенность правительства возможностью jailbreak — обхода защитных механизмов модели. Конкретная уязвимость была выявлена специалистами Amazon. Чтобы устранить проблему, Anthropic обучила новый классификатор безопасности, который, по заявлению компании, блокирует 99% атак такого типа. При блокировке запрос автоматически перенаправляется на модель Opus 4.8, менее мощную, но с более жёсткими ограничениями.

Ранее администрация Трампа разрешила возврат Mythos 5, но только для предварительно одобренных организаций. Это решение совпало по времени с выходом GPT-5.6 от OpenAI, который также был запущен с поэтапным доступом. Anthropic планирует расширять доступ к

Компания усилила защиту от jailbreak с помощью нового классификатора, блокирующего 99% атак.

STKB364_CLAUDE_2_C_96d15c
STKB364_CLAUDE_2_C_96d15c · Источник: The Verge AI

Ситуация произошла в непростой для Anthropic период: компания готовится к первичному размещению акций (IPO) и ранее имела напряжённые отношения с властями из-за рисков в цепочке поставок. В блоге Anthropic сообщила о новых мерах по укреплению взаимодействия с правительством. Среди них — предрелизное тестирование моделей государственными партнёрами, оперативный обмен информацией о выявленных уязвимостях и создание добровольного стандарта безопасности для разработчиков frontier-моделей. Компания также выделит вычислительные ресурсы для тестирования и исследований.

«В отрасли ИИ пока нет консенсуса по оценке серьёзности jailbreak, — отметили в Anthropic. — Эта проблема станет более острой по мере появления новых моделей с мощными возможностями». Для решения этой задачи компания сотрудничает с Amazon, Microsoft и Google программы Project Glasswing.