Предписание пришло в пятницу вечером: Anthropic обязали немедленно отключить Claude Fable 5 и Claude Mythos 5 для всех пользователей мира. Формально речь шла об экспортном контроле — ограничении доступа для иностранных граждан. На практике обе модели оказались недоступны глобально, включая американских пользователей. Доступ к остальным моделям Anthropic не затронут.
Чтобы понять масштаб произошедшего, нужно разобраться, что представляют собой эти модели. Mythos 5 — флагман Anthropic, который компания намеренно держала в закрытом доступе с момента анонса в начале апреля. Причина: модель продемонстрировала исключительную способность находить уязвимости в программном обеспечении — по данным Anthropic, она обнаружила бреши во всех протестированных крупных операционных системах и браузерах. Вместо публичного релиза компания запустила программу Project Glasswing: примерно 50 отобранных организаций, среди которых Amazon, Apple, Google, Microsoft и CrowdStrike, получили доступ к модели для оборонительной работы в сфере кибербезопасности.
| Модель | Статус до отключения | Особенности | Доступность |
|---|---|---|---|
| Claude Mythos 5 | Закрытый доступ с апреля | Находит уязвимости во всех протестированных ОС и браузерах | ~50 организаций через Project Glasswing |
| Claude Fable 5 | Публичный релиз (3 дня) | Mythos с ограничителями в кибербезопасности и биологии | Все пользователи, лучший публичный benchmark по Vals AI |
| GPT-5.5 (OpenAI) | Публично доступна | Сопоставимые возможности анализа кода, по заявлению Anthropic | Все пользователи, не затронута предписанием |
Fable 5 появилась три дня назад как коммерческий ответ на очевидное давление рынка: по сути это Mythos с дополнительными ограничителями, блокирующими опасные ответы в областях кибербезопасности и биологии. По данным Vals ИИ — компании, отслеживающей производительность ИИ-систем на benchmark-тестах, — Fable 5 сразу стала самой мощной публично доступной моделью.
Mythos 5 распространялась только среди ~50 проверенных организаций, включая Amazon, Apple, Google и Microsoft.

Однако именно Fable 5 оказалась в центре претензий. Anthropic пишет, что реальная причина предписания — заявленный джейлбрейк модели. При этом правительство предоставило лишь устные свидетельства «потенциального узкого, неуниверсального джейлбрейка». Как описывает его сама компания, речь идёт о том, что модель можно попросить проанализировать конкретную кодовую базу и найти в ней уязвимости. Anthropic настаивает: такой уровень возможностей уже присутствует в других публично доступных моделях, в том числе в GPT-5.5 от OpenAI, и регулярно используется специалистами по кибербезопасности в легитимных целях.
Технический аргумент компании строится на архитектуре защиты: ключевые ограничители работают через независимые классификаторы, отдельные от самой модели. По логике Anthropic, даже если пользователю удастся обойти отказ модели, глубинные механизмы защиты от наиболее опасных выводов остаются активными. Правительство этот аргумент не принял.
Антропик не скрывает недовольства. «Мы не согласны с тем, что обнаружение потенциального узкого джейлбрейка должно быть основанием для отзыва коммерческой модели, развёрнутой для сотен миллионов людей», — говорится в официальном заявлении компании. Там же звучит предупреждение: если применить этот стандарт ко всей отрасли, выпуск новых моделей всеми ведущими разработчиками фактически остановится.
Ситуация приобретает особую остроту на фоне корпоративной стратегии Anthropic. Компания давно позиционирует себя как «безопасную альтернативу» конкурентам и, по широко распространённым ожиданиям, готовится к IPO в этом году. Многомесячная кампания вокруг Mythos — с акцентом на исключительную опасность модели и необходимость жёсткого контроля — теперь обернулась против самой компании: именно эта риторика, судя по всему, привлекла пристальное внимание регуляторов.

Глава OpenAI Сэм Альтман ещё в апреле в разговоре с подкастером Эшли Вэнсом назвал подход Anthropic к Mythos «маркетингом, основанным на страхе». «Это явно блестящий маркетинг — сказать: мы создали бомбу, мы были готовы сбросить её вам на голову, мы продадим вам бомбоубежище за 100 миллионов», — цитирует его TechCrunch. Альтман не предсказывал государственного отключения, но точно уловил логику, которая теперь ударила по Anthropic: когда месяцами убеждаешь мир, что твой ИИ уникально опасен, мир — включая правительство — склонен прислушаться.



