Правительство США отключило Claude Fable 5 и Mythos 5 из-за угроз безопасности

Подготовлено редакцией Malakhov AI

TechCrunch AI·13 июн.·3 минИндустрия

В пятницу, 21:21 по московскому времени, Anthropic получила от властей США предписание немедленно отключить две модели — Claude Fable 5 и Claude Mythos 5 — для всех пользователей мира. Компания выполнила требование, но публично заявила, что считает решение ошибочным.

Кратко

—Fable 5 вышла три дня назад и сразу стала самой мощной публично доступной моделью по данным Vals ИИ.
—Mythos 5 распространялась только среди ~50 проверенных организаций, включая Amazon, Apple, Google и Microsoft.
—Правительство сослалось на «потенциальный узкий джейлбрейк» Fable 5, предоставив лишь устные свидетельства.
—Anthropic утверждает, что аналогичные возможности уже есть в публичных моделях, в том числе в GPT-5.5 от OpenAI.
—Компания предупредила: если такой стандарт применить ко всей отрасли, новые модели перестанут выходить вовсе.

Глоссарий · 5 терминов▾

джейлбрейк: Техника обхода встроенных ограничений языковой модели с помощью специально сформулированных запросов, заставляющих модель выдавать ответы, которые она должна блокировать.
benchmark: Стандартизированный набор тестов для сравнения производительности ИИ-моделей по заданным критериям.
классификатор: Отдельная программная система, которая анализирует входящие запросы или исходящие ответы модели и блокирует нежелательный контент независимо от поведения самой модели.
экспортный контроль: Государственные ограничения на передачу технологий или доступ к ним для иностранных граждан или организаций по соображениям национальной безопасности.
Project Glasswing: Закрытая программа Anthropic, которой доступ к модели Mythos 5 предоставлялся ограниченному числу проверенных организаций исключительно для задач оборонительной кибербезопасности.

Предписание пришло в пятницу вечером: Anthropic обязали немедленно отключить Claude Fable 5 и Claude Mythos 5 для всех пользователей мира. Формально речь шла об экспортном контроле — ограничении доступа для иностранных граждан. На практике обе модели оказались недоступны глобально, включая американских пользователей. Доступ к остальным моделям Anthropic не затронут.

Чтобы понять масштаб произошедшего, нужно разобраться, что представляют собой эти модели. Mythos 5 — флагман Anthropic, который компания намеренно держала в закрытом доступе с момента анонса в начале апреля. Причина: модель продемонстрировала исключительную способность находить уязвимости в программном обеспечении — по данным Anthropic, она обнаружила бреши во всех протестированных крупных операционных системах и браузерах. Вместо публичного релиза компания запустила программу Project Glasswing: примерно 50 отобранных организаций, среди которых Amazon, Apple, Google, Microsoft и CrowdStrike, получили доступ к модели для оборонительной работы в сфере кибербезопасности.

Модель	Статус до отключения	Особенности	Доступность
Claude Mythos 5	Закрытый доступ с апреля	Находит уязвимости во всех протестированных ОС и браузерах	~50 организаций через Project Glasswing
Claude Fable 5	Публичный релиз (3 дня)	Mythos с ограничителями в кибербезопасности и биологии	Все пользователи, лучший публичный benchmark по Vals AI
GPT-5.5 (OpenAI)	Публично доступна	Сопоставимые возможности анализа кода, по заявлению Anthropic	Все пользователи, не затронута предписанием

Fable 5 появилась три дня назад как коммерческий ответ на очевидное давление рынка: по сути это Mythos с дополнительными ограничителями, блокирующими опасные ответы в областях кибербезопасности и биологии. По данным Vals ИИ — компании, отслеживающей производительность ИИ-систем на benchmark-тестах, — Fable 5 сразу стала самой мощной публично доступной моделью.

Mythos 5 распространялась только среди ~50 проверенных организаций, включая Amazon, Apple, Google и Microsoft.

Image Credits:Benjamin Girette/Bloomberg / Getty Images · Источник: TechCrunch AI

Однако именно Fable 5 оказалась в центре претензий. Anthropic пишет, что реальная причина предписания — заявленный джейлбрейк модели. При этом правительство предоставило лишь устные свидетельства «потенциального узкого, неуниверсального джейлбрейка». Как описывает его сама компания, речь идёт о том, что модель можно попросить проанализировать конкретную кодовую базу и найти в ней уязвимости. Anthropic настаивает: такой уровень возможностей уже присутствует в других публично доступных моделях, в том числе в GPT-5.5 от OpenAI, и регулярно используется специалистами по кибербезопасности в легитимных целях.

Технический аргумент компании строится на архитектуре защиты: ключевые ограничители работают через независимые классификаторы, отдельные от самой модели. По логике Anthropic, даже если пользователю удастся обойти отказ модели, глубинные механизмы защиты от наиболее опасных выводов остаются активными. Правительство этот аргумент не принял.

Антропик не скрывает недовольства. «Мы не согласны с тем, что обнаружение потенциального узкого джейлбрейка должно быть основанием для отзыва коммерческой модели, развёрнутой для сотен миллионов людей», — говорится в официальном заявлении компании. Там же звучит предупреждение: если применить этот стандарт ко всей отрасли, выпуск новых моделей всеми ведущими разработчиками фактически остановится.

Ситуация приобретает особую остроту на фоне корпоративной стратегии Anthropic. Компания давно позиционирует себя как «безопасную альтернативу» конкурентам и, по широко распространённым ожиданиям, готовится к IPO в этом году. Многомесячная кампания вокруг Mythos — с акцентом на исключительную опасность модели и необходимость жёсткого контроля — теперь обернулась против самой компании: именно эта риторика, судя по всему, привлекла пристальное внимание регуляторов.

Image Credits:Vals AI / · Источник: TechCrunch AI

Глава OpenAI Сэм Альтман ещё в апреле в разговоре с подкастером Эшли Вэнсом назвал подход Anthropic к Mythos «маркетингом, основанным на страхе». «Это явно блестящий маркетинг — сказать: мы создали бомбу, мы были готовы сбросить её вам на голову, мы продадим вам бомбоубежище за 100 миллионов», — цитирует его TechCrunch. Альтман не предсказывал государственного отключения, но точно уловил логику, которая теперь ударила по Anthropic: когда месяцами убеждаешь мир, что твой ИИ уникально опасен, мир — включая правительство — склонен прислушаться.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

Продолжить по разделам

Правительство США отключило Claude Fable 5 и Mythos 5 из-за угроз безопасности

Кратко

Читать дальше

NFC-ключ за $9: физический блокиратор отвлекающих приложений

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента