Claude Mythos: утечки, блокировки и «ИИ по паспорту»

Подготовлено редакцией Malakhov AI

Habr AI·13 июн.·3 минРоссияКод

12 июня правительство США направило Anthropic директиву об экспортном контроле — и компания отключила модели Fable 5 и Mythos 5 для всех клиентов разом, включая собственных сотрудников с иностранным паспортом. История запуска кибербезопасностной модели за три месяца прошла путь от утечки черновиков до государственного рубильника.

Кратко

—В конце марта сайт Anthropic случайно открыл публичный доступ к 3000 неопубликованных файлов, включая черновики с оценкой киберрисков модели.
—7 апреля запустили Claude Mythos Preview проекта Glasswing: $100 млн, 11 корпоративных партнёров, 40 отобранных организаций.
—К 26 мая модель нашла 10 000+ критических уязвимостей в «критичном софте», однако публичная версия Fable 5 отказывалась выполнять даже базовые задачи.
—12 июня директива об экспортном контроле вынудила Anthropic отключить обе модели для всех пользователей — разделить граждан и иностранцев в облаке в реальном времени оказалось невозможно.
—Поводом для директивы стал «метод обхода» — модель попросили прочитать кодовую базу и найти баги, что, по признанию самой компании, делает и публичный GPT-5.5.

Глоссарий · 7 терминов▾

Mythos / Claude Mythos: Специализированная языковая модель Anthropic, разработанная для задач кибербезопасности: поиска уязвимостей в программном коде и анализа защищённости систем.
Fable 5: Публичная версия модели Mythos с расширенными защитными фильтрами, выпущенная 9 июня 2025 года для широкой аудитории.
Glasswing: Закрытый партнёрский проект Anthropic, которого сорок отобранных организаций получили привилегированный доступ к полной версии Mythos.
Экспортный контроль: Государственный механизм ограничения передачи технологий, товаров или услуг иностранным лицам и организациям по соображениям национальной безопасности.
Data lake: Хранилище данных, где файлы хранятся в исходном формате без предварительной структуризации; при неправильной настройке прав доступа может стать публично индексируемым.
Zero-day: Уязвимость в программном обеспечении, о которой разработчик ещё не знает и для которой не выпущено исправление.
ProgramBench: Набор тестовых задач для оценки способности языковых моделей писать и анализировать программный код.

Запуск Claude Mythos — кибербезопасностной модели Anthropic — начался с конфуза: в конце марта сайт компании случайно открыл публичный доступ к трём тысячам неопубликованных файлов. Черновики, PDF-документы и изображения попали в открытый индексируемый data lake. Обнаружили их не злоумышленники, а исследователи из LayerX и Кембриджского университета — просто изучая публично доступные ресурсы. Издание Fortune опубликовало детали. В черновиках значилось, что модель «несёт беспрецедентные киберриски». Компания, позиционирующая себя как эталон безопасного ИИ, слила собственные материалы через уязвимость на собственном сайте.

7 апреля состоялся официальный запуск Claude Mythos Preview проекта Glasswing. Anthropic объявила о $100 млн инвестиций, одиннадцати корпоративных партнёрах — AWS, Apple, Cisco, Google, Microsoft, NVIDIA, Palo Alto Networks и других — и сорока «избранных» организациях с привилегированным доступом. К 26 мая модель, по заявлению компании, выявила более 10 000 критических уязвимостей в критически важном программном обеспечении. Глава Palo Alto Networks назвал альянс «важнейшим в сфере кибербезопасности со времён создания CISA». Публичная версия — Fable 5 — вышла 9 июня и немедленно вызвала волну критики.

Дата	Событие
Конец марта	Утечка 3000 файлов с сайта Anthropic, обнаружена исследователями LayerX и Кембриджа
7 апреля	Официальный запуск Claude Mythos Preview, проект Glasswing, $100 млн, 11 партнёров
26 мая	Объявлено об обнаружении 10 000+ критических уязвимостей
9 июня	Публичный выпуск Fable 5 с расширенными фильтрами безопасности
12 июня, 17:21 ET	Директива правительства США об экспортном контроле; Anthropic отключает Fable 5 и Mythos 5 для всех пользователей

Fable 5 оказалась настолько жёстко ограничена защитными фильтрами, что пользователи сообщали об отказах при попытке отредактировать резюме с должностью «Application Security Architect», обсудить слово «рак» в медицинском контексте или выполнить все 200 задач бенчмарка ProgramBench. Модель молча перенаправляла запросы на более старые версии. Anthropic признала, что «сделала неправильный выбор», и пообещала сделать отказы явными — то есть вместо молчаливого переключения пользователь теперь получает уведомление об отказе. Часть аудитории переключилась на конкурирующие решения, в частности на OpenAI Codex.

7 апреля запустили Claude Mythos Preview проекта Glasswing: $100 млн, 11 корпоративных партнёров, 40 отобранных организаций.

12 июня в 17:21 по восточному времени правительство США направило Anthropic директиву об экспортном контроле: отключить Fable 5 и Mythos 5 для всех иностранных пользователей — как находящихся внутри страны, так и за её пределами, включая сотрудников самой Anthropic с иностранным гражданством. Поскольку разделить пользователей по паспорту в облачной инфраструктуре в реальном времени технически невозможно, компания отключила обе модели для всех клиентов без исключения. По словам Anthropic, поводом послужил «метод обхода» защиты Fable 5 — модель попросили прочитать кодовую базу и исправить ошибки. Найденные уязвимости, как признала сама компания, давно известны и регулярно обнаруживаются публичным GPT-5.5 и независимыми исследователями безопасности.

История Mythos обнажает структурное противоречие, которое не решается маркетингом. Поиск уязвимостей дешевле и быстрее их устранения — это не оценочное суждение, а математика наступательной и оборонительной асимметрии в кибербезопасности. Mythos автоматизировал атакующую сторону уравнения, но щит по-прежнему запаздывает. При этом доступ к инструменту оказался жёстко стратифицирован: сорок организаций получили полноценную модель, широкая аудитория — версию с многочисленными ограничениями, а 12 июня выяснилось, что доступ к ИИ-инструментам кибербезопасности определяется не законодательством страны пользователя и не политикой компании-разработчика, а директивой чужого правительства, которое может отозвать доступ за пятнадцать минут без публичного объяснения технических деталей.

Для российского рынка и отечественных разработчиков ситуация имеет прямое практическое измерение. Любая организация, встроившая в свои процессы инструменты на базе моделей Anthropic или аналогичных американских провайдеров, получила наглядную демонстрацию: зависимость от внешней инфраструктуры означает, что рубильник находится не в руках пользователя. Это касается не только кибербезопасности — любой НИОКР, завязанный на облачные API иностранных LLM, несёт аналогичный операционный риск. Развитие собственных моделей — YandexGPT, GigaChat и их будущих итераций — из опции превращается в вопрос непрерывности работы.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Продолжить по разделам

Claude Mythos: утечки, блокировки и «ИИ по паспорту»

Кратко

Читать дальше

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений