Запуск Claude Mythos — кибербезопасностной модели Anthropic — начался с конфуза: в конце марта сайт компании случайно открыл публичный доступ к трём тысячам неопубликованных файлов. Черновики, PDF-документы и изображения попали в открытый индексируемый data lake. Обнаружили их не злоумышленники, а исследователи из LayerX и Кембриджского университета — просто изучая публично доступные ресурсы. Издание Fortune опубликовало детали. В черновиках значилось, что модель «несёт беспрецедентные киберриски». Компания, позиционирующая себя как эталон безопасного ИИ, слила собственные материалы через уязвимость на собственном сайте.

7 апреля состоялся официальный запуск Claude Mythos Preview проекта Glasswing. Anthropic объявила о $100 млн инвестиций, одиннадцати корпоративных партнёрах — AWS, Apple, Cisco, Google, Microsoft, NVIDIA, Palo Alto Networks и других — и сорока «избранных» организациях с привилегированным доступом. К 26 мая модель, по заявлению компании, выявила более 10 000 критических уязвимостей в критически важном программном обеспечении. Глава Palo Alto Networks назвал альянс «важнейшим в сфере кибербезопасности со времён создания CISA». Публичная версия — Fable 5 — вышла 9 июня и немедленно вызвала волну критики.

ДатаСобытие
Конец мартаУтечка 3000 файлов с сайта Anthropic, обнаружена исследователями LayerX и Кембриджа
7 апреляОфициальный запуск Claude Mythos Preview, проект Glasswing, $100 млн, 11 партнёров
26 маяОбъявлено об обнаружении 10 000+ критических уязвимостей
9 июняПубличный выпуск Fable 5 с расширенными фильтрами безопасности
12 июня, 17:21 ETДиректива правительства США об экспортном контроле; Anthropic отключает Fable 5 и Mythos 5 для всех пользователей

Fable 5 оказалась настолько жёстко ограничена защитными фильтрами, что пользователи сообщали об отказах при попытке отредактировать резюме с должностью «Application Security Architect», обсудить слово «рак» в медицинском контексте или выполнить все 200 задач бенчмарка ProgramBench. Модель молча перенаправляла запросы на более старые версии. Anthropic признала, что «сделала неправильный выбор», и пообещала сделать отказы явными — то есть вместо молчаливого переключения пользователь теперь получает уведомление об отказе. Часть аудитории переключилась на конкурирующие решения, в частности на OpenAI Codex.

7 апреля запустили Claude Mythos Preview проекта Glasswing: $100 млн, 11 корпоративных партнёров, 40 отобранных организаций.

12 июня в 17:21 по восточному времени правительство США направило Anthropic директиву об экспортном контроле: отключить Fable 5 и Mythos 5 для всех иностранных пользователей — как находящихся внутри страны, так и за её пределами, включая сотрудников самой Anthropic с иностранным гражданством. Поскольку разделить пользователей по паспорту в облачной инфраструктуре в реальном времени технически невозможно, компания отключила обе модели для всех клиентов без исключения. По словам Anthropic, поводом послужил «метод обхода» защиты Fable 5 — модель попросили прочитать кодовую базу и исправить ошибки. Найденные уязвимости, как признала сама компания, давно известны и регулярно обнаруживаются публичным GPT-5.5 и независимыми исследователями безопасности.

История Mythos обнажает структурное противоречие, которое не решается маркетингом. Поиск уязвимостей дешевле и быстрее их устранения — это не оценочное суждение, а математика наступательной и оборонительной асимметрии в кибербезопасности. Mythos автоматизировал атакующую сторону уравнения, но щит по-прежнему запаздывает. При этом доступ к инструменту оказался жёстко стратифицирован: сорок организаций получили полноценную модель, широкая аудитория — версию с многочисленными ограничениями, а 12 июня выяснилось, что доступ к ИИ-инструментам кибербезопасности определяется не законодательством страны пользователя и не политикой компании-разработчика, а директивой чужого правительства, которое может отозвать доступ за пятнадцать минут без публичного объяснения технических деталей.

Для российского рынка и отечественных разработчиков ситуация имеет прямое практическое измерение. Любая организация, встроившая в свои процессы инструменты на базе моделей Anthropic или аналогичных американских провайдеров, получила наглядную демонстрацию: зависимость от внешней инфраструктуры означает, что рубильник находится не в руках пользователя. Это касается не только кибербезопасности — любой НИОКР, завязанный на облачные API иностранных LLM, несёт аналогичный операционный риск. Развитие собственных моделей — YandexGPT, GigaChat и их будущих итераций — из опции превращается в вопрос непрерывности работы.