Когда производитель программного обеспечения выпускает патч безопасности, он невольно публикует карту уязвимости: сравнив старый и новый код, атакующий может точно установить, где была ошибка. Раньше на это уходили недели — по данным Mandiant за 2020 год, 16 из 25 уязвимостей эксплуатировались спустя месяц и более после выхода патча. Anthropic решила измерить, насколько LLM меняют этот расклад.

Исследователи протестировали шесть моделей Claude, включая непубличную Mythos Preview. Первый полигон — 18 патчей для SpiderMonkey, движка JavaScript в Firefox. Выбор не случаен: Firefox обновляется автоматически, а Mozilla недавно перешла с ежемесячных на еженедельные минорные релизы. Если даже такое короткое окно уязвимости оказывается достаточным, большинство другого ПО находится в значительно худшем положении.

МодельSpiderMonkey: крашей из 18SpiderMonkey: эксплойтов из 18Windows-ядро: уязвимостей из 21Полные цепочки до SYSTEM
Mythos Preview148188
Opus 4.82 (эксплойта)2150
Opus 4.610
Sonnet 4.61130
Opus 4.7130

Mythos Preview воспроизвела краш для 14 из 18 уязвимостей. Первый proof-of-concept появился через 12 минут, ещё 13 — в течение 40 минут. Но краш — лишь подтверждение того, что баг найден. Куда важнее полноценный эксплойт, позволяющий выполнить произвольный код. Здесь Mythos Preview произвела 8 работающих эксплойтов примерно за 12 часов. Первый был готов меньше чем через час после выхода патча — за 18 дней до того, как обновлённый Firefox 148 поступил в публичный релиз. Opus 4.8 справилась с двумя эксплойтами, Opus 4.6 и Sonnet 4.6 — с одним каждая.

Для Windows-ядра модель нашла 18 из 21 уязвимости менее чем за 6 часов при затратах около $2 200 на API.

PoC development timeline for 18 SpiderMonkey CVEs. Mythos Preview (orange) is significantly faster and more successful than all other models. | Image: Anthropic
PoC development timeline for 18 SpiderMonkey CVEs. Mythos Preview (orange) is significantly faster and more successful than all other models. | Image: Anthropic · Источник: The Decoder

Второй тест был принципиально сложнее: 21 уязвимость в ядре Windows из январского и февральского Patch Tuesday 2026 года, каждая позволяет поднять привилегии от ограниченного пользователя до полного администратора. Исходного кода Windows нет — модель работала с скомпилированными бинарниками, публичными отладочными символами, декомпиляцией из инструмента Ghidra и официальными бюллетенями Microsoft. Mythos Preview нашла 18 из 21 уязвимости менее чем за 6 часов при стоимости около $2 200 в API-кредитах. Только она одна сумела собрать полные цепочки атак до уровня SYSTEM — 8 штук суммарно за $15 700, в среднем около $2 000 за эксплойт. Opus 4.8 строила отдельные компоненты атаки, но не смогла объединить их в законченную цепочку.

Отдельно показательна статистика по классификации Microsoft: 14 из 21 уязвимости компания пометила как «маловероятно будет эксплуатироваться» или «вряд ли будет эксплуатироваться». Mythos Preview взломала 13 из этих 14, включая одну с пометкой «unlikely». По мнению Anthropic, рейтинговая система Microsoft откалибрована под возможности человека-исследователя и требует пересмотра с учётом ИИ-инструментов.

Тайминг усугубляет картину. Даже при использовании Windows Autopatch 90% зарегистрированных устройств получают патч через 7 дней, принудительная перезагрузка происходит через 11 дней. Все 8 цепочек атак Mythos Preview были готовы раньше, чем хотя бы одно устройство успело автоматически применить обновление.

Антропик подчёркивает: публично доступные модели Claude тоже способны создавать эксплойты при отключённых фильтрах безопасности — просто с меньшим успехом. Аналогичные возможности, вероятно, есть у моделей других компаний и open-source решений, что существенно расширяет круг потенциальных атакующих.

PoC development for 21 Windows kernel vulnerabilities. Mythos Preview (orange) is the fastest model even without source code access. | Image: Anthropic
PoC development for 21 Windows kernel vulnerabilities. Mythos Preview (orange) is the fastest model even without source code access. | Image: Anthropic · Источник: The Decoder

Исследователи признают ограничения: реальная атака включает дополнительные шаги — поиск уязвимых целей, доставку вредоносного кода, обход систем обнаружения. Но самый трудоёмкий этап — разработка эксплойта — теперь занимает часы, а не недели. Термин «N-Day», измеряющий время от патча до эксплойта в днях, Anthropic предлагает заменить на «N-Hour».

Наибольший риск несут системы, которые сложно или медленно обновлять: промышленные контроллеры, медицинские устройства, сетевое оборудование с фиксированными окнами обслуживания. Долгосрочным решением Anthropic называет не ускорение патчинга, а сокращение самих источников ошибок — переход на memory-safe языки вроде Rust или аппаратные защиты, устраняющие целые классы уязвимостей.

Отчёт опубликован до выхода Claude Fable 5 — варианта Mythos с усиленными ограничениями безопасности. Mythos 5 (без тега preview) пока доступна только отобранным Anthropic организациям.