Claude Mythos Preview нашёл 271 уязвимость в Firefox, некоторым из них 20 лет

Подготовлено редакцией Malakhov AI

The Decoder·8 мая·3 минИсследованияИндустрия

В апреле 2025 года Mozilla закрыла 423 уязвимости в Firefox — в пять раз больше прежнего рекорда в 76 за март. Большинство из них обнаружил не человек, а ИИ-агент на базе Claude Mythos Preview, который сам писал тесты и проверял собственные гипотезы.

Кратко

—Claude Mythos Preview нашёл 271 ранее неизвестную уязвимость в Firefox 150, включая баги возрастом 15 и 20 лет.
—Mozilla закрыла 423 уязвимости за апрель — рекорд; прежний максимум составлял 76 за месяц.
—Агентный подход позволяет ИИ самостоятельно писать и запускать тесты, отсеивая ложные срабатывания.
—Ранние попытки с GPT-4 и Claude Sonnet 3.5 в режиме чтения кода провалились из-за высокого числа ложных срабатываний.
—Mozilla планирует встроить пайплайн в процесс разработки: каждый новый коммит будет проверяться автоматически.

Глоссарий · 7 терминов▾

Агентный пайплайн: Система, в которой языковая модель не просто анализирует текст, но и самостоятельно выполняет действия — например, пишет и запускает код — для проверки своих выводов.
Фаззинг: Метод тестирования безопасности, при котором программа получает случайные или некорректные входные данные, чтобы спровоцировать сбой и выявить уязвимости.
Песочница (sandbox): Механизм изоляции, ограничивающий возможности веб-страницы или процесса и не позволяющий им получить доступ к остальной системе.
Prototype Pollution: Техника атаки на JavaScript-приложения, при которой злоумышленник модифицирует базовые прототипы объектов, чтобы изменить поведение программы или выйти за пределы изолированной среды.
RLBox: Разработанный Mozilla дополнительный слой изоляции для сторонних библиотек внутри Firefox, ограничивающий ущерб от их возможной компрометации.
XSLT: Язык преобразования XML-документов, используемый для конвертации данных из одного формата в другой.
Ложное срабатывание (false positive): Ситуация, когда инструмент анализа сообщает об уязвимости, которой на самом деле не существует, вынуждая разработчиков тратить время на проверку несуществующей проблемы.

В апреле 2025 года команда безопасности Mozilla опубликовала на Mozilla Hacks Blog подробный разбор того, как три разработчика Firefox выстроили агентный ИИ-пайплайн на базе Claude Mythos Preview и за один месяц закрыли 423 уязвимости в браузере. Для сравнения: прежний рекорд составлял 76 уязвимостей за март. Из 423 закрытых проблем 271 нашёл непосредственно Mythos Preview в кодовой базе Firefox 150; ещё около трети из оставшихся 111 внутренних находок тоже пришли из запусков Mythos, но с другими моделями. Лишь 41 уязвимость поступила из внешних отчётов.

Ключевая проблема, которую решала Mozilla, — не дефицит инструментов, а дефицит доверия к ИИ-отчётам. Ещё несколько месяцев назад сообщения об уязвимостях, сгенерированные языковыми моделями, в отрасли называли «ИИ-мусором»: правдоподобно звучащие, но ложные находки, которые отнимали время разработчиков на проверку. Ранние попытки Mozilla анализировать код с помощью GPT-4 и Claude Sonnet 3.5 в режиме чтения без исполнения кода именно так и заканчивались — слишком много ложных срабатываний.

Источник уязвимостей	Количество
Claude Mythos Preview (Firefox 150)	271
Mythos и другие модели (прочие файлы)	~37
Традиционные методы (фаззинг и др.)	~74
Внешние отчёты	41
Итого закрыто за апрель	423

Переломным моментом стал агентный подход. В отличие от статического анализа, агентный пайплайн даёт модели возможность самостоятельно писать тестовые сценарии и запускать их в изолированной среде, чтобы убедиться: подозрительный участок кода действительно приводит к ошибке. Этот шаг самоверификации отсекает спекуляции ещё до того, как отчёт попадает к человеку. Mozilla начала с Claude Opus 4.6 в небольших ручных запусках, затем масштабировала процесс на множество виртуальных машин, каждая из которых параллельно проверяла отдельный файл. Поверх этого команда выстроила систему дедупликации отчётов, приоритизации находок и отслеживания исправлений вплоть до релиза.

Mozilla закрыла 423 уязвимости за апрель — рекорд; прежний максимум составлял 76 за месяц.

Среди обнаруженных уязвимостей — 15-летний баг в HTML-элементе label, используемом для описания форм, и 20-летний баг в XML-инструменте XSLT. Отдельную категорию составили способы выйти за пределы песочницы — механизма, изолирующего веб-страницы от остальной системы. Один из примеров: HTML-таблица с более чем 65 535 строками вызывала переполнение внутреннего счётчика. Был обойдён даже RLBox — дополнительный слой изоляции Mozilla для сторонних библиотек.

Не менее показательным оказалось то, что модели не смогли сделать. Несколько атак были направлены против техники Prototype Pollution, которую злоумышленники ранее использовали для побега из песочницы. Все они провалились — благодаря архитектурному решению, принятому Mozilla несколько лет назад. Для команды это стало прямым подтверждением того, что существующие защитные механизмы работают, — ценность, которую сложно получить традиционными методами тестирования.

Многие из найденных уязвимостей сами по себе недостаточны для полноценной атаки: их нужно комбинировать с другими слабыми местами. Именно такие цепочечные уязвимости плохо выявляются фаззингом — методом, при котором программа намеренно получает случайные или некорректные входные данные в надежде вызвать сбой. ИИ-анализ покрывает это пространство значительно плотнее. Mozilla намерена встроить пайплайн непосредственно в процесс разработки: каждый новый коммит будет автоматически проверяться до попадания в основную ветку. Сотрудничество с Anthropic началось ещё в феврале, когда Frontier Red Team компании передала Mozilla первую партию уязвимостей, — именно оно и дало старт нынешнему пайплайну.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ