OpenAI выпустила полноценную модель GPT-5.5-Cyber, предназначенную для задач кибербезопасности. По данным компании, эта модель превосходит все предыдущие версии, включая Anthropic Mythos, на профильных бенчмарках. Одновременно обновлён плагин Codex Security, который теперь охватывает весь процесс от обнаружения уязвимости до генерации патча, а также запущена партнёрская программа с участием более 25 компаний и нескольких правительств.

Проблема в кибербезопасности, по мнению OpenAI, сместилась от нахождения уязвимостей к их исправлению. Компания стремится автоматизировать этот процесс, но оставляет окончательное решение за человеком. GPT-5.5-Cyber — это специализированная модель, доступная только для верифицированных защитников. Она показывает лучшие результаты на трёх ключевых тестах.

МодельCyberGymExploitGymSEC-bench Pro
GPT-5.5-Cyber85.6%39.5%69.8%
Mythos 583.8%
GPT-5.581.8%25.95%63.1%
GPT-5.479.0%
Claude Opus 473.1%

| Модель | CyberGym | ExploitGym | SEC-bench Pro | |--------|----------|------------|---------------| | GPT-5.5-Cyber | 85.6% | 39.5% | 69.8% | | Mythos 5 | 83.8% | – | – | | GPT-5.5 | 81.8% | 25.95% | 63.1% | | GPT-5.4 | 79.0% | – | – | | Claude Opus 4 | 73.1% | – | – |

Обновлённый Codex Security просканировал 30 млн коммитов и автоматически пометил 500 тыс. найденных проблем как исправленные.

Бенчмарк CyberGym оценивает способность модели воспроизводить известные уязвимости в программном окружении, ExploitGym проверяет умение превращать уязвимости в рабочие эксплойты, а SEC-bench Pro измеряет эффективность долгосрочного обнаружения уязвимостей. Как видно из таблицы, GPT-5.5-Cyber заметно опережает предшественников. При этом Mythos 5 от Anthropic, также специализированная модель, уступает GPT-5.5-Cyber на CyberGym (83,8% против 85,6%).

Обновлённый плагин Codex Security за время существования в статусе превью просканировал более 30 миллионов коммитов в свыше 30 тысячах репозиториев. Автоматически было помечено как исправленные более 500 тысяч находок, ещё 70 тысяч подтвердили ревьюеры вручную. Теперь плагин может проводить глубокий анализ всей кодовой базы, анализировать пути атак и экспортировать результаты в формате SARIF или CodeQL для интеграции с существующими системами управления уязвимостями. Плагин также способен обрабатывать находки из других сканеров и баг-баунти-программ, автоматически создавая патчи в пакетном режиме. При этом каждое изменение всё равно должен утверждать человек.

Для доступа к полноценной модели GPT-5.5-Cyber OpenAI внедрила систему верификации и мониторинга. Обычным пользователям рекомендуется использовать GPT-5.5 в связке с Trusted Access for Cyber и Codex Security. Партнёрская программа Daybreak Cyber Partner Program включает такие компании, как Cisco, CrowdStrike, Cloudflare, Palo Alto Networks, IBM и другие. Также объявлено о сотрудничестве с правительствами Австралии, Канады, Франции, Германии, Японии и других стран.

Кроме того, OpenAI запустила инициативу Patch the Planet совместно с Trail of Bits, HackerOne и Calif для открытого ПО. Более 30 проектов, включая cURL, Go, Python и pyca/cryptography, уже присоединились. Первый пятидневный спринт выявил сотни проблем и привёл к десяткам объединённых патчей. Компания подчёркивает, что исследователи безопасности и мейнтейнеры проверяют и дедуплицируют находки перед слиянием.