OpenAI запускает GPT-5.5-Cyber и обновляет Codex Security для кибербезопасности

Подготовлено редакцией Malakhov AI

The Decoder·3 часа назад·3 минИсследованияИндустрия

OpenAI выпустила полноценную модель GPT-5.5-Cyber, которая, по данным компании, превзошла Anthropic Mythos на тестах кибербезопасности. Кроме того, обновлён плагин Codex Security, охватывающий полный цикл от поиска уязвимостей до генерации исправлений.

Кратко

—GPT-5.5-Cyber лидирует на бенчмарках CyberGym, ExploitGym и SEC-bench Pro, обходя Mythos и предыдущие модели.
—Обновлённый Codex Security просканировал 30 млн коммитов и автоматически пометил 500 тыс. найденных проблем как исправленные.
—OpenAI запустила партнёрскую программу с 25+ компаниями (Cisco, CrowdStrike, Cloudflare) и правительствами ряда стран.
—Инициатива Patch the Planet совместно с Trail of Bits, HackerOne и Calif направлена на исправление уязвимостей в открытом ПО.
—Доступ к GPT-5.5-Cyber ограничен только для верифицированных защитников с мониторингом и защитными мерами.

Глоссарий · 7 терминов▾

CyberGym: Бенчмарк для оценки способности модели воспроизводить известные уязвимости в программном окружении.
ExploitGym: Бенчмарк для проверки умения модели превращать уязвимости в рабочие эксплойты.
SEC-bench Pro: Бенчмарк для измерения эффективности долгосрочного обнаружения уязвимостей.
SARIF: Формат обмена результатами статического анализа для интеграции с инструментами управления уязвимостями.
CodeQL: Язык запросов для анализа кода, используемый для поиска уязвимостей.
Trusted Access for Cyber: Система безопасного доступа OpenAI к своим моделям для использования в кибербезопасности.
Patch the Planet: Инициатива OpenAI по автоматизации исправления уязвимостей в открытом программном обеспечении.

OpenAI выпустила полноценную модель GPT-5.5-Cyber, предназначенную для задач кибербезопасности. По данным компании, эта модель превосходит все предыдущие версии, включая Anthropic Mythos, на профильных бенчмарках. Одновременно обновлён плагин Codex Security, который теперь охватывает весь процесс от обнаружения уязвимости до генерации патча, а также запущена партнёрская программа с участием более 25 компаний и нескольких правительств.

Проблема в кибербезопасности, по мнению OpenAI, сместилась от нахождения уязвимостей к их исправлению. Компания стремится автоматизировать этот процесс, но оставляет окончательное решение за человеком. GPT-5.5-Cyber — это специализированная модель, доступная только для верифицированных защитников. Она показывает лучшие результаты на трёх ключевых тестах.

Модель	CyberGym	ExploitGym	SEC-bench Pro
GPT-5.5-Cyber	85.6%	39.5%	69.8%
Mythos 5	83.8%	–	–
GPT-5.5	81.8%	25.95%	63.1%
GPT-5.4	79.0%	–	–
Claude Opus 4	73.1%	–	–

| Модель | CyberGym | ExploitGym | SEC-bench Pro | |--------|----------|------------|---------------| | GPT-5.5-Cyber | 85.6% | 39.5% | 69.8% | | Mythos 5 | 83.8% | – | – | | GPT-5.5 | 81.8% | 25.95% | 63.1% | | GPT-5.4 | 79.0% | – | – | | Claude Opus 4 | 73.1% | – | – |

Обновлённый Codex Security просканировал 30 млн коммитов и автоматически пометил 500 тыс. найденных проблем как исправленные.

Бенчмарк CyberGym оценивает способность модели воспроизводить известные уязвимости в программном окружении, ExploitGym проверяет умение превращать уязвимости в рабочие эксплойты, а SEC-bench Pro измеряет эффективность долгосрочного обнаружения уязвимостей. Как видно из таблицы, GPT-5.5-Cyber заметно опережает предшественников. При этом Mythos 5 от Anthropic, также специализированная модель, уступает GPT-5.5-Cyber на CyberGym (83,8% против 85,6%).

Обновлённый плагин Codex Security за время существования в статусе превью просканировал более 30 миллионов коммитов в свыше 30 тысячах репозиториев. Автоматически было помечено как исправленные более 500 тысяч находок, ещё 70 тысяч подтвердили ревьюеры вручную. Теперь плагин может проводить глубокий анализ всей кодовой базы, анализировать пути атак и экспортировать результаты в формате SARIF или CodeQL для интеграции с существующими системами управления уязвимостями. Плагин также способен обрабатывать находки из других сканеров и баг-баунти-программ, автоматически создавая патчи в пакетном режиме. При этом каждое изменение всё равно должен утверждать человек.

Для доступа к полноценной модели GPT-5.5-Cyber OpenAI внедрила систему верификации и мониторинга. Обычным пользователям рекомендуется использовать GPT-5.5 в связке с Trusted Access for Cyber и Codex Security. Партнёрская программа Daybreak Cyber Partner Program включает такие компании, как Cisco, CrowdStrike, Cloudflare, Palo Alto Networks, IBM и другие. Также объявлено о сотрудничестве с правительствами Австралии, Канады, Франции, Германии, Японии и других стран.

Кроме того, OpenAI запустила инициативу Patch the Planet совместно с Trail of Bits, HackerOne и Calif для открытого ПО. Более 30 проектов, включая cURL, Go, Python и pyca/cryptography, уже присоединились. Первый пятидневный спринт выявил сотни проблем и привёл к десяткам объединённых патчей. Компания подчёркивает, что исследователи безопасности и мейнтейнеры проверяют и дедуплицируют находки перед слиянием.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

«М.Видео» направит 9 млрд рублей на ИИ и ИТ-инфраструктуру в 2026 году

Продолжить по разделам

OpenAI запускает GPT-5.5-Cyber и обновляет Codex Security для кибербезопасности

Кратко

Читать дальше

Google DeepMind и A24 заключили партнёрство для исследований ИИ в кино

Экспортный запрет на модель ИИ Mythos от Anthropic

«М.Видео» направит 9 млрд рублей на ИИ и ИТ-инфраструктуру в 2026 году