OpenAI не скрывает разочарования таким положением дел. «Мы не считаем, что этот процесс государственного доступа должен стать долгосрочным стандартом. Он лишает лучшие инструменты пользователей, разработчиков, предприятий, защитников кибербезопасности и глобальных партнёров, которым они нужны», — заявили в компании. Правительство США ранее отозвало модель Fable 5 от Anthropic, которая относилась к классу Mythos, что создаёт прецедент для государственного контроля над передовыми ИИ-моделями.

GPT-5.6 Sol вводит новую систему наименований, напоминающую ту, что использует Claude. Число (5.6) обозначает поколение, а Sol, Terra и Luna — постоянные уровни производительности, которые могут развиваться независимо. Sol является флагманским уровнем. Terra соответствует производительности GPT-5.5 при вдвое меньшей стоимости. Luna — бюджетный вариант. Кроме того, доступны режимы «max» для более глубокого рассуждения и «ultra», который делегирует сложные задачи суб-агентам, работающим параллельно.

МодельTerminal-Bench 2.1 (%)
GPT-5.6 Sol88.8
GPT-5.6 Sol Ultra91.9
Claude Mythos 588.0
Fable 584.3
Gemini 3.1 Pro Preview70.7

По бенчмаркам OpenAI, Sol опережает Claude Mythos 5 в агентном кодировании. На Terminal-Bench 2.1 Sol набирает 88,8%, Sol Ultra — 91,9%, тогда как

Доступ к модели ограничен избранными партнёрами по указанию правительства США, которое ранее отозвало модель Fable 5 от Anthropic.

Image description
Image description · Источник: The Decoder

OpenAI называет Sol своей самой capable моделью кибербезопасности, но позиционирует её как защитника, а не атакующего. Модель лучше находит и исправляет уязвимости, чем проводит полные цепочки атак. В тестах с Chromium и Firefox Sol находила баги и примитивы эксплуатации, но не смогла выполнить автономную полную эксплуатацию. OpenAI утверждает, что GPT-5.6 Sol всё ещё ниже порога «Cyber Critical» в своей системе Preparedness Framework.

Цены: $5 за миллион входных токенов и $30 за выходные для Sol, $2,50 и $15 для Terra, $1 и $6 для Luna. OpenAI переработала систему кэширования подсказок с контрольными точками и гарантированным временем жизни минимум 30 минут. Запись в кэш стоит в 1,25 раза дороже обычной цены ввода, чтение даёт скидку 90%. Поскольку Sol использует меньше токенов для достижения тех же результатов, эффективная стоимость задачи может оказаться ниже, чем у предыдущих поколений, что противодействует тренду удорожания ИИ-моделей.

В июле Sol появится на платформе Cerebras с скоростью до 750 токенов в секунду.