GPT-5.6 Sol от OpenAI: бенчмарки, цены и доступ под контролем правительства США

Подготовлено редакцией Malakhov AI

The Decoder·2 часа назад·2 минИсследованияИндустрия

OpenAI выпустила GPT-5.6 Sol — новое поколение моделей, предназначенное для конкуренции с Claude Mythos от Anthropic. Доступ к Sol ограничен партнёрами по требованию правительства США, что вызывает недовольство компании.

Кратко

—GPT-5.6 Sol превосходит Claude Mythos 5 в агентном кодировании (88,8% против 88% на Terminal-Bench 2.1).
—Доступ к модели ограничен избранными партнёрами по указанию правительства США, которое ранее отозвало модель Fable 5 от Anthropic.
—OpenAI критикует процесс государственного контроля, называя его неустойчивым в долгосрочной перспективе.
—Модель предлагает новую систему наименований с уровнями Sol, Terra и Luna, а также режимы max и ultra.
—Запуск на Cerebras запланирован на июль со скоростью до 750 токенов/с.

Глоссарий · 5 терминов▾

Terminal-Bench 2.1: Бенчмарк для оценки способностей ИИ-агентов выполнять задачи в терминале.
ExploitBench: Бенчмарк для тестирования способности ИИ находить и эксплуатировать уязвимости в программном обеспечении.
GeneBench v1: Бенчмарк для оценки производительности ИИ в задачах геномики и количественной биологии.
токены: Единицы текста, которые обрабатывает языковая модель; слова или части слов.
Cerebras: Компания, производящая специализированное аппаратное обеспечение для ИИ, на котором будет запущен Sol.

OpenAI не скрывает разочарования таким положением дел. «Мы не считаем, что этот процесс государственного доступа должен стать долгосрочным стандартом. Он лишает лучшие инструменты пользователей, разработчиков, предприятий, защитников кибербезопасности и глобальных партнёров, которым они нужны», — заявили в компании. Правительство США ранее отозвало модель Fable 5 от Anthropic, которая относилась к классу Mythos, что создаёт прецедент для государственного контроля над передовыми ИИ-моделями.

GPT-5.6 Sol вводит новую систему наименований, напоминающую ту, что использует Claude. Число (5.6) обозначает поколение, а Sol, Terra и Luna — постоянные уровни производительности, которые могут развиваться независимо. Sol является флагманским уровнем. Terra соответствует производительности GPT-5.5 при вдвое меньшей стоимости. Luna — бюджетный вариант. Кроме того, доступны режимы «max» для более глубокого рассуждения и «ultra», который делегирует сложные задачи суб-агентам, работающим параллельно.

Модель	Terminal-Bench 2.1 (%)
GPT-5.6 Sol	88.8
GPT-5.6 Sol Ultra	91.9
Claude Mythos 5	88.0
Fable 5	84.3
Gemini 3.1 Pro Preview	70.7

По бенчмаркам OpenAI, Sol опережает Claude Mythos 5 в агентном кодировании. На Terminal-Bench 2.1 Sol набирает 88,8%, Sol Ultra — 91,9%, тогда как

Доступ к модели ограничен избранными партнёрами по указанию правительства США, которое ранее отозвало модель Fable 5 от Anthropic.

Image description · Источник: The Decoder

OpenAI называет Sol своей самой capable моделью кибербезопасности, но позиционирует её как защитника, а не атакующего. Модель лучше находит и исправляет уязвимости, чем проводит полные цепочки атак. В тестах с Chromium и Firefox Sol находила баги и примитивы эксплуатации, но не смогла выполнить автономную полную эксплуатацию. OpenAI утверждает, что GPT-5.6 Sol всё ещё ниже порога «Cyber Critical» в своей системе Preparedness Framework.

Цены: $5 за миллион входных токенов и $30 за выходные для Sol, $2,50 и $15 для Terra, $1 и $6 для Luna. OpenAI переработала систему кэширования подсказок с контрольными точками и гарантированным временем жизни минимум 30 минут. Запись в кэш стоит в 1,25 раза дороже обычной цены ввода, чтение даёт скидку 90%. Поскольку Sol использует меньше токенов для достижения тех же результатов, эффективная стоимость задачи может оказаться ниже, чем у предыдущих поколений, что противодействует тренду удорожания ИИ-моделей.

В июле Sol появится на платформе Cerebras с скоростью до 750 токенов в секунду.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Google DeepMind встроила компьютерное зрение в Gemini 3.5 Flash

Продолжить по разделам

GPT-5.6 Sol от OpenAI: бенчмарки, цены и доступ под контролем правительства США

Кратко

Читать дальше

OpenAI может отложить IPO до 2027 года из-за требования Altman в $1 трлн

Anthropic обвинила Alibaba в крупнейшей атаке с клонированием модели Claude

Google DeepMind встроила компьютерное зрение в Gemini 3.5 Flash