OpenAI опубликовала научную статью, посвящённую бенчмарку в области геномики. В таблице результатов впервые появились три варианта Pro-моделей GPT-5.6: Luna Pro, Terra Pro и Sol Pro. Ранее тариф ChatGPT Pro предлагал доступ к единой флагманской модели, без разбивки на подтипы. Новая структура предполагает, что пользователям Pro-уровня предложат выбор между быстрой, производительной и максимально мощной версией.
Бенчмарк представляет собой набор из 129 задач, требующих многошагового анализа. Модели оценивались по доле успешных прохождений (pass rate) — полное выполнение цепочки вычислений с верным итоговым ответом. Для стандартных моделей использовался максимальный режим рассуждения (max), для Pro — режим Extended.
| Модель | Стандартная (max) | Pro (Extended) | Прирост |
|---|---|---|---|
| GPT-5.6 Luna | 16,5% | 23,6% | +7,1 п.п. |
| GPT-5.6 Terra | 23,3% | 28,5% | +5,2 п.п. |
| GPT-5.6 Sol | 28,7% | 31,5% | +2,8 п.п. |
Sol Pro показал 31,5% pass rate, что стало лучшим результатом среди всех 60 протестированных моделей. Для сравнения: стандартная Sol набрала 28,7%, а лучшая модель за пределами OpenAI — Claude Opus 4.8 — лишь 16,0%. При этом прирост от использования Pro-режима оказался нелинейным: чем мощнее базовая модель, тем меньше выигрыш. Luna Pro получила +7,1 процентного пункта относительно стандартной Luna (23,6% против 16,5%), тогда как Sol Pro прибавила лишь +2,8 п.п. (31,5% против 28,7%). Terra Pro (28,5%) практически сравнялась со стандартной Sol (28,7%), то есть Pro-версия для массовых нагрузок почти не уступает стандартному флагману.
Sol Pro набрал 31,5% в геномном тесте — лучший результат среди 60 моделей.

Пока неизвестно, появятся ли эти варианты в самом интерфейсе ChatGPT. Названия моделей присутствуют только в таблице бенчмарка. Кроме того, OpenAI не приводит затраты токенов для Pro-запусков — для стандартных моделей средний расход составляет около 33 200 токенов для Sol в максимальном режиме. Отсутствие этих данных не позволяет оценить эффективность Pro-вариантов с точки зрения стоимости вычислений.
Если тройная структура Pro-тарифов будет реализована, это станет первым серьёзным изменением формата ChatGPT Pro с момента его запуска. Вместо единой «самой лучшей» модели пользователи получат три опции, каждая из которых оптимизирована под свой сценарий: скорость, пропускная способность или максимальное качество рассуждений. Это может перестроить рынок коммерческих API и подписок на языковые модели, однако для окончательных выводов необходима более полная информация от OpenAI.



