Новая генеративная модель OpenAI GPT-Image 2 вышла на финальный этап перед публичным релизом: избранные тестировщики с американскими аккаунтами уже получили к ней доступ, а их работы активно распространяются на X и Reddit. Среди примеров — изображения, которые при беглом просмотре практически невозможно отличить от фотографий. Один из показательных примеров: фейковый снимок, на котором генеральный директор Microsoft Сатья Наделла демонстрирует график, якобы доказывающий, что Google Chrome чаще всего скачивают через браузер Edge.

Главное техническое отличие GPT-Image 2 от предыдущих версий — работа с текстом внутри изображений. Предшественники модели, как и большинство конкурирующих решений, традиционно плохо справлялись с надписями: буквы искажались, слова сливались или появлялись несуществующие символы. GPT-Image 2 позиционируется как модель, способная корректно рендерить текст в диаграммах, инфографике и скриншотах интерфейсов. Это открывает применение в рекламе и образовании — сегментах, где точность визуального текста критична.

Отдельно разработчики указывают на устранение так называемого «ИИ-вида» — характерного набора артефактов, по которым опытный наблюдатель мог распознать сгенерированное изображение: избыточно гладкая кожа, неестественно равномерное освещение, стерильная «студийная» атмосфера. По имеющимся данным, эти проблемы сохранялись в GPT-image 1.5, тогда как конкурирующая модель Google Nano Banana Pro демонстрировала заметное преимущество именно в фотореализме.

GPT-Image 2 значительно лучше справляется со сложными изображениями, диаграммами и скриншотами с текстом.

OpenAI готовит GPT-Image 2: модель почти неотличима от фото
· Источник: The Decoder

Рынок генерации изображений по текстовому описанию переживает активную консолидацию. Помимо OpenAI и Google, в этом сегменте работают Midjourney, Stability AI и Adobe с моделью Firefly. Конкурентное давление подталкивает разработчиков к улучшению именно тех характеристик, которые важны для коммерческого применения: точность текста, управляемость стилем и соответствие брендовым требованиям. GPT-Image 2 судя по описанию целится именно в этот профессиональный сегмент.

OpenAI анонсировала официальную презентацию модели в формате прямого эфира — примечательно, что для продвижения самого анонса компания использовала скриншот, сгенерированный GPT-Image 2. Это одновременно демонстрация возможностей и маркетинговый приём: если аудитория не сразу замечает, что изображение синтетическое, аргумент в пользу качества модели считается доказанным.