OpenAI готовит GPT-Image 2: модель почти неотличима от фото

Подготовлено редакцией Malakhov AI

The Decoder·21 апр.·2 минИсследованияИндустрия

GPT-Image 2 уже тестируется отдельными пользователями ChatGPT в США — сгенерированные изображения появились на X и Reddit и во многих случаях неотличимы от реальных фотографий. OpenAI анонсировала презентацию модели в прямом эфире в 12:00 по тихоокеанскому времени.

Кратко

—Модель получила кодовое название gpt-image-2 и уже доступна ограниченному кругу тестировщиков с американскими аккаунтами.
—GPT-Image 2 значительно лучше справляется со сложными изображениями, диаграммами и скриншотами с текстом.
—Разработчики заявляют, что модель избавилась от характерного «ИИ-вида»: чрезмерно гладкой кожи и идеального освещения.
—Среди целевых сценариев — реклама и образовательные материалы, где критична точная передача текста в изображении.
—OpenAI использовала для анонса прямого эфира скриншот, сгенерированный самой же моделью.

Видео по теме

This is ChatGPT Images 2.0 · Источник: The Decoder

Глоссарий · 3 термина▾

рендеринг текста: Процесс корректного отображения букв и символов внутри сгенерированного изображения — исторически слабое место генеративных моделей.
фотореализм: Степень визуального сходства сгенерированного изображения с настоящей фотографией.
инфографика: Визуальный формат подачи данных, сочетающий графику, диаграммы и текстовые пояснения.

Новая генеративная модель OpenAI GPT-Image 2 вышла на финальный этап перед публичным релизом: избранные тестировщики с американскими аккаунтами уже получили к ней доступ, а их работы активно распространяются на X и Reddit. Среди примеров — изображения, которые при беглом просмотре практически невозможно отличить от фотографий. Один из показательных примеров: фейковый снимок, на котором генеральный директор Microsoft Сатья Наделла демонстрирует график, якобы доказывающий, что Google Chrome чаще всего скачивают через браузер Edge.

Главное техническое отличие GPT-Image 2 от предыдущих версий — работа с текстом внутри изображений. Предшественники модели, как и большинство конкурирующих решений, традиционно плохо справлялись с надписями: буквы искажались, слова сливались или появлялись несуществующие символы. GPT-Image 2 позиционируется как модель, способная корректно рендерить текст в диаграммах, инфографике и скриншотах интерфейсов. Это открывает применение в рекламе и образовании — сегментах, где точность визуального текста критична.

Отдельно разработчики указывают на устранение так называемого «ИИ-вида» — характерного набора артефактов, по которым опытный наблюдатель мог распознать сгенерированное изображение: избыточно гладкая кожа, неестественно равномерное освещение, стерильная «студийная» атмосфера. По имеющимся данным, эти проблемы сохранялись в GPT-image 1.5, тогда как конкурирующая модель Google Nano Banana Pro демонстрировала заметное преимущество именно в фотореализме.

GPT-Image 2 значительно лучше справляется со сложными изображениями, диаграммами и скриншотами с текстом.

Рынок генерации изображений по текстовому описанию переживает активную консолидацию. Помимо OpenAI и Google, в этом сегменте работают Midjourney, Stability AI и Adobe с моделью Firefly. Конкурентное давление подталкивает разработчиков к улучшению именно тех характеристик, которые важны для коммерческого применения: точность текста, управляемость стилем и соответствие брендовым требованиям. GPT-Image 2 судя по описанию целится именно в этот профессиональный сегмент.

OpenAI анонсировала официальную презентацию модели в формате прямого эфира — примечательно, что для продвижения самого анонса компания использовала скриншот, сгенерированный GPT-Image 2. Это одновременно демонстрация возможностей и маркетинговый приём: если аудитория не сразу замечает, что изображение синтетическое, аргумент в пользу качества модели считается доказанным.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ