ChatGPT научился генерировать изображения: как правильно составлять промпты

Подготовлено редакцией Malakhov AI

OpenAI News·10 апр.·2 минЛаборатории

OpenAI опубликовала практическое руководство по созданию изображений через ChatGPT — от простых иллюстраций до инфографики и редактирования загруженных фото. Ключевой тезис: 1–3 чётких предложения в промпте работают лучше, чем длинные и «умные» описания.

Кратко

—Для большинства задач достаточно промпта из 1–3 предложений с указанием цели, субъекта, места и визуального стиля.
—Конкретные формулировки надёжнее расплывчатых: «мягкий естественный свет из окна слева» точнее, чем «красивое освещение».
—При редактировании изображения нужно явно указывать, что менять, а что оставить: «Измени только X, всё остальное оставь без изменений».
—Текст в изображении лучше задавать с указанием шрифта, размера, цвета и расположения — необычные слова рекомендуется диктовать побуквенно.
—Использование чужих образов требует разрешения; для брендовых элементов OpenAI советует запрашивать «обобщённые» версии дизайна.

Глоссарий · 4 термина▾

промпт: Текстовый запрос, который пользователь вводит в систему генеративного ИИ, чтобы получить нужный результат — текст, изображение или другой контент.
итерация: Последовательное уточнение результата через серию правок, когда каждый следующий запрос основывается на предыдущем выводе модели.
DALL-E: Генеративная модель OpenAI для создания изображений по текстовым описаниям, интегрированная в ChatGPT.
инфографика: Визуальное представление данных или информации, сочетающее текст, иконки и графические элементы в едином макете.

Генерация изображений в ChatGPT работает на той же логике, что и текстовые запросы: чем точнее сформулирован запрос, тем предсказуемее результат. OpenAI выпустила структурированное руководство, в котором описывает, как составлять промпты, итерировать результат и работать с загруженными изображениями.

Основа хорошего промпта — не длина, а конкретность. Достаточно 1–3 предложений, которые отвечают на несколько вопросов: что изображено, какое настроение или стиль нужен, что должно происходить в кадре и где. Если важны освещение, кадрирование или текстуры — их тоже стоит указать явно. Пример из руководства: «мягкий естественный свет из окна слева» даёт более стабильный результат, чем «красивое освещение». Расплывчатые эпитеты модель интерпретирует по-своему, конкретные параметры — нет.

При итерации изображения OpenAI рекомендует менять по одному элементу за раз, начиная с основной идеи и постепенно уточняя детали. Если нужно сохранить композицию, но изменить стиль — это формулируется прямо: «Оставь ту же композицию, но сделай стиль более современным». При редактировании загруженного изображения важно явно обозначить, что должно измениться, а что остаться нетронутым — иначе модель может «поплыть» в сторону от оригинала.

Academy > Projects > Cover Image · Источник: OpenAI News

Отдельный блок руководства посвящён работе с текстом внутри изображений — исторически слабое место большинства генеративных моделей. ChatGPT лучше справляется с задачей, если текст взят в кавычки или написан заглавными буквами, а для нестандартных слов и брендов рекомендуется диктовать написание побуквенно. Для плотных макетов — инфографики, постеров, диаграмм — стоит явно указывать «чёткий рендеринг текста» и при необходимости дорабатывать результат в дизайн-инструментах.

Контекст появления таких рекомендаций понятен: генерация изображений в ChatGPT основана на модели DALL-E, которую OpenAI интегрировала в чат-интерфейс. В отличие от Midjourney или Stable Diffusion, где пользователь работает с отдельным инструментом и специфическим синтаксисом промптов, ChatGPT позволяет вести диалог на естественном языке и уточнять результат в той же переписке. Это снижает порог входа, но одновременно создаёт иллюзию, что любой запрос сработает без подготовки.

По вопросам использования результатов OpenAI занимает прагматичную позицию: атрибуция сгенерированных изображений не обязательна, но допустима. При работе с образами реальных людей нужно иметь разрешение на использование их внешности. Для брендовых задач компания советует запрашивать «обобщённые» или «собственные» версии дизайна вместо прямого копирования существующих продуктов или стилей — это снижает юридические риски и делает результат более применимым.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Stripe на 26% ускорил compliance-проверки с помощью ИИ-агентов на AWS Bedrock

Продолжить по разделам

ChatGPT научился генерировать изображения: как правильно составлять промпты

Кратко

Читать дальше

OpenAI оценила влияние ИИ на рынок труда стран Евросоюза

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США

Stripe на 26% ускорил compliance-проверки с помощью ИИ-агентов на AWS Bedrock