В 2026 году рынок генерации изображений стал настолько насыщенным, что выбор модели превратился в отдельную задачу. Авторы Habr отобрали шесть популярных решений — Midjourney v7, Qwen Image 2 Pro, FLUX 2 Max, Nano Banana Pro, GPT Image 2 и Grok Imagine — и прогнали их через шесть сценариев на одинаковых промптах, оценивая по четырём критериям. Результаты опубликованы 29 июня 2026 года.

Midjourney v7, известная своей эстетикой и креативностью, остаётся без публичного API. Доступ к ней — только через Discord или веб-редактор по подписке: от $10 (Basic, ~200 итераций) до $120 (Mega, ~60 GPU-часов). Стоимость одного изображения в режиме Relax или Fast составляет примерно $0.04–0.075, но разработчикам интеграций придётся ждать корпоративного доступа по приглашению.

МодельЦена за 1024×1024Ценовая модельAPI доступБесплатный доступ
Midjourney v7~$0.04–0.075ПодпискаНет (только корпоративный)Нет
Qwen Image 2 Pro$0.075Фиксированная за изображениеДа (Qwen Cloud)Нет
FLUX 2 Max$0.07За мегапиксельДа (BFL API)Нет
Nano Banana Pro$0.134По токенамДа (Gemini API)Нет в API; лимит в приложении
GPT Image 2 (High)$0.211По output-токенамДа (OpenAI API)Лимит в ChatGPT Free
Grok Imagine$0.05Фиксированная за изображениеДа (xAI API)Ограниченный в подписке

Qwen Image 2 Pro от Alibaba делает ставку на мультиязычность и сложные инструкции, включая кириллицу. Цена фиксированная: $0.075 за изображение независимо от разрешения (до 2K). Доступ через Qwen Cloud или агрегаторы. Отсутствие бесплатного доступа компенсируется прозрачной моделью оплаты.

Qwen Image 2 Pro от Alibaba предлагает фиксированную цену $0.075 за изображение с поддержкой кириллицы и сложных инструкций.

FLUX 2 Max от Black Forest Labs — верхний тариф линейки с заявленной сильной типографикой. Тарификация мегапиксельная: $0.07 за первый МП и $0.03 за каждый следующий. Изображение 1024×1024 (1 МП) стоит $0.07, а 2048×2048 (4 МП) — $0.16. Для сравнения, версия FLUX 2 Pro стоит примерно вдвое дешевле — от $0.03/МП.

Nano Banana Pro, второе название Gemini 3 Pro Image от Google, позиционируется как модель с высоким follow-the-prompt и поддержкой 4K. API доступен через Gemini Developer API и Google Cloud Vertex ИИ. Цена: $0.134 за изображение до 4 МП (1K/2K) и $0.24 за 4K (до 16 МП). Бесплатного доступа в API нет, но в приложении Gemini есть лимитированная генерация.

GPT Image 2 от OpenAI использует архитектуру ChatGPT и тарифицируется по output-токенам. Стоимость изображения 1024×1024 в режиме High — $0.211, в Medium — $0.053, в Low — $0.006. В ChatGPT Free ограничение 2–3 изображения в сутки, Plus ($20/мес) — около 50 за скользящие 3 часа, Pro ($100–200/мес) — до 4 изображений за запрос. В тестах использовался режим High.

Grok Imagine от xAI в режиме image quality стоит $0.05 за 1K изображение. API совместим с OpenAI SDK, что упрощает миграцию. Подписка SuperGrok ($30/мес или $25/мес при годовой оплате) даёт от 10 до 50 изображений в день через веб, но точное количество зависит от нагрузки. В тесте использовалось разрешение 1K.

Сводная таблица цен на 29 июня 2026 года показывает, что при одинаковом размере 1024×1024 разброс составляет от ~$0.04 (Midjourney) до $0.211 (GPT Image 2 High). При этом Qwen и FLUX предлагают средние цены около $0.07, а Nano Banana и Grok — $0.134 и $0.05 соответственно. Важно учитывать, что Midjourney не имеет прямого API, а лимиты бесплатного доступа у GPT ограничены. качества, по результатам тестов все модели показали сопоставимый уровень, но с разной специализацией: Midjourney — эстетика, FLUX — типографика, Qwen — мультиязычность, Nano Banana — точность следования промпту, GPT Image 2 — универсальность, Grok — баланс цены и качества. Остаётся неопределённость в части нагрузки на серверы и возможных изменений тарифов: все провайдеры могут менять цены в любой момент.