Midjourney V8.1, выпущенная 14 апреля 2026 года, закрепилась как текущая версия по умолчанию — до неё дефолтом была V7, а альфу 8.0 пользователи получили незадолго до финального релиза. Переключиться между версиями можно через настройки сайта или параметром --v в конце промпта.
До 2024 года единственной точкой входа был Discord-бот с командой /imagine. Сейчас основная работа ведётся через midjourney.com: там расположены вкладки Create, Edit, Organize и Moodboard. Discord сохранился, но Editor с inpainting и outpainting доступен исключительно в веб-интерфейсе.
Архитектура модели не раскрывается — Midjourney остаётся закрытой системой. Известно, что она работает на латентных диффузионных моделях: из случайного шума модель шаг за шагом формирует изображение, ориентируясь на текстовый запрос. Текст обрабатывает энкодер, близкий к CLIP, который улавливает смысловые связи, а не отдельные слова. Именно поэтому «golden retriever sleeping by a fireplace in a cozy cabin» даёт принципиально иной результат, чем просто «golden retriever».
Основная точка входа — midjourney.com; Discord-бот сохранился, но Editor с inpainting работает только в вебе.
Промпт читается слева направо с приоритизацией: начало весит больше. Рабочая формула — субъект и действие, затем окружение, свет и настроение, стиль или материал съёмки, параметры в конце. Набор тегов вроде «beautiful woman forest sunlight photorealistic 8k cinematic» проигрывает сцене: «A botanist in her 40s examining moss on ancient stone ruins, overgrown forest at dawn, soft diffused light filtering through mist, editorial photography, shot on Leica M11 50mm --ar 3:2 --s 250». Разница не в длине — модель понимает сцены, а не перечни атрибутов.
Среди параметров ключевые: --ar задаёт соотношение сторон (от 1:1 для аватарок до 21:9 для баннеров), --stylize управляет балансом между буквальностью и художественной интерпретацией по шкале 0–1000 (дефолт — 100), --chaos (0–100) определяет, насколько сильно четыре варианта в сетке отличаются друг от друга, а --weird (0–3000) влияет на степень нестандартности каждого изображения по отдельности. Эти параметры не взаимозаменяемы: chaos разнообразит сетку, weird делает странной саму картинку.
Русский язык модель поддерживает начиная с V6 — визуальная разница на большинстве запросов несущественная. Тем не менее английские промпты остаются практичнее: всё сообщество, готовые шаблоны, базы стилей и туториалы с Reddit и Midjourney Discord существуют на английском. Технические термины рендера — Octane render, subsurface scattering, unreal engine — в обучающих данных встречались в латинском написании, что может влиять на предсказуемость результата. Параметры --ar, --v, --style, --q не зависят от языка описания и всегда пишутся латиницей.



