Как адаптировать чужой референс под бренд с помощью Gemini и Kling: пошаговый разбор

Подготовлено редакцией Malakhov AI

Habr AI·21 апр.·2 минРоссияКод

Автор взяла референс с Pinterest, заменила цвета, объекты и логотип через Gemini, а затем анимировала результат в Kling — и задокументировала каждый шаг, включая ошибки. Ключевой вывод: сложные задачи нужно дробить на атомарные промпты, а не пытаться решить одним запросом.

Кратко

—Замена цвета через Gemini сработала с первого промпта — достаточно указать hex-код #FF5894.
—Попытка заменить объекты одним промптом дала плоский, нереалистичный результат.
—Генерация каждого 3D-объекта отдельно, а затем сборка сцены — дала нужный результат.
—Фраза «without altering the background» в промпте предотвратила нежелательную дорисовку фона.
—Финальная анимация создана в Kling с детальным описанием физики, текстур и движения камеры.

Глоссарий · 6 терминов▾

Промпт: Текстовый запрос, который пользователь отправляет генеративной модели для получения изображения, текста или видео.
Декомпозиция промптов: Разбивка сложной задачи на несколько последовательных простых запросов вместо одного составного.
Маскот: Персонаж-символ бренда, используемый в визуальной коммуникации и фирменном стиле.
Kling: Сервис для генерации видео на основе текстового описания или загруженного изображения.
Референс: Исходное изображение или пример, на который ориентируются при создании нового визуального материала.
Айдентика: Система визуальных элементов бренда: цвета, шрифты, логотип, персонажи и стиль оформления.

Редизайн чужого изображения под корпоративный стиль — задача, которую дизайнеры раньше решали в Photoshop за несколько часов. Автор материала на Habr прошла тот же путь через Gemini и Kling, зафиксировав не только удачные шаги, но и тупики.

Отправной точкой стал референс с Pinterest — предположительно тоже сгенерированный — с автоматом-краном в стиле KFC. Первый шаг оказался простым: Gemini без проблем перекрасил изображение в фирменный розовый #FF5894 по одному короткому запросу. Сложности начались на втором шаге, когда потребовалось заменить вёдра KFC на корпоративных персонажей-маскотов. Промпт «замени вёдра на иконки и сделай их объёмными» вернул плоский, нереалистичный результат. Нейросеть не понимала, как именно должен выглядеть объём в конкретном контексте сцены.

Здесь автор сформулировала ключевой принцип работы с генеративными моделями: нельзя просить выполнить сложное составное действие в одном промпте. Задачу нужно разбивать на атомарные операции. Вместо того чтобы просить сразу «замени объект и сделай его объёмным», она сначала сгенерировала каждую 3D-игрушку отдельно — с подробным английским промптом, описывающим материал («inflatable cushion», «matte texture»), угол подачи (45 градусов) и стиль (plush toy на белом фоне). Только получив три готовых объекта, она вернулась к основной сцене и попросила Gemini вставить их, сохранив объём и разные направления взгляда.

Попытка заменить объекты одним промптом дала плоский, нереалистичный результат.

Отдельного внимания заслуживает этап замены логотипа. Первые попытки давали артефакты — нейросеть начинала «фантазировать» и изменяла фон автомата. Решением стало добавление уточнения «without altering the background of the machine itself». Одна фраза убрала нежелательное поведение модели и зафиксировала результат.

После сборки финального изображения автор перешла в Kling — сервис для генерации видео по картинке. Первый промпт описывал базовую механику: коготь опускается, захватывает игрушку, поднимает её. Второй, расширенный вариант добавил физику падения, замедленную съёмку и реакцию кучи игрушек на упавший объект. Детализация промпта напрямую повлияла на качество анимации — чем точнее описаны текстуры, освещение и движение, тем меньше модель додумывает самостоятельно.

Подход, описанный в материале, применим не только к брендинговым задачам. Декомпозиция промптов — стандартная практика при работе с любыми мультишаговыми задачами в генеративных моделях. Попытка уместить несколько трансформаций в один запрос почти всегда снижает качество: модель теряет приоритеты и усредняет результат. Последовательная цепочка коротких точных запросов даёт предсказуемый контроль над каждым элементом сцены.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США

Продолжить по разделам

Как адаптировать чужой референс под бренд с помощью Gemini и Kling: пошаговый разбор

Кратко

Читать дальше

VK вылетел из App Store, а в России готовят регулирование ИИ

«Яндекс» запустил платформу для создания ИИ-агентов в «Алисе ИИ»

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США