Вторая серия мультфильма про мебельщика Михалыча, полностью созданная нейросетями, столкнулась с новыми вызовами: появление второго персонажа, сцены с двумя людьми в кадре и необходимость поддержания читаемого текста на реквизите. Автор подробно описывает шестишаговый процесс, от разбора сценария до монтажа, и делится конкретными приёмами, позволяющими избежать типичных ошибок. Основные этапы включают разбор сценария на отдельные кадры, написание детализированных промптов, генерацию статичных картинок, анимацию, озвучку и финальный монтаж.

Разбор сценария по кадрам — ключевой этап, на котором выявляются все несостыковки. Нейросеть не воспринимает сценарий целиком: она генерирует изображение по одному описанию кадра. Поэтому автор вручную составляет таблицу, в которой для каждого кадра указывает локацию, персонажей, действия, реплики, реквизит и примерную длительность. Особое внимание уделяется деталям: не «герой приходит в офис», а «герой открывает дверь, камера снаружи, видно крыльцо и вывеску». Чем детальнее таблица, тем меньше переделок на следующих этапах.

ШагЧто происходитИнструмент
1Разбор сценарияРаскладываем сценарий по кадрам в таблицувручную + Claude
2ПромптыПишем текстовые описания для генерации картинокClaude / GPT
3КадрыГенерируем статичные картинкиSovetnik AI + GPT Image
4АнимацияОживляем картинки в видеоSovetnik AI + Seedance
5ОзвучкаЗаписываем голоса, сводим звукSovetnik AI + tts (google)
6МонтажСобираем финальное видеоCapCut

На этапе написания промптов важно избегать общих фраз и противоречий. Автор приводит пример: «пожилой мужчина в свитере» даст миллион вариантов, а «мужчина 55–65 лет, плотного телосложения, тёмно-зелёный вязаный свитер поверх рубашки с воротником, очки в тонкой металлической оправе» — гораздо более определённый запрос. Для нового персонажа Кузнецова потребовалось создать карточку персонажа (референс-лист) — лист с изображениями в разных ракурсах и с разными эмоциями. Эта карточка служит эталоном при генерации каждого кадра, обеспечивая консистентность персонажа на протяжении всей серии.

Основные этапы: разбор сценария, написание промптов, генерация кадров, анимация, озвучка и монтаж.

Генерация статичных кадров выполняется с помощью Sovetnik ИИ и GPT Image. Для анимации используется Sovetnik ИИ совместно с Seedance, что позволяет «оживить» статичные картинки. Озвучка записывается через Sovetnik ИИ и синтез речи от Google (tts). Финальный монтаж происходит в CapCut. Автор отмечает, что без карточки персонажа каждый кадр с новым героем получался бы с разной причёской или чертами лица, поэтому создание эталонного изображения — обязательный шаг при введении нового действующего лица. В целом, описанный пайплайн демонстрирует, как с помощью комбинации современных ИИ-инструментов можно создавать качественный анимационный контент без участия профессиональных художников и аниматоров.