На Tribeca Film Festival состоялась премьера короткометражки Dear Upstairs Neighbors от Google DeepMind при участии бывшего аниматора Pixar Конни Цинь Хэ. Это не просто очередной эксперимент с генеративным ИИ, а демонстрация того, как кастомные модели могут служить bespoke-инструментом для художников, а не заменой творческому процессу. Фильм рассказывает историю уставшей девушки Ады, которой мешают заснуть шумные соседи сверху. Чтобы визуализировать её фантазии, художница Yingzong Xin создала серию концепт-артов в Photoshop и на бумаге акриловыми красками. Эти иллюстрации имели специфический экспрессионистский стиль, который стандартные модели text-to-video не способны воспроизвести с необходимой консистентностью.

Разработчики DeepMind обучили кастомные версии моделей Veo и Imagen на этих концепт-артах, что позволило генерировать кадры, соответствующие видению режиссёра. Однако ключевое отличие от других ИИ-проектов фестиваля — в workflow: сначала сцены грубо анимировались в Autodesk Maya (отраслевой стандарт для 3D-риггинга и VFX), затем эти черновики подавались в Veo, который улучшал визуальную полировку. Финальные кадры дополнительно обогащались стилизованными ассетами, сгенерированными Veo и Imagen. В результате получилась цельная картина, избежавшая типичных проблем генеративного ИИ — визуальной непоследовательности и неестественности.

Контраст с другими фильмами секции был разительным. Roar от Illuminai Studios больше напоминал дезориентирующий монтаж ИИ-клипов, а ChikaBOOM! от Asteria Film Co. страдал от недостатка визуальной и звуковой полировки. Эти проекты использовали стандартные, некастомизированные модели, что подтверждает тезис: генеративный ИИ сам по себе не способен создать качественное кино. Dear Upstairs Neighbors, напротив, стал примером синергии человека и машины: все творческие решения принимали люди, а ИИ выступал как ускоритель и улучшатель промежуточных результатов.

Разработчики обучили кастомные версии моделей Veo и Imagen на этом арте, чтобы добиться визуальной согласованности.

An animated gif of a young woman typing on her laptop at a desk.
An animated gif of a young woman typing on her laptop at a desk. · Источник: The Verge AI

Хотя фильм частично является рекламой технологий Google, он задаёт верное направление для индустрии. Вместо того чтобы кормить ванильные модели подсказками в надежде на чудо, студиям стоит инвестировать в кастомизацию моделей под конкретные проекты. Только так генеративный ИИ сможет приносить реальную пользу, а не порождать "видео-шлак", захламляющий интернет. Пока что Tribeca показал: будущее голливудского ИИ — не в универсальных генераторах, а в bespoke-инструментах, созданных в коллаборации с художниками.