На конференции Volcano Engine FORCE компания ByteDance представила пять новых моделей искусственного интеллекта, ключевой из которых стала система генерации видео Seedance 2.5. Модель способна создавать единый видеоклип длительностью до 30 секунд без применения постобработки и склейки кадров, включая изменения сцен и темпа. Это приближает её к возможностям коммерческих решений вроде Open ИИ Sora, хотя точное сравнение качества пока не проводилось.

Seedance 2.5 поддерживает до 50 дополнительных входных сигналов одновременно — референсные изображения, аудиодорожки и другие параметры, что полезно для сцен с несколькими персонажами или сложным окружением. Пользователи могут редактировать сгенерированное видео постфактум, сохраняя общий визуальный стиль. Обновлённая Seedance 2.0 теперь работает в нативном 4K с 10-битной глубиной цвета.

Volcano Engine — облачная платформа ByteDance, через которую компания предоставляет свои ИИ-модели корпоративным клиентам. Помимо видеомоделей, анонсированы языковая модель Doubao 2.1 Pro, которая, по заявлению компании, стоит примерно на 80% меньше, чем Claude Opus 4.6 от Anthropic, а также модели генерации изображений Seedream 5.0 Pro и аудиомодель Seed-Audio 1.0.

Модель обрабатывает до 50 дополнительных входных данных: референсные изображения, аудио, стили

Запуск Seedance 2.5 запланирован на начало июля. Учитывая, что ведущие игроки рынка — Open ИИ, Runway, Pika — также стремятся увеличить длину и согласованность генерируемого видео, новинка ByteDance может усилить конкуренцию в сегменте. Пока не раскрыты детали о качестве генерации, артефактах и стоимости использования для разработчиков.