Google представила две новые модели генеративного ИИ: Nano Banana 2 Lite для изображений и Gemini Omni Flash для видео.
Gemini Omni Flash, впервые показанная на Google I/O, теперь доступна разработчикам через Gemini API и Google ИИ Studio. Модель объединяет мультимодальное рассуждение Gemini с генерацией и редактированием видео. Цена — $0,10 за секунду видео, что соответствует Veo 3.1 Fast. Среди сильных сторон — разговорное редактирование видео на естественном языке, смешение входных форматов (текст, изображения, видео) и использование знаний Gemini для генерации. Однако есть и ограничения: модель генерирует только 10-секундные клипы, не поддерживает аудио и расширение сцен, а согласованность персонажей при смене сцен или движении камеры остаётся ограниченной. API принимает видео-референсы длиной до трёх секунд, но, по заявлению Google, модель пока обрабатывает их некорректно.
| Модель | Цена за изображение | Разрешение |
|---|---|---|
| Nano Banana 2 Lite | $0,034 | 1K |
| Nano Banana 2 | $0,067 | 1K |
| Nano Banana Pro | $0,134 | 1K или 2K |
Google рекомендует использовать обе модели вместе: разработчики могут быстро создавать изображения с помощью Nano Banana 2 Lite и передавать их в Gemini Omni Flash для анимации. Для упрощения интеграции компания предлагает Interactions API, сохраняющий историю сессии и контекст, позволяя до трёх последовательных редактирований. Для демонстрации возможностей представлены три приложения: «Anywhere» (размещает пользователя на известных достопримечательностях и анимирует), «Space Lift» (генерирует дизайн интерьера из фото комнаты и превращает в видео) и «Omni Product Studio» (конвертирует статичные изображения товаров в видеоролики для e-commerce). Все сгенерированные материалы помечаются водяными знаками SynthID для верификации. Nano Banana 2 Lite и Gemini Omni Flash доступны в Google ИИ Studio, Gemini API и платформе Gemini Enterprise Agent.
Gemini Omni Flash доступна через API для генерации видео до 10 секунд по цене $0,10 за секунду.



