Стартап Odyssey выпустил исследовательский превью Agora-1 — модели, которая работает как игровой движок, но целиком построена на нейросетях. В отличие от видеогенераторов вроде Sora или Veo 3, которые создают фиксированный клип, Agora-1 непрерывно просчитывает состояние игрового мира и рендерит отдельный вид для каждого из четырёх игроков. Тестовая площадка — дезматч-уровень из GoldenEye для Nintendo 64.

Проблема, которую решает Agora-1, существует с момента появления мировых моделей как класса: все они были рассчитаны на одного активного пользователя. Более ранние мультиагентные попытки — Multiverse и Solaris — давали сбои, когда игроки теряли друг друга из виду: согласованность картинки нарушалась. Odyssey подошла к задаче иначе, разделив систему на два независимых модуля.

МодельРазработчикЧисло пользователейТип выводаЗвук
Agora-1Odysseyдо 4интерактивная симуляциянет
Starchild-1Odyssey1интерактивная симуляцияда
Genie 3Google1интерактивная симуляциянет (не указано)
Sora 2OpenAI1фиксированный видеоклипнет
Veo 3Google1фиксированный видеоклипда

Первый модуль отвечает за симуляцию: он обучен на внутреннем состоянии игры и учится предсказывать, как мир меняется в ответ на действия игроков. Второй — диффузионная модель — берёт это общее состояние и превращает его в визуальный ряд, причём отдельный для каждого участника. Такое разделение позволяет Agora-1 не только воспроизводить оригинальные уровни, но и генерировать новые, сохраняя механики исходной игры.

Архитектура разделена на два модуля: один отвечает за игровое состояние, второй — диффузионная модель — генерирует визуальный ряд.

In the Agora-1 demo, up to four players can compete against each other in a simple level. | Image: Odyssey AI
In the Agora-1 demo, up to four players can compete against each other in a simple level. | Image: Odyssey AI · Источник: The Decoder

Одновременно Odyssey представила модель Starchild-1, ориентированную на одного пользователя. Она добавляет к видеогенерации синхронизированный звук и реакцию на текстовые команды в реальном времени, работая на современном железе со скоростью до 24 кадров в секунду. Публичного демо пока нет — только видеосэмплы и техническая статья.

На фоне конкурентов позиция Agora-1 неоднозначна. Google Genie 3 считается наиболее известной мировой моделью и генерирует визуально более детальные среды, однако поддерживает только одного пользователя. Sora 2 и Veo 3 принципиально иначе устроены: они создают короткие самодостаточные видео без возможности управления во время воспроизведения. Agora-1 занимает нишу интерактивной многопользовательской симуляции, которую пока никто не закрыл.

Команду возглавляют CEO Оливер Кэмерон и CTO Джефф Хоук. За пределами игровой индустрии они видят применение технологии в совместной робототехнике — когда нескольким роботам нужно согласованно рассуждать о пространстве и действиях — и в обучении ИИ-агентов внутри полностью симулированных сред. Оба сценария требуют именно того, что отличает Agora-1 от предшественников: общего мира с несколькими независимыми точками зрения.