Компания Google DeepMind представила новую версию своей ИИ-модели для генерации виртуальных миров — Genie 3.
Genie 3 умеет в реальном времени создавать объёмные 3D-пространства, где могут одновременно взаимодействовать как пользователи, так и автономные агенты. Продолжительность сессии значительно возросла, а модель сохраняет положение объектов, даже когда на них не направлен взгляд.
Модели мира (World models) — это особый класс искусственного интеллекта, способный создавать смоделированные виртуальные среды:
- На основе текстового описания формируется интерактивный мир, по которому можно свободно перемещаться, словно в видеоигре.
- Всё окружение генерируется автоматически, а не создаётся вручную дизайнерами.
В предыдущей версии, Genie 2, генерация мира шла по одной картинке, но исследовать его можно было лишь 10–20 секунд. В Genie 3 продолжительность взаимодействия увеличена до нескольких минут.
Модель также обладает визуальной памятью объектов на протяжении около минуты. Если отвернуться от стены с рисунком или доски с надписями, а затем снова посмотреть, всё останется на месте.
- Разрешение создаваемых миров — 720p при 24 кадрах в секунду.
- Появилась функция «сценарных событий», благодаря которой можно менять погоду, добавлять персонажей и другие динамические элементы по запросу.
Google активно вкладывает средства в развитие таких технологий. Руководителем отдела по разработке моделей мира стал один из бывших авторов Sora — проекта по генерации видео от OpenAI.

