DeepMind представила SIMA 2 — агента с практически человеческой адаптивностью в виртуальных мирах

Google DeepMind представил первый опытный вариант SIMA?2 (Scalable Instructable Multiworld Agent) — новую версию интеллектуального агента, предназначенного не только для выполнения команд, но и для глубокого восприятия и интеграции с виртуальной средой, по словам разработчиков.

Выпущенный в марте 2024 года SIMA?1 прошёл обучение, погрузившись в сотни часов геймплея, и успешно справлялся с простыми интеракциями в различных 3D-играх, хотя при решении более сложных вызовов достигал лишь 31% успешности, тогда как люди демонстрируют около 71%.

«SIMA?2 — это эволюционный скачок к формированию универсального агента, способного справляться с комплексными заданиями в новых, незнакомых локациях и самостоятельно улучшать свои навыки, анализируя собственную практику», — отметил ведущий исследователь Джо Марино.

Новая версия строится на платформе Gemini?2.5 flash?lite — системе общего искусственного интеллекта (AGI), способной выполнять широкий круг умственных задач, осваивать новые навыки и переносить опыт между разными областями. Как подчеркнул Марино, тестирование агентов в виртуальных мирах важно для развития интеллекта: «В цифровой среде агент воспринимает её через сенсоры и воздействует на объекты через действия, подобно человеку или роботу, тогда как «бестелесный» виртуальный агент ограничивается, к примеру, редактированием календаря».

DeepMind представила SIMA 2 — агента с практически человеческой адаптивностью в виртуальных мирах
Фото: Google DeepMind

В одной из демонстраций в No Man’s Sky агент детально описывал карту планеты, обнаруживал сигналы бедствия и вырабатывал план действий. В другом игровом сценарии он аргументировал свой выбор и безошибочно находил заданную точку. Марино даже продемонстрировал, как SIMA?2 воспринимает команды, выраженные эмодзи: «Передайте ему 🌳🪓, и он срубит дерево».

Благодаря интеграции с Gemini агент погружается в фотореалистичные пространства, сгенерированные моделью Genie, и самостоятельно узнаёт объекты — будь то скамейка, дерево или порхающая бабочка, — вступая с ними в соответствующее взаимодействие.

Video Thumbnail

Механизм самообучения SIMA?2 строится на самостоятельном формулировании заданий и критической оценке выполненных действий: оказавшись в новой среде, агент обращается к Gemini за списком целей и моделью вознаграждения, после чего анализирует каждый свой шаг. Эти данные служат для адаптации стратегии, что позволяет ему постепенно повышать результативность, аналогично человеку, учащемуся на ошибках, но с усиленной поддержкой ИИ.

В DeepMind видят в SIMA?2 ключ к созданию роботов, способных решать широкий круг реальных задач. По убеждению Фредерика Бессе, для этого требуются два элемента: глубокое понимание окружения и умение выстраивать поэтапные планы. Хотя конкретные сроки переноса SIMA?2 в физические устройства пока не объявлены, публичное тестирование даёт основания полагать, что в ближайшие годы мы увидим более самостоятельные и адаптивные системы, объединяющие интеллектуальную гибкость и практическую функциональность.

 

Источник: iXBT

Читайте также