Google представила игровой AI-агент SIMA 2

Первая версия SIMA была запущена ещё в марте 2024 года, но тогда это был, скорее, ранний прототип, который мало что умел. Хотя SIMA 1 распознавал более 600 разных команд, все они были максимально простыми: поверни налево, подойди к лестнице, посмотри на карту и т. д. Агент пользовался теми же инструментами, что и человек: виртуально нажимал на клавиатурные кнопки, двигал мышкой и смотрел на происходящее на экране. Интересно, но специализированные боты всё равно были заметно лучше.

Вторая версия сильно прокачалась: теперь она понимает сложные инструкции, может общаться с игроком и рассуждает, основываясь на мире вокруг. Например, в No Man’s Sky SIMA 2 понимает, на какой планете находится и может описать местность, заодно сообщив о свой текущей деятельности:

Отдавать команды AI-компаньону теперь можно простым языком: не говорить «поднимись на лестницу, там сверни налево, осмотрись и возьми синее ведро», а просто «найди красный дом» или «собери ресурсы». Как выяснили разработчики, подобное взаимодействие ощущается как взаимодействие с напарником, а не ботом:

Процент выполненных тестовых заданий
Процент выполненных тестовых заданий

Ещё одним огромным шагом вперёд стало самообучение. SIMA 2 может обучиться на одной игре, а затем применить полученные знания на другой. Иными словами, научившись, например, собирать ресурсы в одной игре, агент будет пытаться собрать их и в другой, которую видит первый раз:

Процент выполненных агентом задач на играх, в которые его раньше не запускали
Процент выполненных агентом задач на играх, в которые его раньше не запускали

Самообучение также работает и для разных действий: методом проб и ошибок SIMA 2 с каждым разом всё лучше выполняет те или иные действия, в том числе и те, которым агента вовсе не обучали и в тех играх, которые до сих пор не задействовались.

Чтобы проверить свою теорию о самообучении, разработчики поместили SIMA 2 не в реальные игры, а в полностью сгенерированные при помощи Genie 3 пространства. И вот, пожалуйста: агент, основываясь только на визуальном анализе окружения, также смог выполнять задания:

Таких потрясающих результатов удалось добиться, взяв за основу систему искусственного интеллекта общего назначения Gemine от самой Google.

Увы, без недостатков тоже не обошлось и они типичны для текущих версий ИИ — ограниченные возможности в выполнении сложных, многокомпонентных задач. Агент не способен составить коварный многоходовый план по разорению конкурента, пойдя в начале миссии на его поляну и лишив ключевого редкого ресурса, пока этот остолоп собирает побочные.

Кроме того, агент не запоминает многие действия. Он может насобирать ресурсов и будет понимать, что они у него есть, но вот вспомнить, где и при каких условиях и, главное, зачем всё это делалось — увы.

Так что пока придётся обходиться в коопе живыми напарниками, тем более, не известно, какие ресурсы нужны для работы SIMA2. Если агента запускали на обычный видеокарте — это одно дело, а если использовали несколько специализированных, то о локальном применении можно забыть на долгие годы. Тут 5090-то не всегда одну только графику тянет, куда уж ИИ-напарников или ИИ-противников.

Однако, сомнений нет — именно такими, рассуждающими и обучающимися будут NPC в будущих играх. Так, глядишь, лет через 30-40 и реализуется обещанный ещё в первом «Сталкере» A-life.

P.S. Ещё у меня есть бессмысленные и беспощадные ТГ-каналы (ну а как без них?):

Об играх и игровой индустрии: https://t.me/gameprodev;

О науке, творчестве и прочей дичи: https://t.me/deeplabscience.

2
1
Начать дискуссию