网易首页 > 网易号 > 正文 申请入驻

我的王者荣耀有救了!谷歌发布游戏SIMA 2,不开外挂「像人一样」练级

0
分享至


新智元报道

编辑:定慧

【新智元导读】如果一个AI,像人类一样看屏幕、敲键鼠、自己练级变强,这种游戏搭子,你愿意拥有吗?可能不久将来,类似王者荣耀、DOTA 2这样的游戏就可以选择和AI组队,而不是和人组队了!

想象一个智能体,它「出生」在一个虚拟3D游戏中,能推理,能学习。

并且,它不走后门,去操纵游戏底层指令,而是和人一样,只「观看」屏幕画面,并且使用「虚拟键盘和鼠标」来进行操作。

也就是,创造一个智能体,但完完全全「像人一样」去打游戏。

这就是谷歌DeepMind推出的SIMA 2智能体!

一个能陪你在虚拟世界中一同游戏、推理和学习的智能体。


我觉得DeepMind才是那个不忘初心的「Open」AI公司。

不管是从下围棋的AlphaGo再到破解生命之谜的AlphaFold等等Alpha系列。

然后还有谷歌主打的Gemini大模型系列,以及世界模型Genie 3系列,等等。

可以说谷歌在AI领域是全方面、全栈式发力。

SIMA 2可以说是朝着通用人工智能方向迈出的重要一步。

SIMA,全称Scalable Instructable Multiworld Agent,可扩展指令多世界智能体。

别看现在它只是观看屏幕打游戏,如果能够「像人」一样理解游戏画面并做出正确的操作。

那么可以将这种推理和理解能力扩展到其他世界中,甚至也可以拓展到具身智能,这就是SIMA真正的野心。

这意味着,可能不久以后,我们就可以在游戏中组队类似SIMA智能体。

我的DOTA2、我的王者荣耀、我的英雄联盟手游好像终于有救,希望以后的MOBA类游戏都能出一个类似的选项,选择和AI组队,而不是和人组队。

推理的力量

在SIMA 1中,智能体学会了执行超过600种语言指令技能,例如拍梯子、打开地图。

在SIMA 2中,智能体已经可以突破单纯的指令跟随的局限。

通过将Gemini作为智能体的核心引擎,SIMA 2不仅能响应指令,还能对指令进行思考与推理。

比如下面MineDojo游戏中,SIMA 2可以完全在这个「从未见过」的游戏中,靠着推理能力完成任务。


SIMA 2是用什么数据训练的呢?

DeepMind使用带有人类演示视频、语言标签以及Gemini生成标签的混合数据对SIMA 2进行训练。

某种意义上,这种思路和特斯拉FSD的端到端具有异曲同工之妙,再更深一步,只要给AI数据和算力,AI肯定能学会「人类这点能力」。

SIMA 2不仅能响应用户提问,还能对其自身行为及所处环境进行逻辑推理。


研究人员在博客中也感慨,与SIMA 2互动时,真的感觉更像是在与一个「伙伴、游戏搭子」一起系统合作。

这或许也算是SIMA 2通过游戏上的「图灵测试」。

谷歌认为这个能力的底层逻辑还是Gemini带来的,靠着强大的推流能力,SIMA 2可以在复杂的3D环境中进行感知。

泛化能力飞跃

谷歌推出SIMA 2,除了用游戏训练是初期最合适的手段外,另一个考量就是增强智能体的泛化能力。

SIMA 2能够理解并完成长期复杂的任务。

短期指令,比如左转、走三步、爬梯子都是比较容易了,但是如何完整的「打通」游戏关卡才是验证通用能力的关键。

SIMA 2现在可以在未经预训练的情况下攻克全新的游戏。(左边是Gemini的推理过程,右边是SIMA在操作游戏)


除了语言指令,SIMA 2还能理解多模态的提示。

比如,用户在画面中绘制一个路线草图,SIMA理解玩家的意思,然后再操作。

在游戏中画个红框+箭头,让智能体据此操作。


其他的理解能力还有,符号。

比如用户发送一个+树木的表情符号,然后智能体就屁颠颠的说「好吧,我不睡,我去砍树去」。


泛化能力的另一个体现是在不同游戏之间的迁移。

比如A游戏中学会的「挖掘」,可以应用于B游戏的「采集」。

下面这个图展示SIMA 2相对SIMA 1能力的巨大提升。


终极考验:畅游想象世界

谷歌为了测试SIMA 2的泛化能力,使用了Genie 3来配合。

Genie 3生成全新的3D模拟世界,然后让SIMA 2在这些「架空世界」中行动。

Genie 3本身会遵循物理规律生成世界,但是和真实世界的展现又可能完全不同。

谷歌的测试结果是,SIMA 2依然能保持良好的环境适应能力。


可扩展的多任务自我提升

SIMA 2最令人兴奋的能力是能够自我学习,自我进化,自我提升。

谷歌说在整个训练过程中,SIMA 2智能体能够通过试错和基于Gemini的反馈引导,执行更加复杂的任务。

在最初从人类示范中学习后,SIMA 2能够过渡到完全通过自主游戏继续学习。

在全新世界学习时,无需额外的人类生成数据。


左侧展示的是初代SIMA 2智能体未能完成的任务示例。

而右侧则显示经过多轮训练迭代后,SIMA 2已实现自我提升,整个过程完全无需人类反馈或游戏数据介入。


SIMA 2能在很多不同类型的游戏里运行,这对检验「通用智能」非常关键。

在这些游戏中,智能体可以学会各种技能、练习复杂的推理,还能通过自己玩游戏不断提升能力。

不过,SIMA 2目前还是研究阶段的系统,离真正的「通用具身智能」还有距离。

它在处理那种特别长、特别复杂、需要很多步推理和反复检查目标的大任务时,还是会吃力。

它对交互过程的记忆也不算长,只能在有限的上下文里工作,以保证响应足够快。

另外,想要只用键盘鼠标就做出非常精细的操作,或者稳定地看懂复杂的3D场景,这些在整个领域里都还是难题。

这项研究说明了一条新的路:

通过大量、多类型的虚拟世界数据,加上Gemini很强的推理能力,可以训练出一个通用的智能体,把原本分散在不同专用系统里的能力整合到一起。

SIMA 2也为未来的机器人应用打下了基础。

它学到的能力——比如导航、用工具、和他人协作完成任务——正是将来让机器人在现实世界中成为「智能助手」所需要的底层模块。

参考资料:

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
皇马球迷意难平!不止因为1-1赫罗纳三轮不胜,更多在于以下4点!

皇马球迷意难平!不止因为1-1赫罗纳三轮不胜,更多在于以下4点!

球场新视角1号
2026-04-11 08:27:10
全网都在夸秦昊“治”好了伊能静,我却看到了这段婚姻里最「残酷」的一面

全网都在夸秦昊“治”好了伊能静,我却看到了这段婚姻里最「残酷」的一面

看书有道
2026-04-08 19:15:37
夏克立遭爆「狂传对镜自慰裸照」!2女被迫上床 前经纪人心痛发声

夏克立遭爆「狂传对镜自慰裸照」!2女被迫上床 前经纪人心痛发声

ETtoday星光云
2026-04-09 12:22:15
帕米尔高原被我国收回,一经勘探后悔不已:捡了芝麻,丢了西瓜?

帕米尔高原被我国收回,一经勘探后悔不已:捡了芝麻,丢了西瓜?

史记云烟
2026-04-08 14:53:05
欣旺达成为特斯拉供应商!

欣旺达成为特斯拉供应商!

电动知家
2026-04-10 09:22:44
互射对方球门!北京10岁孩子集体踢假球原因曝光:不想赢球当头名

互射对方球门!北京10岁孩子集体踢假球原因曝光:不想赢球当头名

念洲
2026-04-11 07:46:32
西安铁路局家属院物业修建立体车库引11号楼业主不满,居民:楼旁建立体车库 谁同意了? 街道办:住建部门已叫停!

西安铁路局家属院物业修建立体车库引11号楼业主不满,居民:楼旁建立体车库 谁同意了? 街道办:住建部门已叫停!

大风新闻
2026-04-11 09:06:03
正式退役?无缘大名单,陈芋汐安置或曝光,3选1,6位数年薪

正式退役?无缘大名单,陈芋汐安置或曝光,3选1,6位数年薪

卿子书
2026-02-03 16:35:03
打伊朗踢到铁板!美国破防了,美媒撕破脸:中国不驻军害惨了我们

打伊朗踢到铁板!美国破防了,美媒撕破脸:中国不驻军害惨了我们

史智文道
2026-04-11 12:01:39
全球又要大乱?俄中将阵亡,美油管被炸,四国集体失声!

全球又要大乱?俄中将阵亡,美油管被炸,四国集体失声!

星星没有你亮
2026-04-09 11:32:47
勇士爆冷!库里11+5首发最低,国王四人20+,波杰30+3波神也拉胯

勇士爆冷!库里11+5首发最低,国王四人20+,波杰30+3波神也拉胯

鱼崖大话篮球
2026-04-11 12:51:36
脑梗最怕的三种维生素,不妨了解!

脑梗最怕的三种维生素,不妨了解!

药师方健
2026-04-10 22:05:32
家里若是有这7种“老物件”,好好保存,越放越值钱,能当传家宝

家里若是有这7种“老物件”,好好保存,越放越值钱,能当传家宝

Home范
2026-04-11 10:16:28
比赖清德还狂的人出现了,如果她当选台湾领导人,解放军必定收台

比赖清德还狂的人出现了,如果她当选台湾领导人,解放军必定收台

芳芳历史烩
2026-03-29 21:09:31
中超巨大争议!刘浩帆进球被吹,浙江球员集体暴怒,罗斯气笑了

中超巨大争议!刘浩帆进球被吹,浙江球员集体暴怒,罗斯气笑了

奥拜尔
2026-04-10 20:33:54
“保不住香港,我们以死谢罪!”,解密惊心动魄的香港经济保卫战

“保不住香港,我们以死谢罪!”,解密惊心动魄的香港经济保卫战

文史道
2025-02-18 20:31:56
工信部原党组副书记、副部长苏波:我们有可能在“十五五”末期建成新能源汽车强国

工信部原党组副书记、副部长苏波:我们有可能在“十五五”末期建成新能源汽车强国

每日经济新闻
2026-04-11 10:51:07
Shams:湖人已裁掉后卫科比-巴夫金

Shams:湖人已裁掉后卫科比-巴夫金

北青网-北京青年报
2026-04-11 12:48:06
43岁谢婷婷再夺网球冠军!小7岁男友全程陪同,曾挺32周孕肚比赛

43岁谢婷婷再夺网球冠军!小7岁男友全程陪同,曾挺32周孕肚比赛

小樾说历史
2026-04-10 11:59:20
孙杨一家5口同住杭州大平层,首次公开孩子,父母出镜婆媳关系好

孙杨一家5口同住杭州大平层,首次公开孩子,父母出镜婆媳关系好

离离言几许
2026-04-09 15:47:15
2026-04-11 13:24:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14945文章数 66765关注度
往期回顾 全部

游戏要闻

DF评测《星空》PS5/Pro 版:频繁崩溃、优化拉胯

头条要闻

牛弹琴:伊朗很悲壮 向美国提高了"要价"

头条要闻

牛弹琴:伊朗很悲壮 向美国提高了"要价"

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

浪姐7淘汰 该走的没走,不该走的走了

财经要闻

从日本翻身看:这次谁能扛住高油价?

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

亲子
教育
游戏
手机
公开课

亲子要闻

童趣与春的浪漫共舞,两只小精灵在花瓣堆里奔跑

教育要闻

今年考研调剂:A区有哪些大学的名额多?B区有哪些高校的指标多?

《幻想生活i》销量突破150万套之后开始进军手游平台

手机要闻

橙色版OPPO Find X9 Ultra手机渲染图曝光

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版