网易首页 > 网易号 > 正文 申请入驻

游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

0
分享至


新智元报道

编辑:定慧

【新智元导读】英伟达让AI仅靠「看直播」就学会了通用游戏操作。虚拟世界已成为物理智能的黑客帝国,看4万小时直播学会几乎所有游戏!

众所周知,特斯拉的FSD之所以被奉为神作,核心就在于它那套「端到端」的硬核逻辑。

车子不再依赖死板的高精地图,也不依赖传感器,而是像个老司机一样:

眼睛看着路(视觉输入),脚下直接踩油门、手里直接打方向(行动输出)。


那么问题来了,如果把这套逻辑搬到游戏场景里让AI学习,会发生什么?

道理完全是一样的!以前的AI玩游戏,还得靠读后台数据、甚至得「开挂」才能知道敌人在哪。

但真正的人类玩家是咋样的?

是我们盯着屏幕上的像素(视觉),大脑一转,手指直接噼里啪啦敲键盘、按手柄(操作)

比如Faker的切屏,属于人类的顶尖反应速度了。


从画面直接到鼠标键盘的操作,这就是游戏界的「FSD」。

英伟达最近就整了这么个狠活!

发布了一个叫NitroGen的新模型,它完全不按套路出牌。


项目地址:

https://nitrogen.minedojo.org/assets/documents/nitrogen.pdf

这个模型不是靠读游戏代码长大的,而是蹲在YouTube和Twitch上:

硬生生「看」了4万个小时带有手柄画面的游戏实况!


它就像个极其好学的「云玩家」,通过观察人类怎么操作,直接学会了在各种游戏里该怎么走位、怎么平A。

不管是RPG还是横版过关游戏,它都能拿捏。


你可能会问:光看视频咋学会操作?我又不知道主播按了哪个键。

这就不得不佩服英伟达研究员的脑洞了。

他们专门挖掘了YouTube和Twitch上那些带有「控制器叠加画面」的视频。

对,就是那种主播在屏幕角落放个小手柄,按哪个键,画面上的手柄也会跟着亮的视频。


NitroGen就盯着这4万个小时的视频素材,一边看游戏画面里发生了什么(比如林克挥了一剑),一边看角落里的手柄哪个键亮了(比如按了X键)。

这就像是一个想学吉他的人,不看乐谱,而是把几万场演唱会视频里吉他手的指法特写全看了一遍,硬生生把「听觉」和「手指动作」给对应上了!

也只有AI能干这活了。

拒绝「偏科」,做个通用的六边形战士

以前的游戏AI往往是「专才」,会玩《王者荣耀》的绝对不会玩《超级马里奥》。

但NitroGen主打的就是一个「通才」。

它学习了超过1000款不同的游戏。

这可能意味着它练就了一种「游戏直觉」!


就像我们人类玩游戏一样,你只要玩过魂游,比如《艾尔登法环》之类的,再上手一款新的动作游戏《黑神话:悟空》,哪怕没见过,你也大概知道左摇杆是跑,右边按键是打。

测试数据显示,当把NitroGen丢进一款它从未见过的新游戏里时,它的表现比那些从零训练的模型强了52%

不管是动作RPG、平台跳跃,还是Roguelike,它都能迅速上手。


下一步:从海拉鲁大陆走向现实世界

英伟达这一波操作,仅仅是为了造一个更强的NPC陪我们玩吗?

格局小了,英伟达的野心更大!

先来看看最近AI在游戏中的表现。

The Decoder最新的研究发现,现在的AI甚至已经开始具备复杂的推理能力


研究者通过一个《塞尔达传说》中的经典变色谜题,对当前顶尖大模型的推理能力进行了一场别开生面的「压力测试」。

测试要求模型在不联网的情况下,仅凭截图规划出六步操作以解开谜题。

结果显示,模型间的差距一目了然:


  • GPT-5.2-Thinking展现了惊人的统治力,快速且准确地秒杀全场;

  • 谷歌的Gemini 3 Pro虽然也能解题,但有时会陷入冗长的试错循环,推理文本竟长达42页;

  • 而Claude Opus 4.5则在视觉理解上翻车,需借助数学公式辅助。


作者认为:这种强大的推理能力结合英伟达NitroGen等自主智能体技术,预示着:

人类撰写游戏攻略和软件文档的时代即将终结,AI将彻底改变我们获取指导信息的方式

比如在《塞尔达传说》里那种需要预判6步以上的变色谜题,现在的AI模型已经能像解数学题一样解开了。

而NitroGen的潜力更进一步,它不仅能玩,还能记录和复盘

想象一下,未来AI玩一遍游戏,顺手就能把「白金攻略」给你写出来,甚至把游戏里的Bug自动修了,这还要啥自行车?

(感觉游戏科学的《黑神话:钟馗》大概率要上AI技术了)


但老黄真正的野心,其实藏在代码里:NitroGen是基于英伟达的GR00T(机器人基础模型)构建的。


这波野心很大!


  • 在游戏里,它学的是:看到悬崖->知道会掉下去->控制手柄跳过去。

  • 在现实里,它对应的就是:看到地上的水坑->知道会滑倒->控制机器人的腿跨过去。


虚拟世界,其实就是物理世界最高效的「练兵场」。

英伟达正在用游戏里的千万次试错,为未来走进我们家里的机器人,打造一个能应对一切混乱的「通用大脑」。

或许有一天,当你感叹队友操作太神的时候,屏幕对面坐着的,真的可能不是人。


而是一个真的机器人拿着手柄在和你打游戏!

游戏即现实

视频游戏已经从单纯的AI测试基准,演变为物理智能的训练场。

这不仅是游戏AI的胜利,更是机器人技术跨越「莫拉维克悖论」的关键转折点。

从「大脑」到「身体」的跨越

在过去十年中,人工智能领域经历了从感知智能到认知智能的飞跃。

然而,尽管大语言模型能够撰写诗歌、编写代码甚至通过律师资格考试,它们在面对物理世界时却往往显得笨拙不堪。

一个能通过图灵测试的AI,可能无法控制机械臂完成最简单的「把杯子放进洗碗机」的任务。

这就是著名的「莫拉维克悖论」:对计算机而言,实现逻辑推理等高阶智慧只需要很少的计算能力,而实现感知、运动等低阶智慧却需要巨大的计算资源。

具身智能旨在解决这一问题,它要求智能体不仅要「思考」,还要拥有「身体」,能够与环境进行物理交互。

长期以来,具身智能的发展受限于两大瓶颈:


  1. 数据匮乏

    互联网上充斥着万亿级别的文本数据,却缺乏同等规模的、带有精确动作标签的机器人数据。

  2. 泛化困难

    传统的强化学习(RL)算法通常只能在特定的环境(如围棋棋盘或特定的工厂流水线)中表现优异,一旦环境发生微小变化,模型就会失效。

游戏作为现实的模拟器

2025年,我们看到了一条解决上述瓶颈的全新路径:利用视频游戏作为通向物理世界的桥梁

游戏提供了丰富的视觉环境、复杂的物理规则和明确的任务目标,且天然具备数字化、可扩展的特性。更重要的是,游戏世界中的「感知-决策-行动」闭环与物理机器人完全同构。

具身智能体要在复杂且不可预测的现实世界中生存,仅靠条件反射式的反应是不够的。

它必须具备深度的推理与规划能力。

塞尔达变色球谜题的挑战

该谜题源自《塞尔达传说》系列游戏,规则看似简单实则极其考验逻辑:


  • 场景

    一个由红色和蓝色球体组成的网格。

  • 规则

    点击一个球体,会改变其自身以及上下左右相邻球体的颜色(红变蓝,蓝变红)。

  • 目标

    通过一系列点击,将所有球体变为蓝色。


这一谜题的本质是一个约束满足问题或图论问题。

其复杂性在于状态空间的组合爆炸操作的不可逆性

玩家不能只关注当前这一步的收益,必须预判未来几步的状态变化。

这需要极强的前瞻性规划能力,即在脑海中构建一棵「决策树」,并推演不同分支的结果,这正是人类认知心理学中定义的「系统2」思维——慢速、从容、有逻辑的思考。


根据The Decoder的深度评测:

当前最顶尖的AI模型在面对这一挑战时表现出了显著的代际差异,这直接反映了它们作为具身智能体「大脑」的潜力。

GPT-5.2-Thinking的成功不仅在于它解出了谜题,更在于它展示了一种算法内化的趋势。

例如,当机器人面对一个堆满杂物的桌子时,它能够像解决塞尔达谜题一样,在「脑海」中预演:「如果我先拿底下的书,上面的杯子会倒;所以我必须先移开杯子。」

这种能力是实现从「自动化机器」向「自主智能体」跨越的关键。

如果说GPT-5.2解决了「想什么」,那么英伟达的NitroGen模型则解决了「怎么做」。

NitroGen的发布标志着机器人学习进入了「ImageNet时刻」,利用互联网规模的数据来训练通用的运动控制策略。

NitroGen团队提出了一种极其巧妙的「数据挖掘」策略:利用游戏直播中常见的输入叠加层

这一策略的精妙之处在于,它将原本「无监督」的视频数据瞬间转化为了「有监督」的「视觉-动作」对。

英伟达利用这一技术,构建了包含40,000小时、覆盖1000多种游戏的NitroGen数据集。

这在机器人学习领域是前所未有的规模。

仿真层:世界模型作为机器人的「黑客帝国」

在电影《黑客帝国》中,尼奥在虚拟世界中学习功夫。


而对于机器人而言,世界模型(World Models)就是它们的「矩阵」。

若机器人能在极其逼真的虚拟世界中每秒经历数千次试错,其进化速度将远超物理时间的限制。

综合上述分析,通过游戏实现通用智能体的路径不仅可行,而且已经初具雏形。

这条路径可以概括为:「在游戏中学会控制,在仿真中学会物理,在现实中学会适应。」

未来的通用智能体必然是分层架构的:


  • 顶层(大脑)

    类似GPT-5.2的推理模型,负责处理长程规划、逻辑谜题和人类指令理解。

  • 中层(小脑)

    类似NitroGen的通用策略模型,负责将高层指令翻译成具体的运动轨迹,利用海量视频数据获得的「运动直觉」。

  • 底层(脊髓)

    基于GR00T的高频全身控制器,负责具体的电机力矩输出和平衡维持。



尽管前景光明,但仍有几个关键问题亟待解决:


  1. 触觉反馈的缺失

    游戏和视频主要是视觉和听觉的,缺乏触觉。NitroGen学不到「物体有多重」或「表面有多滑」。

  2. 高精度操作

    目前的视觉-动作模型在粗糙动作(如走路、抓取大物体)上表现良好,但在需要毫米级精度的操作(如穿针引线、精密装配)上仍有不足。这可能需要更高分辨率的视觉编码器或专门的精细操作策略。

  3. 安全性与伦理

    当机器人具备了自主规划能力,如何确保其目标函数与人类价值观对齐?「洗碗」指令不应导致机器人「打破盘子以最快速度清空洗碗池」。


游戏不再仅仅是娱乐,它们是人类为AI构建的摇篮。

在这个摇篮里,AI学会了规划(Zelda),学会了控制(NitroGen),学会了世界的物理法则(Cosmos)。

当它们走出摇篮,进入Project GR00T的躯体时,我们将见证真正的物理智能的诞生。

这不仅是技术的胜利,更是人类通过创造虚拟世界来反哺现实世界的各种可能性的终极体现。

参考资料:

https://the-decoder.com/a-zelda-puzzle-proves-ai-models-can-crack-gaming-riddles-that-require-thinking-six-moves-ahead/

https://the-decoder.com/nvidia-wants-to-create-universal-ai-agents-for-all-worlds-with-nitrogen/

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
莫拉蒂:小因模仿了穆帅但模仿得很拙劣,因为穆帅赢了三冠王

莫拉蒂:小因模仿了穆帅但模仿得很拙劣,因为穆帅赢了三冠王

懂球帝
2026-01-06 00:48:09
美军如何进行电子压制,让委内瑞拉部署的中俄防空系统失效?

美军如何进行电子压制,让委内瑞拉部署的中俄防空系统失效?

兵国大事
2026-01-05 18:02:20
浙江一新修的柏油马路,村民能徒手从路面底部掏出沙土,被质疑偷工减料!当地乡政府:只能起到监督作用,已跟进此事

浙江一新修的柏油马路,村民能徒手从路面底部掏出沙土,被质疑偷工减料!当地乡政府:只能起到监督作用,已跟进此事

洪观新闻
2026-01-05 15:14:36
为什么“正义使命-2025”演习中,我海军指战员都戴上了头套?

为什么“正义使命-2025”演习中,我海军指战员都戴上了头套?

百态人间
2025-12-31 16:24:02
邮报:曼城相信如果格伊帮助他们冲击冠军,投入会被回报抵消

邮报:曼城相信如果格伊帮助他们冲击冠军,投入会被回报抵消

懂球帝
2026-01-06 01:20:38
香蕉再次被关注!研究表示:糖尿病常吃香蕉,不过半年或有5好处

香蕉再次被关注!研究表示:糖尿病常吃香蕉,不过半年或有5好处

小童历史
2026-01-03 15:12:36
KKV深圳卓悦中心店再被强制闭店,双方回应

KKV深圳卓悦中心店再被强制闭店,双方回应

南方都市报
2026-01-05 22:26:30
上海99-77大胜广厦 球员评价:5人满分,2人及格,4人低迷

上海99-77大胜广厦 球员评价:5人满分,2人及格,4人低迷

篮球资讯达人
2026-01-05 22:15:58
何炅,确认停更!

何炅,确认停更!

深圳晚报
2026-01-05 10:34:20
我61岁,退休金6800存款60万,血的教训告诉我,不要跟谁再续前缘

我61岁,退休金6800存款60万,血的教训告诉我,不要跟谁再续前缘

堇色夜行
2025-01-16 19:24:12
新年才过四天,三甲医院谭薇落马,一个眼科专家的政治近视。

新年才过四天,三甲医院谭薇落马,一个眼科专家的政治近视。

游者走天下
2026-01-05 14:02:35
案例:四川一别墅无人居住,男子深夜潜入,竟发现屋中堆满上亿现金

案例:四川一别墅无人居住,男子深夜潜入,竟发现屋中堆满上亿现金

可儿故事汇
2024-11-08 21:20:16
影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

徐帮阳
2025-12-23 18:33:38
北一女师班群传蒋万安演讲遭攻击!区桂芝批:不负责任

北一女师班群传蒋万安演讲遭攻击!区桂芝批:不负责任

新时光点滴
2026-01-06 00:03:49
5年前差点倒闭的车企,逆袭成2025年的销冠?!

5年前差点倒闭的车企,逆袭成2025年的销冠?!

黑马公社
2026-01-05 09:38:16
太可怕!一郑州女孩哭诉断供经历,高位购100万的房子,损失70万

太可怕!一郑州女孩哭诉断供经历,高位购100万的房子,损失70万

火山詩话
2026-01-05 16:29:44
董璇携女拍新年美照 母女同穿紫旗袍温馨养眼

董璇携女拍新年美照 母女同穿紫旗袍温馨养眼

述家娱记
2026-01-05 15:03:25
陪睡陪玩根本不够,网红曝睡遍顶流、舔手指认干爹,个个荒唐离谱

陪睡陪玩根本不够,网红曝睡遍顶流、舔手指认干爹,个个荒唐离谱

骄阳之夏明
2026-01-06 04:51:54
抖音第二总部今年启动开工建设,坐标深圳!

抖音第二总部今年启动开工建设,坐标深圳!

GA环球建筑
2026-01-06 00:06:37
上海市政府征兵办发布2026年兵役登记通告

上海市政府征兵办发布2026年兵役登记通告

上观新闻
2026-01-05 21:10:17
2026-01-06 06:16:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14261文章数 66434关注度
往期回顾 全部

游戏要闻

梦幻西游刀削面斩获畅玩服第一封系环圈,全新56三法伤戒指出炉

头条要闻

马杜罗庭审陈词:我是一个正派的人 是我们国家总统

头条要闻

马杜罗庭审陈词:我是一个正派的人 是我们国家总统

体育要闻

50年最差曼联主帅!盘点阿莫林尴尬纪录

娱乐要闻

《探索新境2》王一博挑战酋长岩

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

科技要闻

4100家科技企业集结赌城,CES揭开AI新战场

汽车要闻

海狮06EV冬季续航挑战 "电"这事比亚迪绝对玩明白了

态度原创

旅游
房产
健康
教育
艺术

旅游要闻

198.33万人次市民游客元旦假期畅游浦东,文旅市场迎来开门红

房产要闻

再次登顶海南楼市!超越阿那亚的,只有阿那亚!

这些新疗法,让化疗不再那么痛苦

教育要闻

深圳学籍卡打印别急!3分钟轻松搞定

艺术要闻

2026马年赵孟頫高清集字春联大放送,收藏备用!

无障碍浏览 进入关怀版