网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

具身智能机器人年度总结，来自英伟达机器人主管

2026-01-05 13:05:46　来源: 量子位

北京举报

0

分享至

henry 发自凹非寺
量子位 | 公众号 QbitAI

“机器人领域仍处于蛮荒时代。”

这是英伟达机器人主管Jim Fan，在2025年，即将收官之际给出的判断。

乍一听，这个结论多少有些刺耳。

毕竟，在这一年里，我们已经看到机器人打乒乓球、打篮球，完成复杂的长程搬运与跨场景任务——

当然，也少不了各种翻车“冥”场面。

但就像Jim Fan，以及聪明的网友反复指出的那样：

很多演示，本质上只是从上百次尝试中，挑选出来的最好一次。

这背后，恰恰暴露出机器人领域至今缺乏统一、可复现的标准评测体系的核心问题。

也正因如此，几乎人人都能通过添加限定词，宣称自己达到了SOTA。

除此之外，Jim Fan还指出——

当前机器人硬件进展快于软件，但硬件可靠性不足，反而限制了软件的迭代速度；同时，主流的VLM→VLA技术范式本身也存在结构性问题。

以下为分享全文：

2025年，机器人领域教给我的3件事

所有人都在为vibe coding感到兴奋。在节日气氛中，请允许我分享一下我对“机器人领域狂野西部”的焦虑——这是我在2025年学到的3个教训。

硬件走在软件前面，但硬件可靠性严重限制了软件迭代速度

我们已经看到了极其精妙的工程杰作：Optimus、e-Atlas、Figure、Neo、G1等等。

但问题是，我们最好的AI还远没有把这些前沿硬件的潜力榨干。（机器人）身体的能力，明显强过大脑目前能发出的指令

然而，要“伺候”这些机器人，往往需要一整个运维团队。

机器人不像人类那样会自我修复：过热、马达损坏、诡异的固件问题，几乎是日常噩梦。

错误一旦发生，就是不可逆、也不宽容的。

真正被scaling的，只有我的耐心。

机器人领域的基准测试，依然是一场史诗级灾难

在大模型世界里，人人都知道MMLU、SWE-Bench是怎么回事。

但在机器人领域没有任何共识：用什么硬件平台、任务如何定义、评分标准是什么、用哪种模拟器，还是直接上真实世界？

按定义来说，每个人都是SOTA——因为每次发新闻，都会临时定义一个新的benchmark。

每个人都会从100次失败里，挑出那次最好看的demo

到2026年，我们这个领域必须做得更好，不能再把可复现性和科学规范当成二等公民。

基于VLM的VLA路线，总感觉不太对

VLA指的是Vision-Language-Action（视觉-语言-动作）模型，目前这是机器人大脑的主流范式。

配方也很简单：拿一个预训练好的VLM checkpoint，在上面“嫁接”一个动作模块。

但仔细想想就会发现问题。VLM 本质上是被高度优化用来爬诸如视觉问答这类 benchmark的，这直接带来两个后果：

VLM的大多数参数，都服务于语言和知识，而不是物理世界；
视觉编码器被主动训练去丢弃低层细节，因为问答任务只需要高层理解，但对机器人来说，微小细节对灵巧操作至关重要。

因此，VLA 的性能没有理由随着VLM参数规模的增长而线性提升。问题出在预训练目标本身就不对齐。

相比之下，视频世界模型（video world model）显然是一个更合理的机器人策略预训练目标。我正在在这个方向上下重注。

在Jim Fan的推文下面，不少网友也表示了赞同。

有网友表示，硬件的容错能力确实非常重要：

硬件约束导致迭代变慢，是一个常被低估的瓶颈。软件可以高频更新，但物理系统必须建立在可靠的机械基础上，而这需要真实时间去验证和打磨。

硬件很关键，但数据很重要

在Jim Fan的讨论中，硬件被放到了核心位置，但与此同时，我们也发现数据作为一个核心元素被忽略了。

在机器人研究中，数据塑造模型能力，而模型的发挥又离不开硬件，这是其典型的全栈特性。

在今年，我们已经看到了像Figure03、宇树H2、众擎T800、小鹏IRON机器人、智元精灵G2等全新硬件本体。

从展示效果看，这些新硬件在运动能力上表现亮眼：

无论是宇树的翻跟头，还是小鹏机器人的步态控制，都已明显超出年初的平均水平，并且证明了大型机器人（成年人身高）也能像小型机器人一样灵活。

但真正现实的问题可能正如Jim和网友谈到的，如何在维持高性能的同时，进一步提升硬件可靠性，例如抗摔性、电池发热、长时间运行稳定性等工程层面的挑战。

在数据方面，今年最值得注意的例子之一是Generalist，它通过大量的数据规模证明了具身智能的Scaling law。

其中，数据越大，模型参数越高，模型在具体任务上的表现也就越好，符合我们在LLM上观察到的现象。

与此同时，也出现了像Sunday这样方便数据采集的定制化机器人硬件。

这套系统与机器人的手部协同设计，利用技能捕捉手套采集人类动作数据，并能以近90%的成功率转换为机器人可用数据。

同样受到关注的还有Egocentric-10K，一个汇集了1万小时工作数据的大型数据集。

可以说，在具身智能领域，数据的重要性已不言自明。但具体的数据路线仍未收敛：人类中心采集（可穿戴设备、Umi、视频）、真机遥操数据、仿真数据，以及互联网数据、数据模态、配比仍是开放问题。

2025机器人年度词汇——VLA

在模型方面，VLA毫无疑问是2025机器人领域最热的词汇。

根据伦敦国王学院、香港理工大学等研究机构的最新综述，仅2025年一年就发表了超200篇VLA工作。

前段时间更是有网友调侃道：2026年可能会有一万篇VLA工作。

那么，VLA到底是啥呢？

简单来说，VLA 赋予了机器人一个大脑，这个“大脑”可以同时处理以下三种模态的信息：

视觉 (Vision, V)：通过摄像头感知环境，理解物体的形状、位置、颜色、状态和场景布局。
语言 (Language, L)：理解人类的自然语言指令（例如，“把桌上的红苹果放到碗里”）并进行高层推理。
动作 (Action, A)：将理解的指令转化为机器人可以执行的低级物理动作序列（例如，移动关节、抓取、推动等）。

传统机器人通常需要为每个新任务进行专门编程或训练，而VLA模型通过大规模数据学习，能够执行训练中未明确见过的任务，甚至在陌生环境下也能工作，从而具备泛化性。

但正如Jim Fan在上面提到的，基于VLM (视觉-语言模型) 的VLA模型，其骨架本质上是为问答和知识推理而优化的，其庞大的参数库和服务目标，与机器人所需的物理世界精细操作存在严重错位。

在这篇综述中，我们也找到了对Jim Fan提出的观点的一些回应，以问答形式梳理如下：

Q：VLM的视觉编码器倾向丢弃低层物理细节，仅保留高层语义（如“这是苹果”）。而这些微小细节恰恰决定了抓取、推动等动作的成功率

A：未来的 VLA 需要整合物理驱动的世界模型，内部表征 3D 几何、物理动态、因果关系和可供性，实现语义指令与物理精度的统一。

Q：由于VLM预训练目标与机器人控制不对齐，增加模型参数并不会线性提升性能。

A：通过“形态无关表征”解耦高层语义规划与低层本体感知控制，使通用机器人大脑能够通过轻量适配器实现零样本跨具身迁移，从而发挥数据规模带来的泛化能力，而非盲目堆叠参数。

Q：Jim Fan建议以视频世界模型作为机器人预训练目标，因为它天然编码时序动态与物理规律。

A：当前研究趋势是将世界模型能力“嫁接”到VLM上，例如训练数据驱动模拟器学习物理动态，再嵌入VLA作为解耦内部模拟器，实现显式规划，使VLA从“被动序列生成器”转向主动物理感知智能体。

此外，在数据和评测基准方面，综述更倾向“仿真派”，提出以模拟优先、失败为中心的数据范式。

一方面，依赖真实世界的大规模异构数据不可持续，未来需转向高保真模拟环境生成多样化轨迹。

另一方面，应充分利用失败轨迹，从中学习，提高数据利用效率。

在评测方面，现有标准过于依赖二元成功率，难以反映鲁棒性、效率和安全裕度。未来必须进行更全面的能力评估。

One more thing

最后插播两条趋势性消息：

据摩根士丹利的研究，机器人产业有望从当前的910亿美元激增至2050年的25万亿美元。

与此同时，硅谷巨头除微软/Anthropic外，全部加码机器人软/硬件。

所以，虽然现实很骨感，但机器人题材依旧sexy～

[1]https://suyuz1.github.io/Survery/

[2]https://x.com/DrJimFan/status/2005340845055340558[3]https://x.com/rohanpaul_ai/status/2004891515878080673

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

全球禁运AI芯片或将大幅升级！刚刚披露，美国草案划定超严格红线

新智元 2026-03-06 13:16:09
0 跟贴 0
英特尔具身智能机器人，竟解锁了rap技能

机器之心Pro 2025-11-26 15:20:41
0 跟贴 0

谁在决定AI手机的未来：模型、系统，还是生态？

DeepTech深科技 2026-01-13 16:16:47
0 跟贴 0

新颖鳍足机器人，水陆两栖行动自如，适应各种地形

装甲铲史官 2025-12-25 10:58:04
0 跟贴 0
美国开发六足机器人，跑起来堪比飞人博尔特

装甲铲史官 2026-01-03 11:19:04
809 跟贴 809

马斯克：3年内机器人超越顶尖医生

财联社 2026-01-09 15:31:35
2 跟贴 2

看懂日本工业，从一台工业机器人开始

虎嗅APP 2026-01-15 23:28:34
27 跟贴 27
人形机器人产业突破关键在于“大脑”核心技术

每日经济新闻 2025-09-16 20:30:32
1 跟贴 1

荣耀首款人形机器人亮相MWC跳太空舞步

财联社 2026-03-04 01:56:27
0 跟贴 0
让机器人看视频学操作技能

机器之心Pro 2026-01-19 13:12:57
0 跟贴 0
宇树科技王兴兴：给机器人行业多一点耐心

财联社 2026-02-18 18:01:39
0 跟贴 0
倒计时10天，2026 AI最佳场景渗透案例火热征集中

36氪 2026-03-06 18:26:08
0 跟贴 0
灵巧手作为独立执行平台，实现工业与家庭场景应用

量子位 2025-12-11 03:38:13
0 跟贴 0
行业最大规模具身数据集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟贴 0
破解机器人「慢半拍」难题1

机器之心Pro 2026-02-10 14:06:54
0 跟贴 0
机器人打包运输的正确方式

装甲铲史官 2026-02-22 10:41:15
0 跟贴 0
机器人管家Figure 03来了，承包一切家务！

量子位 2025-10-11 10:13:00
0 跟贴 0
五八智能四足机器人平台Q20A，适用于千行百业

量子位 2025-09-30 15:35:41
0 跟贴 0
波士顿机器狗练成“轻功”！连续七个后空翻

量子位 2025-09-07 01:03:18
0 跟贴 0
行业最大规模具身数据集！出自简智机器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟贴 0
支持远程操控和通用GUI操作3

机器之心Pro 2026-03-02 13:36:13
0 跟贴 0
人活着的唯一理由是善良

叶檀财经 2026-02-01 17:07:04
0 跟贴 0
小心！你的AI正在一本正经地忽悠你

财联社 2026-02-05 16:35:01
0 跟贴 0
宝马宣布：人形机器人进厂打工

财联社 2026-03-04 01:56:36
0 跟贴 0
荒野求生（机器狗全自主版），2025ATEC挑战真实户外无遥操

量子位 2025-12-08 19:24:34
0 跟贴 0
太夸张了！腾讯大厦排长龙，竟是为了一只「龙虾」

雷科技 2026-03-06 18:21:33
0 跟贴 0
大模型的下半场，属于拥有云+AI全栈引擎的玩家

量子位 2026-01-30 03:29:45
0 跟贴 0
前豆包PC负责人齐俊元创业，传做Agent手机

智东西 2026-03-06 18:04:11
0 跟贴 0
微信聊天遭老板监视，主流杀毒软件失明

每日经济新闻 2025-12-25 19:02:17
0 跟贴 0
陶哲轩：AI看似在推理，其实是在背答案

量子位 2026-01-05 09:20:21
0 跟贴 0
2026年，AI初创全球化的「变与不变」｜沙龙招募

量子位 2026-03-06 18:09:29
0 跟贴 0
国家发改委主任点赞无人机在长江南京段送外卖：又快又稳又方便

现代快报 2026-03-06 17:58:15
0 跟贴 0
利元亨董事长周俊雄：扶持具身智能机器人软硬一体制造基地加速新质生产力转化

每日经济新闻 2026-03-05 22:15:05
0 跟贴 0
硬核迎新！合肥南亚理工技工学校创新引入智能机器狗助力开学迎新工作

网易安徽 2026-03-05 18:03:06
0 跟贴 0
英伟达慌了，自动驾驶芯片，中国后来居上了

互联网.乱侃秀 2026-03-06 12:06:08
19 跟贴 19
6G争夺战提前打响：英伟达跨界“抢戏”，华为、高通、爱立信加速卡位

每日经济新闻 2026-03-06 17:51:02
0 跟贴 0
黄仁勋全世界穿皮衣，唯独在中国换上了大花袄

雷科技 2026-01-27 17:19:30
0 跟贴 0
美国拟将AI芯片出口管制扩展至全球英伟达、AMD等公司出口需获许可

财联社 2026-03-06 17:26:33
0 跟贴 0
设定故事，未来智能机器人

冰淇淋看电影 2026-03-05 10:31:19
1 跟贴 1
当千亿参数撞上5毫米芯片

钛媒体APP 2025-12-10 11:10:12
0 跟贴 0

“一天能挣五六百元”，广东老板街头排队抢人！网友：能不能带我一个

“一天能挣五六百元”，广东老板街头排队抢人！网友：能不能带我一个

深圳晚报

2026-03-05 20:53:31

特朗普脖子上这一大片是咋了？

观察者网

2026-03-05 15:14:18

诺奖得主辛顿最新访谈：1 万个 AI 可以瞬间共享同一份“灵魂”，这就是为什么人类注定被超越

诺奖得主辛顿最新访谈：1 万个 AI 可以瞬间共享同一份“灵魂”，这就是为什么人类注定被超越

AI科技大本营

2026-03-05 19:04:57

“从上海某银行取现20万，一出门就被抢劫？”太离奇！不对劲！5人被刑拘

“从上海某银行取现20万，一出门就被抢劫？”太离奇！不对劲！5人被刑拘

环球网资讯

2026-03-06 09:59:18

不敢喝了！4大头部椰子水全造假，100%纯椰水全是水+糖 +科技狠活

不敢喝了！4大头部椰子水全造假，100%纯椰水全是水+糖 +科技狠活

川渝视觉

2026-03-04 20:09:52

上热搜，真的假的？中国055大驱编队穿越霍尔木兹海峡

上热搜，真的假的？中国055大驱编队穿越霍尔木兹海峡

武器纵论

2026-03-05 21:16:33

1050亿元！常州首富是他

常州大喇叭

2026-03-06 13:55:17

央视怒批，目不识丁、洋相百出，难怪两会上冯远征建议演员多学习

央视怒批，目不识丁、洋相百出，难怪两会上冯远征建议演员多学习

泪满过眼

2026-03-06 02:07:23

高市早苗白折腾一场，好不容易找到的稀土，被中国一句话戳破

高市早苗白折腾一场，好不容易找到的稀土，被中国一句话戳破

面包夹知识

2026-03-05 12:28:09

炸场！字节跳动启动最大规模转正实习生招聘：拟招超7000人

炸场！字节跳动启动最大规模转正实习生招聘：拟招超7000人

快科技

2026-03-06 15:16:08

1961年，周恩来看着节目单脸色大变，提起笔就把那个重头戏给划了

1961年，周恩来看着节目单脸色大变，提起笔就把那个重头戏给划了

鹤羽说个事

2026-03-01 18:39:56

真炸了！油价破80，运费20万，美军这一炸，把中国"底牌"炸出来了

真炸了！油价破80，运费20万，美军这一炸，把中国"底牌"炸出来了

阿校谈史

2026-03-04 11:25:00

你最爽的经历是什么？网友：约过一个比我大好几岁的姐姐

你最爽的经历是什么？网友：约过一个比我大好几岁的姐姐

带你感受人间冷暖

2026-02-16 01:10:39

全国人大代表田轩表示：尽量不要调休，尽量扩大公共假期

全国人大代表田轩表示：尽量不要调休，尽量扩大公共假期

每日经济新闻

2026-03-06 17:12:18

巴基斯坦奉劝伊朗，有两个中东国家不能动，情商比莫迪高一个维度

巴基斯坦奉劝伊朗，有两个中东国家不能动，情商比莫迪高一个维度

策前论

2026-03-06 18:21:27

14亿人都不会忘却！揭开核酸大王张核子的真面具：权力变现大公

14亿人都不会忘却！揭开核酸大王张核子的真面具：权力变现大公

大鱼简科

2026-02-07 09:52:29

9分钟满电、1000公里纯电，比亚迪真能颠覆电动车？

9分钟满电、1000公里纯电，比亚迪真能颠覆电动车？

电动星球News

2026-03-05 23:24:56

央视怒批，目不识丁、洋相百出，难怪两会上冯远征建议演员多学习

央视怒批，目不识丁、洋相百出，难怪两会上冯远征建议演员多学习

仙味少女心

2026-03-05 17:30:43

600号边上，上海这家名字特别的研究所火了！招聘要求博士，还给编制！网友好奇：上班即修仙？

600号边上，上海这家名字特别的研究所火了！招聘要求博士，还给编制！网友好奇：上班即修仙？

极目新闻

2026-03-05 17:12:31

不服就干！土耳其打响反美第一枪，通告全球：断的就是特朗普退路

不服就干！土耳其打响反美第一枪，通告全球：断的就是特朗普退路

霁寒飘雪

2026-03-06 09:25:58

追踪人工智能动态

12221文章数 176403关注度

往期回顾全部

科技要闻

独家|除夕加班、毫无黑料！林俊旸无奈离场

头条要闻

中东战火重燃之际金正恩时隔半年再度登上"最大的船"

头条要闻

中东战火重燃之际金正恩时隔半年再度登上"最大的船"

体育要闻

跑了24年，他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌，夫妻感情稳定

财经要闻

关于经济、股市等，五部门都说了啥？

汽车要闻

逃离ICU，上汽通用“止血”企稳

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

数码

健康

家居

公开课

军事航空

数码要闻

苹果顶级服务拒绝清库存！主动取消M4 MacBook订单：换成最新M5

转头就晕的耳石症，能开车上班吗？

家居要闻

暖棕撞色轻法奶油风

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

伊朗：使用无人机击中美军"林肯"号航母

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版