网易首页 > 网易号 > 正文 申请入驻

英伟达华人科学家告诉你,机器人发展的最新趋势

0
分享至





现在大家见过不少能跑马拉松、会跳舞的机器人,但很少有人知道,这些机器人有个致命短板 —— 没 “脑子”。

如果搞不定机器人的大脑模型,它们的价值就会大打折扣。

过去一年,虚拟世界的 AI 已经从只会聊天进化到能落地干活,商业价值得到验证,但物理世界的机器人在大脑模型上进展缓慢。

在红杉 AI 大会上,英伟达华人科学家范吉姆详解了背后原因和破局思路。

过去机器人的大脑模型叫 VLA,全称视觉语言动作模型,看起来三个元素地位平等,但实际语言才是第一优先级,视觉次之,动作最后。

这种结构带来的问题很明显:模型能轻松理解可乐罐、泰勒・斯威夫特这类名词知识,却搞不懂 “拿起”“倒水”“叠衣服” 这类物理动作。



这就是所谓的头重脚轻。

机器人真正需要的不只是知道 “这是什么”,更重要的是知道 “我做这个动作后,世界会变成什么样”,以及 “要达成目标状态,我该做什么动作”。

为什么是视频?研究发现,当视频模型学习足够多的视频后,通过预测下一帧画面,会慢慢掌握重力、浮力、光照反射这类物理规律。

比如谷歌最新的视频模型 Vue 三,不需要额外训练素材,就能真实模拟浮力和反射,甚至学会了走迷宫。

英伟达内部正在研发全新的机器人策略模型 Dream Zero,也就是 World Action Model(世界行动模型,简称 WAM)。

这个模型同时预测两件事:一是接下来的世界状态,二是接下来该采取的动作。



研究员把这种预测称为 “做梦”,如果 “梦境” 里的画面预测准确,对应的真实动作成功率就高;反之就会失败。

以后别再盯着 VLA 模型了,WAM 才是更有前景的方向。

但物理机器人需要的互动视频数据,人类从来没有系统积累过,得从零开始。

过去采集机器人数据靠遥操作:人戴 VR 眼镜、穿复杂装置远程控制机器人干活,但效率极低 —— 不仅受机器人数量和人类时间限制,实际有效采集时间每天可能仅 3 小时。

后来出现的通用操作接口 UMI,兼顾了采集速度和硬件对齐,但还是不够简单。

现在更高效的方式是第一视角人类视频:不需要操控机器人,只需要人戴着摄像头记录自己动手干活的全过程,经过简单处理就能用来训练机器人,还能完成分拣卡片、操作注射器、叠衣服这类灵巧任务。



去年 11 月,美国机器人公司 Generalist 发布的 GenZero 模型,用超过 27 万小时的第一视角视频数据,验证了这类数据遵循规模定律:预训练视频时长越长,操作能力越强。

今年 4 月推出的 Gnone 模型,训练数据提升到 50 万小时,任务平均成功率从 64% 涨到 99%,执行速度更是提升 3 倍,进一步确认了这套数据逻辑。

范吉姆预判,未来一两年,传统遥操作的数据占比会降到几乎可以忽略,人类第一视角视频会成为机器人训练数据的主力。

光靠预训练学知识还不够,还需要强化练习。

但在真实环境里做强化学习成本极高,搭建 100 万个机器人的训练环境几乎不可能。

所以需要把现实环境数字化,让机器人在虚拟世界练手,再回归真实场景,也就是 “现实到虚拟再到现实”。



英伟达的 DreamDojo 就是这样的机器人仿真世界模型,只要输入机器人的连续动作信号,就能输出动作在虚拟场景中的效果。

可以把它看成机器人的 “练功房”,机器人不用在真实世界摔杯子、撞桌子,先在虚拟环境练到 95 分,再到现实里补齐最后的 5 分细节。

最后范吉姆也提到了英伟达的核心逻辑:算力等于环境,环境等于数据,训练机器人的源动力还是算力。

虚拟世界的 AI 还在抢算力,物理世界的机器人很快也要加入这场算力争夺战。

至于算力供不应求的局面还要持续多久,大家可以在评论区聊聊。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
别吹姆巴佩了!法国世界杯头号大腿!他一人 Carry 全队!

别吹姆巴佩了!法国世界杯头号大腿!他一人 Carry 全队!

澜归序
2026-07-01 07:43:30
签了签了!正式加盟热火!42分神射手搭档字母哥

签了签了!正式加盟热火!42分神射手搭档字母哥

篮球实战宝典
2026-07-01 07:56:47
特朗普限制“出生公民权”行政令,被驳回

特朗普限制“出生公民权”行政令,被驳回

第一财经资讯
2026-07-01 08:23:37
哈兰德:我实在踢不动加时赛了;挪威对阵巴西胜算非常小

哈兰德:我实在踢不动加时赛了;挪威对阵巴西胜算非常小

懂球帝
2026-07-01 07:33:52
他们节俭了一辈子,临走前捐出500万

他们节俭了一辈子,临走前捐出500万

澎湃新闻
2026-06-30 07:00:31
关于网传字节员工炒美股赚3kw美刀,厂哥了解到的一些情况

关于网传字节员工炒美股赚3kw美刀,厂哥了解到的一些情况

大厂青年
2026-06-30 22:54:53
7月1日正式落地!聘用60岁以上工人不再随意,违规一次亏几十万

7月1日正式落地!聘用60岁以上工人不再随意,违规一次亏几十万

娱乐圈的笔娱君
2026-07-01 03:47:03
别让善心喂饱“释永信”?韩红高管年薪超60万,网友评论一针见血

别让善心喂饱“释永信”?韩红高管年薪超60万,网友评论一针见血

北纬的咖啡豆
2026-06-30 14:22:16
伊朗外长:美国不配主办国际赛事,所作所为演示了如何挥霍东道主该有的体面;此前美国土安全部长称对伊朗在世界杯淘汰感到“很开心”

伊朗外长:美国不配主办国际赛事,所作所为演示了如何挥霍东道主该有的体面;此前美国土安全部长称对伊朗在世界杯淘汰感到“很开心”

极目新闻
2026-07-01 08:05:54
世界杯超保真死亡之组!4队全死完了:3队进32强 短短2天都被淘汰

世界杯超保真死亡之组!4队全死完了:3队进32强 短短2天都被淘汰

风过乡
2026-07-01 07:11:43
情难自禁!巴拉圭乳神现场观战淘汰德国,晒出多张美照后热泪横流

情难自禁!巴拉圭乳神现场观战淘汰德国,晒出多张美照后热泪横流

新杀猪的秀才
2026-06-30 12:53:25
审计署抽查60县,平均每个县翻出10个亿问题资金

审计署抽查60县,平均每个县翻出10个亿问题资金

风向观察
2026-06-30 10:44:34
韩国球迷集体声讨,让中国承担他们世界杯全部费用,是国足坑了他们

韩国球迷集体声讨,让中国承担他们世界杯全部费用,是国足坑了他们

史智文道
2026-06-30 22:19:38
他们早已离婚,一个在上海独自养娃,一个在西班牙向名媛求婚

他们早已离婚,一个在上海独自养娃,一个在西班牙向名媛求婚

胡一舸南游y
2026-06-30 13:43:20
马斯克力挺遭欧洲封杀的电影:好莱坞不希望你看到

马斯克力挺遭欧洲封杀的电影:好莱坞不希望你看到

移光幻影
2026-06-30 08:31:30
言论惹巨大争议!美国高官:伊朗队出局太高兴了,我唱歌跳舞庆祝

言论惹巨大争议!美国高官:伊朗队出局太高兴了,我唱歌跳舞庆祝

全景体育V
2026-06-30 12:36:20
收的是20块避雨费,丢的是一座城市的温度

收的是20块避雨费,丢的是一座城市的温度

清哲木观察
2026-06-30 16:25:33
印度一家五口揣9万卢比来上海,以为能买半条街,一顿火锅后傻了!

印度一家五口揣9万卢比来上海,以为能买半条街,一顿火锅后傻了!

犀利强哥
2026-07-01 01:49:42
仅剩20%!中国第一个消失的沙漠比台湾大,NASA:地球更绿了

仅剩20%!中国第一个消失的沙漠比台湾大,NASA:地球更绿了

抽象派大师
2026-06-30 01:34:25
中国空调“爆卖”欧洲:市场受欢迎程度超预期,中欧班列紧急补货

中国空调“爆卖”欧洲:市场受欢迎程度超预期,中欧班列紧急补货

经济观察报
2026-06-30 17:43:32
2026-07-01 08:59:00
你在彼方
你在彼方
你在彼方
844文章数 106关注度
往期回顾 全部

科技要闻

苹果刚涨价!预付款消费者就被要求补差价

头条要闻

父母花20万为娃办借读发现准考证是假的 孩子无缘中考

头条要闻

父母花20万为娃办借读发现准考证是假的 孩子无缘中考

体育要闻

德国足球,脸都不要了

娱乐要闻

黄晓明沦陷!羡慕周杰伦能降住昆凌

财经要闻

中东局势再添变数

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

手机
本地
亲子
游戏
家居

手机要闻

爱马仕橙退场!iPhone 18 Pro红色款偷跑:年度爆款色预定

本地新闻

贵州小城的新目标:举办“村超”世界杯!

亲子要闻

不是所有的老弟都叫老弟

今年首个1000万销量的游戏,居然让我锻炼视力?

家居要闻

传奇筑 日常诗

无障碍浏览 进入关怀版