网易首页 > 网易号 > 正文 申请入驻

机器人大神圆桌(下):人形机器人,就像曾被高估的自动驾驶

0
分享至

之前,RoboX整理出GTC一场头部人形机器人企业高层圆桌的上半部分:机器人大神圆桌(上):软硬件的「相爱相杀」,以及数据的临界探索

本场圆桌可谓阵容豪华,干货满满!如今下半部分如今也整理完毕,供大家参考。圆桌嘉宾名单如下:

  • Aaron Saunders——波士顿动力CTO
  • Bernt Bornich——1X创始人兼CEO
  • Deepak Pathak——Skild AI的CEO兼联合创始人
  • Jim Fan——英伟达首席研究科学家/高级研究经理
  • Pras Velagapudi——Agility机器人 CTO

当前硬件的最大挑战

【Aaron Saunders 】-波士顿动力:

当机器人无法被准确表征,也没有经过校准,每台机器之间都会存在很大的变异性。

此时如果你只是简单地给它配上一个控制器(例如AI策略),输出就会有很大的差异性。但目前,可以通过大量的工作来最小化这种差距。我相信在这方面,Agility也有一些想法。

【Pras Velagapudi】-Agility Robotics:

是的,我认为可以将机器人投入到现实世界中进行生产,并观察其变异性,这些经验会反馈到你构建的流程中。

其中一个例子,就是Digit机器人具有完全通过学习进行的恢复行为,它们正运行在现实的生产系统上。当你在现实世界中获得经验时,会更加了解在训练流程中需要捕捉哪些关键点。

通过实际运行,我们可以加深数据多样性、域随机化和强化策略,并将这些策略迁移至刚发布的最新版Digit上。

新版机器人重了10公斤,框架也大得多。但该策略一次性就成功地转移了过来,尽管其运动学略有不同,有效载荷也更重。这是因为我们花费了大量时间强化、优化「从仿真到现实世界的转移」,真正理解了诸如足部接触等细节。

因此,我认为随着经验的积累,你会在跨实体化的过程中变得更好,而不是总需要仔细查看每个机器人的制造序列号。

【Aaron Saunders】-波士顿动力:

当你从数百台机器人增加到数千台时,你会直接面对这个问题,这不是一个选择题——当你有成千上万台机器人时,你不能为每一台单独调整软件栈,所以这是一个必须解决的问题。

【Bernt Bornich】-1X:

我同意你们俩的部份观点,尤其认同校准的重要性。但我觉得有趣的是,在进行域随机化时,实际上是在教导你的系统要保守。

这是在教系统在多变的环境中,保持安全的策略,这种方式在某种程度上掩盖了系统的动力学特性,所以这一切都取决于你想实现的目标。

如果进行域随机化,你会得到一个非常稳健的系统,但无法保持性能。而如果有了精准的校准,就可以从系统中获得更多,从长远来看这很重要。

目前我们正在进行一些令人兴奋的工作——将机器人的历史数据添加到模型的上下文中。对于每一个机器人个体,你都能获取该机器人的一些运行数据,并将其放入实际模型的历史上下文中,然后它会在其中学习它自身的动力学特性,这实际上效果出奇地好,这真的很酷。

【Deepak Pathak】-Skild AI:

这就是我们所说的RMA(Rapid Motor Adaptation),即快速运动适应。这个想法的核心是,你无法在不同版本之间更改你的模型,这是一个大问题,因为世界上不会只有一家机器人公司或一种机器人。

对于每一个应用,虽然有多种GPU及其创造的生态系统,但CUDA层将你从直接处理硬件的复杂性中抽离出来,对操作系统也是如此。

那么,当谈到解决机器人技术的问题时,什么才是与之等效的东西呢?这里我有一个稍微不同的观点——

在其他领域,无论是视觉还是语言,我们都从硬件中抽象出来。如果一家新公司(例如AMD)想要进入市场,他们必须确保其他人可以无缝地在其GPU上运行英伟达的代码。这是他们的责任,而非软件的责任。

对于机器人来说,我们不应该构建一个只适用于特定机器人的大脑,而是应该适应不同机器人。

人类大脑拥有的不是一个能做很多事的系统,而是一个学习引擎,它可以实时学习和适应。在机器人领域,我们将部署的是这些小型的学习引擎,这将是机器人与AI其他领域之间的主要区别。

【Bernt Bornich】-1X:

我认为这种区别最终会消失。

我们经常问AI能为机器人做什么,但很少反过来问机器人能为AI做什么。因为在实际操作中获取的数据,当你有一个假设,采取行动,观察结果,并从中学习,这才是真正的学习方式。

最近我们看到推理模型在数学和编程方面表现出色,因为这些都是可验证的,而机器人可以让你在所有事情上都做到这一点。

【Deepak Pathak】-Skild AI:

另一个例子是幻觉,这是LLM中的一个大问题。可是,机器人不会产生幻觉,因为它们是通过交互来学习的,如果一个瓶子推至桌子边缘,它会掉落,我可以看见,不需要猜测。因此,交互、互动是幻觉的敌人。一旦开始互动,幻觉就会消失。

【Pras Velagapudi】- Agility Robotics:

抱歉,我认为机器人还会有幻觉,只不过表现形式不同——它表现为机器人预期结果与现实世界发生的情况之间的偏差。

就像代码生成幻觉在不编译时可以验证一样,这种情况也可以验证。但它会表现为机器人执行一条不可行的轨迹,或生成错误的结果。

【Deepak Pathak】-Skild AI:

我的意思是,由于可以互动,这些问题是可以解决的。但如果没有互动的能力,那么它们永远无法被解决。

【Bernt Bornich】-1X:

实际上我有一个非常好的例子。

去年,我们遇到了「办公室里没人愿意放下马桶座圈」的问题。我们有一款早期的机器人Eve,带有轮子,非常灵活。我们让它自主进入卫生间检查马桶座是打开还是关闭状态。

这个过程中使用了GPT 4.0,结果它的判断正确率为50%,也就是说完全随机,根本无法分辨马桶座的状态。

但我们让机器人去关闭马桶座圈,这是一个自主策略。它会巡视并检查浴室,并在马桶座圈打开时将其关闭。这非常有趣,我们也因此感到很开心,这实际上是现实世界中的闭环控制。

【Pras Velagapudi】- Agility Robotics:

这就类似于在其他领域使用AI与API或编译器等交互时的闭环控制,在那里你可以发出一些结果,并通过验证阶段将信息反馈到系统的上下文中。只是在这种情况下,由于涉及到物理世界,闭环的速度会稍慢一些。

【Bernt Bornich】-1X:

没错,目前的问题是,我们虽然可以设计出像马桶座圈这样的特定事物,但还不知道如何用一套方案应对整个物理世界。

对未来2-5年的预判

【Bernt Bornich】-1X:

考虑到当前领域的进展速度,2-5年是一个相当大的范围。我会说要完全实现我们的目标,可能需要10年。

那时社会将会经历类似几百年前电力带来的变革,这是人类历史上一个有趣的时刻,届时我们可以真正专注于那些使我们成为人类的东西。

但目前没有人知道确切答案,这真的取决于社会接受机器人的速度,以及扩大制造规模的速度。我们现在正处于这样一个临界点,即它开始变得有用。

希望它不会像自动驾驶汽车那样,比预期的多花10年时间。

我确实认为在3到5年内,人形机器人将在大多数人中间普及开来,它们将成为社会的一部分,覆盖从消费者、家庭到工厂、物流等各个领域。

【Deepak Pathak】-Skild AI:

专业机器人会很快出现,而通用机器人则需要更长时间。但后者从第一天起,就会显示出其在机器人领域的价值。

【Pras Velagapudi】- Agility Robotics:

我认为挑战在于普及,这不仅仅是技术问题,还涉及到安全性、社会接受度等因素。

所以在3-5年内,我们可能会看到某些领域有更多的机器人,而在另一些领域则远少于预期。但重要的是,我们现在正见证机器人从单一用途向多用途转变的过程,也许不是通用机器人,而是多用途的。

通过新的AI平台,能够展示用一个硬件完成多件事情,我认为这是未来3到5年的关键,这种期望将成为人们努力实现的新标准。

【Aaron Saunders】-波士顿动力:

这个问题的真正难点,在于每个人的期望值并没有统一的标准。所以我通常会问的一个问题是:“我们什么时候能拥有一款像汽车对我们那样有价值的类人机器人?”我真的不知道。

汽车每天都在最极端的天气下工作,考虑到投入的材料和精力,它的成本几乎可以忽略不计。而即便是汽车本身,也无法完全比拟类人机器人可能为我们的生活带来的价值。

因此,我也认为这需要10年甚至更长时间。如果你问一位创始人,他可能会说「明年就能实现」;但如果你问技术人员,他们会说大约需要10年时间。我认为我们应该关注的,是进展的速度以及前沿阵地在哪里。

随着时间的推移,这些东西将会增长,这个领域将从分散的点逐渐连成一片——例如,Agility解决了仓库中的问题,我们有机器人进入了家庭,有的致力于汽车工厂的工作。每一个前沿阵地都会看到增长,但这不会是一蹴而就的事情。

我不认为这里有人能够预测五年后的具体情况。但我们将会见证这种增长,并且很快,所有这些成果都将开始相互重叠。

总有一天,我们会拥有自动驾驶汽车。当你回顾智能汽车的过去时,有很多关于「何时能拥有自动驾驶汽车」的预测都被证明过于乐观。

但我非常感激我的车现在具备自动车道保持辅助功能,它不会撞上前车,并防止我倒车时碰到东西。所有这些神奇的功能都源于拥有自动驾驶汽车的梦想。

顺便说一句,现在你已经可以乘坐Robotaxi了。所以是的,这花了比预期更长的时间,类人机器人的发展也将如此。

我认为只要整个行业对此充满热情,积极参与,并意识到这是一个长期的游戏,开发能够在商业环境中提供价值的专业机器人,那么在未来1到2年内我们就能够实现这一点。

Agility已经在向这一领域交付机器人了。在未来5年内,我们要让这些机器人执行10、15或20项任务。但是要解决我们想象中跨行业的所有问题,我们需要继续梦想并持续努力。

【Jim Fan】- 英伟达:

我非常赞同Deepak的观点,人们往往高估了短期内的进展,而低估了长期内的进步。所以让我将其分为短期和长期两个部分来谈谈。

我认为从技术角度来看,在接下来的2到5年内,我们将能够充分研究具身智能的规模定律。

或许在5年后或更早的时候,我们就能看到确切的数据,知道你需要购买多少GPU才能让你的机器人变得更好。所以在短期内,我们将很快以量化的方式回答这个问题。

现在让我们谈谈未来20年会发生什么。

每当我在实验室熬夜工作时,机器人总是会在做一些奇怪的事情时出故障,这让我感到非常沮丧。我会想想20年后会发生什么,然后就有力量继续前进了。20年后,有几件事情让我非常兴奋,我认为它们并不遥远。

一个是机器人技术加速科学研究:我有一些在生物医药领域的朋友,做一次实验既耗时又费力。所有的博士生都需要在实验室里照顾那些老鼠,处理那些细胞培养皿。如果我们能自动化这一切呢?自动化科学。这样可能所有的医学研究都不再需要花费数十亿美元。

它们将会被规模化,因为我们有了加速物理世界的API。也许那时会出现GR00T 10.0版本或其他类似的成果。

另一点是机器人技术自动化。为什么我们不能让机器人互相修理呢?甚至可以让它们自己组装下一代机器人。

我不认为这是科幻,因为在LLM社区中,他们已经在研究自动机器学习,即让LLM进行深入研究,找到下一个最好的Transformer,下一个最佳的智能架构。

很可能LLM会先解决这个问题,然后我们可以借鉴他们的成果,应用于物理世界。我认为这将在20年内实现。

我们出生得太晚,无法探索地球;我们又出生得太早,无法前往其他星系;但我们正好赶上了机器人技术的时代,所有会动的东西都将自动化。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
好戏连台!朱婷张常宁“巅峰对决”成焦点,吴梦洁强势崛起太惊喜

好戏连台!朱婷张常宁“巅峰对决”成焦点,吴梦洁强势崛起太惊喜

梦忆之浅
2025-11-13 02:22:42
起风了!高市还没派兵台海,中国总领事删掉18个字,日本紧急改口

起风了!高市还没派兵台海,中国总领事删掉18个字,日本紧急改口

影孖看世界
2025-11-11 18:59:15
王家卫给古二90岁外婆发律师函

王家卫给古二90岁外婆发律师函

艳儿说电影
2025-11-13 00:29:43
多一个孩子多一份希望——天门市致全体市民鼓励生育的倡议书

多一个孩子多一份希望——天门市致全体市民鼓励生育的倡议书

恪守原则和底线
2025-11-12 20:04:43
张小斐瘦身过度引争议,胸平小肚显,但气质仍在,性感由内而外?

张小斐瘦身过度引争议,胸平小肚显,但气质仍在,性感由内而外?

娱乐领航家
2025-11-10 19:00:03
大战一触即发,马杜罗请求中国军援,中方回应有玄机,美国要懂事

大战一触即发,马杜罗请求中国军援,中方回应有玄机,美国要懂事

议纪史
2025-11-08 22:10:03
惨败雷霆后!巴特勒公然不满队友防守,追梦:你自私就会被赶走

惨败雷霆后!巴特勒公然不满队友防守,追梦:你自私就会被赶走

你的篮球频道
2025-11-12 13:23:05
别再可怜李咏了!离世7年后医生揭秘离世真相,难怪选择葬身美国

别再可怜李咏了!离世7年后医生揭秘离世真相,难怪选择葬身美国

喜欢历史的阿繁
2025-11-08 15:09:21
这次,被传换过心脏的李连杰公开回应,让“一夜回春”真相大白

这次,被传换过心脏的李连杰公开回应,让“一夜回春”真相大白

石场阿鑫
2025-11-13 01:30:14
神舟二十号航天员回家有新消息:返回任务推进,地面在准备

神舟二十号航天员回家有新消息:返回任务推进,地面在准备

墨印斋
2025-11-12 17:23:53
网传:电影补贴成提款机?《火种》开机当天地方补贴7200万到手!

网传:电影补贴成提款机?《火种》开机当天地方补贴7200万到手!

眼光很亮
2025-11-10 14:21:29
英超榜首有变数!阿森纳7天对阵热刺+切尔西,曼城有望反超

英超榜首有变数!阿森纳7天对阵热刺+切尔西,曼城有望反超

体育知多少
2025-11-12 10:24:41
不是吧!勇士想要交易得到小萨博尼斯?

不是吧!勇士想要交易得到小萨博尼斯?

鬼魅突破上篮
2025-11-13 02:01:31
农村老一辈的瓜有多炸裂?网友:原来我们才是保守的一代人

农村老一辈的瓜有多炸裂?网友:原来我们才是保守的一代人

霹雳炮
2025-11-12 23:23:39
副院长与门诊副主任不雅照,背后的警示?

副院长与门诊副主任不雅照,背后的警示?

小小一米月儿
2025-11-08 08:57:20
回顾:上海机场发现可疑美国人,安检拦截开箱后,避免3400万损失

回顾:上海机场发现可疑美国人,安检拦截开箱后,避免3400万损失

元爸体育
2025-11-12 07:15:32
翁帆把旧别墅收拾得一尘不染,已经归还给了清华

翁帆把旧别墅收拾得一尘不染,已经归还给了清华

金牌娱乐
2025-11-12 09:59:54
A股:大家要做好准备,不出意外,明天,11月13日,很可能这样走

A股:大家要做好准备,不出意外,明天,11月13日,很可能这样走

甜柠聊史
2025-11-12 15:43:06
11月12日俄乌:扎波罗热怎么了?

11月12日俄乌:扎波罗热怎么了?

山河路口
2025-11-12 17:55:43
曼联向卡塞米罗发出“最后通牒”

曼联向卡塞米罗发出“最后通牒”

星耀国际足坛
2025-11-13 00:19:55
2025-11-13 05:11:00
RoboX
RoboX
关注智能汽车、机器人在内的具身智能前沿科技
194文章数 2关注度
往期回顾 全部

科技要闻

前阿里人亲述: “经济上行”期双11什么样

头条要闻

男子打92岁母亲 邻居:老人4女1子 打人者为小儿子

头条要闻

男子打92岁母亲 邻居:老人4女1子 打人者为小儿子

体育要闻

消磨你上千小时的足球游戏,走过第20年

娱乐要闻

再王珞丹和白百何 明白两人"差别"在哪

财经要闻

段永平最新访谈:聊企业经营 投资理念

汽车要闻

7座皆独立座椅/新增5座版 体验第三代吉利豪越L

态度原创

艺术
亲子
游戏
数码
公开课

艺术要闻

春色满园,惊艳美女写真让你目不转睛!

亲子要闻

男孩总是躁怒崩溃,送去医院就诊,被确诊的却是孩子父母

分析称《GTA6》延期或致PS6等主机推迟:拖到2028年

数码要闻

京东11.11办公平板成交额同比增150% 游戏平板表现亮眼

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版