网易首页 > 网易号 > 正文 申请入驻

AlphaGo作者领衔,DeepMind新作登Science子刊

0
分享至

来源:市场资讯

(来源:量子位)

一群机械臂手忙脚乱地自己干活,彼此配合、互不碰撞。

科幻大片场景真的走入现实了。优雅,实在是优雅。


△视频中为4个机械臂,在仿真环境下4个安装在桌子上,另外4个安装在天花板上。

这就是发表在Science子刊Science Robotics上,由DeepMind、Intrinsic AI和UCL等研究机构共同提出的最新成果——RoboBallet(机器芭蕾)。


RoboBallet创新性地将图神经网络(GNN)用于强化学习,作为其策略网络和状态-动作价值估计,以解决多机器人(机械臂)协作运动规划中的复杂问题。

这一方法最多可以同时控制8个机械臂,协调多达56个自由度的配置空间,并处理多达40个共享任务, 每一步规划仅需0.3毫秒,且任务分配和调度完全不受约束。

值得一提的是,这篇论文的通讯作者——Matthew Lai,可谓是谷歌DeepMind的资深研究员。自2016年加入谷歌DeepMind以来,他曾参与过AlphaGoAlphaZero等明星项目。


利用图神经网络与强化学习

总的来说,RoboBallet的核心是把图神经网络与强化学习结合起来,采用图神经网络(GNN)作为策略网络和状态-动作价值估计,解决了大规模多机器人任务分配、调度和运动规划的联合问题,实现了在计算上高效、可扩展且能零样本泛化的高质量轨迹规划

具体来说,在现代自动化制造中,核心挑战在于如何让多个机器人在共享的、充满障碍物的空间中无碰撞地高效协作,以完成大量任务(如焊接、装配等)。

这涉及到三个高度复杂的子问题:

这三个子问题一组合,复杂度急剧增加,传统算法在真实场景中往往难以计算可行解,工业界目前主要依赖耗时且劳动密集的人工规划。

因此,为了应对这种高维复杂性,RoboBallet就被用来在随机生成的环境中进行任务和运动规划,其能够为与训练期间所见环境不同的环境(具有任意障碍物几何形状、任务姿态和机器人位置)规划多臂抓取轨迹。

为了实现这一点,RoboBallet在数据表示层面,创新性地将整个场景建模为图结构


其中,图中的节点代表场景中的核心实体,包括机器人、任务和障碍物,而边(Edge)则表示这些实体之间的关系(例如,相对姿态)。

机器人节点之间存在双向边,以支持相互协调和避碰。而任务节点和障碍物节点到机器人节点则存在单向边,用于向机器人传递规划所需的环境信息(如图c)

接下来,RoboBallet使用图神经网络(GNN)作为策略网络,通过权重共享来处理不断变化的图大小。其以观测图作为输入,并在每个时间步为所有机器人生成指令关节速度。这使得机械臂能够在只接收原始状态作为输入的情况下,进行关系和组合推理。

而在具体的策略学习和评估阶段,RoboBallet通过微调TD3(Twin-Delayed Deep Deterministic Policy Gradient)算法来训练策略网络,使模型能够生成多机械臂轨迹,同时解决任务分配、调度和运动规划等子问题,使得昂贵的在线计算转移到了离线训练阶段。

(注:在此任务中,机械臂因成功解决任务和避免碰撞而获得奖励)

同时,为了解决稀疏奖励的问题,RoboBallet还采用了Hindsight Experience Replay方法,使模型能够在没有人工设计的奖励函数的情况下高效学习。

在具体的部署方面,RoboBallet使用Franka Panda七自由度机械臂、在随机障碍物和任务的模拟环境进行训练。


为了验证性能,研究团队在一个包含4(8)个机器人、40个任务和30个障碍物的模拟工作单元中进行测试,并与RRT-Connect方法进行比较。值得一提的是,这一切都只需在一块 GPU(图形处理单元)上完成,无论是真实的还是模拟的多臂工作单元。

实验表明,RoboBallet在多个关键指标上表现出色:

在训练时间的扩展性方面,即使任务数量增加四倍,RoboBallet收敛所需的训练步数也只是略有增加。


在规划速度方面。实验表明,在推理阶段,即便是包含8个机器人和40个任务的最大场景,每个规划步在NVIDIA A100上只需约0.3毫秒,能够实现10 Hz时间步下超过300倍的实时规划速度

在单个Intel Cascade Lake CPU核心上,每个步长大约需要30毫秒,在10Hz时间步下仍比实时快约3倍。每个规划步骤包括对整个场景进行一次推理和一次碰撞检测。

在多智能体协同方面,随着机器人数量从4个增加到8个 ,平均执行时间减少了约60%


而在泛化性方面,模型在随机生成的环境中训练后,无需额外训练即可零样本迁移(zero-shot)到具有不同机器人位置、障碍物几何形状和任务姿态的新环境中。

最后,RoboBallet 的高速和可扩展性使其能够应用于工作单元布局优化(将任务执行时间缩短了33%)、容错规划和基于在线感知的重新规划等新能力。


[1]https://x.com/GoogleDeepMind/status/1965040645103407572

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
亡国146年:琉球人忘了汉语,却把 “我是中国人” 刻进骨子里

亡国146年:琉球人忘了汉语,却把 “我是中国人” 刻进骨子里

通文知史
2025-11-18 21:15:03
分析:在杜兰特和布拉德利·比尔离开后,太阳队如何超越预期?

分析:在杜兰特和布拉德利·比尔离开后,太阳队如何超越预期?

好火子
2025-11-20 04:06:18
释永信被正式批捕!挖出哪些不为人知的秘密?私下里他和谁在一起

释永信被正式批捕!挖出哪些不为人知的秘密?私下里他和谁在一起

刚哥说法365
2025-11-16 14:35:38
“地表最强小三”!48岁拿下百亿老头却说:我对钱根本没兴趣

“地表最强小三”!48岁拿下百亿老头却说:我对钱根本没兴趣

君笙的拂兮
2025-11-19 01:39:45
65岁倪萍医美后美炸天!优雅时髦,没有皱纹,年轻的像20岁!

65岁倪萍医美后美炸天!优雅时髦,没有皱纹,年轻的像20岁!

大龄女一晓彤
2025-09-23 19:35:20
山东人的体质!1米95张展硕的家庭:父亲1米85,母亲1米75

山东人的体质!1米95张展硕的家庭:父亲1米85,母亲1米75

史行途
2025-11-19 18:22:55
冬天,抓紧吃这“皇帝菜”,一安神,二消痰,三护肝,鲜嫩当季

冬天,抓紧吃这“皇帝菜”,一安神,二消痰,三护肝,鲜嫩当季

阿龙美食记
2025-11-19 21:29:48
意大利哭晕 世界杯附加赛死亡签表浮现 首轮或遇2苦主+决赛碰波兰

意大利哭晕 世界杯附加赛死亡签表浮现 首轮或遇2苦主+决赛碰波兰

我爱英超
2025-11-19 07:14:36
衰老不要光看年龄,7个信号说明你可能真的“老了”

衰老不要光看年龄,7个信号说明你可能真的“老了”

健康八条
2025-11-19 23:16:23
哈佛前校长“投案自首”, 爱泼斯坦文件先斩落民主党大将

哈佛前校长“投案自首”, 爱泼斯坦文件先斩落民主党大将

移光幻影
2025-11-19 08:02:15
出大事了,俄罗斯发起斩首行动,乌军官被杀,泽连斯基紧急出国

出大事了,俄罗斯发起斩首行动,乌军官被杀,泽连斯基紧急出国

扬子的故事屋
2025-11-18 12:25:12
特朗普同意出口F35,中国无意间帮了大忙,让沙特终于得偿所愿

特朗普同意出口F35,中国无意间帮了大忙,让沙特终于得偿所愿

科普100克克
2025-11-20 03:44:45
后悔已经晚了?2大芯片巨头“弃中投美”,中国不会再原谅

后悔已经晚了?2大芯片巨头“弃中投美”,中国不会再原谅

生活新鲜市
2025-11-20 03:06:20
“建议拆完快递的纸箱立马扔掉”火上热搜,网友:再也不敢囤了

“建议拆完快递的纸箱立马扔掉”火上热搜,网友:再也不敢囤了

寒士之言本尊
2025-11-18 15:14:51
“两国关系彻底恶化”,俄方宣布报复!

“两国关系彻底恶化”,俄方宣布报复!

占豪
2025-11-20 03:18:04
女房东收租晕倒,我送她去医院,垫付6.2万,出院后房东:钱我不还你

女房东收租晕倒,我送她去医院,垫付6.2万,出院后房东:钱我不还你

雅俗共赏1
2025-11-19 18:26:30
寒潮来袭 羽绒服迎来“涨价狂潮” 鸭绒从17万一吨涨到58万

寒潮来袭 羽绒服迎来“涨价狂潮” 鸭绒从17万一吨涨到58万

闪电新闻
2025-11-19 11:23:35
人老了,只剩一个人的时候,请记住:1、不再找老伴儿;2、不去养老院;3、不雇保姆,干不动了,就请钟点工

人老了,只剩一个人的时候,请记住:1、不再找老伴儿;2、不去养老院;3、不雇保姆,干不动了,就请钟点工

二胡的岁月如歌
2025-11-18 19:30:26
"最丑"模特冠军后续!全身赘肉拿第一,主办方否认冠军带资进组

"最丑"模特冠军后续!全身赘肉拿第一,主办方否认冠军带资进组

乌娱子酱
2025-11-19 17:40:20
全运女团决赛阵容公布:国乒两大主力无缘交手!陈梦已避开孙颖莎

全运女团决赛阵容公布:国乒两大主力无缘交手!陈梦已避开孙颖莎

野渡舟山人
2025-11-19 17:56:31
2025-11-20 05:28:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1435297文章数 4576关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

亲子
房产
数码
家居
公开课

亲子要闻

爸爸就是最大的危险

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

数码要闻

猫头鹰黑化版散热器风扇来袭

家居要闻

水岸美学 书香人文生活

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版