网易首页 > 网易号 > 正文 申请入驻

AlphaGo作者领衔,DeepMind新作登Science子刊

0
分享至

来源:市场资讯

(来源:量子位)

一群机械臂手忙脚乱地自己干活,彼此配合、互不碰撞。

科幻大片场景真的走入现实了。优雅,实在是优雅。


△视频中为4个机械臂,在仿真环境下4个安装在桌子上,另外4个安装在天花板上。

这就是发表在Science子刊Science Robotics上,由DeepMind、Intrinsic AI和UCL等研究机构共同提出的最新成果——RoboBallet(机器芭蕾)。


RoboBallet创新性地将图神经网络(GNN)用于强化学习,作为其策略网络和状态-动作价值估计,以解决多机器人(机械臂)协作运动规划中的复杂问题。

这一方法最多可以同时控制8个机械臂,协调多达56个自由度的配置空间,并处理多达40个共享任务, 每一步规划仅需0.3毫秒,且任务分配和调度完全不受约束。

值得一提的是,这篇论文的通讯作者——Matthew Lai,可谓是谷歌DeepMind的资深研究员。自2016年加入谷歌DeepMind以来,他曾参与过AlphaGoAlphaZero等明星项目。


利用图神经网络与强化学习

总的来说,RoboBallet的核心是把图神经网络与强化学习结合起来,采用图神经网络(GNN)作为策略网络和状态-动作价值估计,解决了大规模多机器人任务分配、调度和运动规划的联合问题,实现了在计算上高效、可扩展且能零样本泛化的高质量轨迹规划

具体来说,在现代自动化制造中,核心挑战在于如何让多个机器人在共享的、充满障碍物的空间中无碰撞地高效协作,以完成大量任务(如焊接、装配等)。

这涉及到三个高度复杂的子问题:

这三个子问题一组合,复杂度急剧增加,传统算法在真实场景中往往难以计算可行解,工业界目前主要依赖耗时且劳动密集的人工规划。

因此,为了应对这种高维复杂性,RoboBallet就被用来在随机生成的环境中进行任务和运动规划,其能够为与训练期间所见环境不同的环境(具有任意障碍物几何形状、任务姿态和机器人位置)规划多臂抓取轨迹。

为了实现这一点,RoboBallet在数据表示层面,创新性地将整个场景建模为图结构


其中,图中的节点代表场景中的核心实体,包括机器人、任务和障碍物,而边(Edge)则表示这些实体之间的关系(例如,相对姿态)。

机器人节点之间存在双向边,以支持相互协调和避碰。而任务节点和障碍物节点到机器人节点则存在单向边,用于向机器人传递规划所需的环境信息(如图c)

接下来,RoboBallet使用图神经网络(GNN)作为策略网络,通过权重共享来处理不断变化的图大小。其以观测图作为输入,并在每个时间步为所有机器人生成指令关节速度。这使得机械臂能够在只接收原始状态作为输入的情况下,进行关系和组合推理。

而在具体的策略学习和评估阶段,RoboBallet通过微调TD3(Twin-Delayed Deep Deterministic Policy Gradient)算法来训练策略网络,使模型能够生成多机械臂轨迹,同时解决任务分配、调度和运动规划等子问题,使得昂贵的在线计算转移到了离线训练阶段。

(注:在此任务中,机械臂因成功解决任务和避免碰撞而获得奖励)

同时,为了解决稀疏奖励的问题,RoboBallet还采用了Hindsight Experience Replay方法,使模型能够在没有人工设计的奖励函数的情况下高效学习。

在具体的部署方面,RoboBallet使用Franka Panda七自由度机械臂、在随机障碍物和任务的模拟环境进行训练。


为了验证性能,研究团队在一个包含4(8)个机器人、40个任务和30个障碍物的模拟工作单元中进行测试,并与RRT-Connect方法进行比较。值得一提的是,这一切都只需在一块 GPU(图形处理单元)上完成,无论是真实的还是模拟的多臂工作单元。

实验表明,RoboBallet在多个关键指标上表现出色:

在训练时间的扩展性方面,即使任务数量增加四倍,RoboBallet收敛所需的训练步数也只是略有增加。


在规划速度方面。实验表明,在推理阶段,即便是包含8个机器人和40个任务的最大场景,每个规划步在NVIDIA A100上只需约0.3毫秒,能够实现10 Hz时间步下超过300倍的实时规划速度

在单个Intel Cascade Lake CPU核心上,每个步长大约需要30毫秒,在10Hz时间步下仍比实时快约3倍。每个规划步骤包括对整个场景进行一次推理和一次碰撞检测。

在多智能体协同方面,随着机器人数量从4个增加到8个 ,平均执行时间减少了约60%


而在泛化性方面,模型在随机生成的环境中训练后,无需额外训练即可零样本迁移(zero-shot)到具有不同机器人位置、障碍物几何形状和任务姿态的新环境中。

最后,RoboBallet 的高速和可扩展性使其能够应用于工作单元布局优化(将任务执行时间缩短了33%)、容错规划和基于在线感知的重新规划等新能力。


[1]https://x.com/GoogleDeepMind/status/1965040645103407572

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杨瀚森机会又来了!罗威格兰特今日大概率缺阵 阿夫迪亚有望复出

杨瀚森机会又来了!罗威格兰特今日大概率缺阵 阿夫迪亚有望复出

罗说NBA
2026-01-19 06:00:38
再见里夫斯!老詹喜迎20+8全能锋线!湖人阵容再升级冲冠

再见里夫斯!老詹喜迎20+8全能锋线!湖人阵容再升级冲冠

湖人侃球师
2026-01-18 07:34:34
苹果突然官宣:1月17日,价格正式下调!

苹果突然官宣:1月17日,价格正式下调!

科技堡垒
2026-01-17 12:42:00
阿尔卑斯雪场打成一锅粥?双板客遭围殴,全程无人制止!还有数百雪板失踪

阿尔卑斯雪场打成一锅粥?双板客遭围殴,全程无人制止!还有数百雪板失踪

新欧洲
2026-01-18 20:57:56
高雄市长之战支持谁?7万人网络投票结果一面倒

高雄市长之战支持谁?7万人网络投票结果一面倒

新时光点滴
2026-01-18 04:53:12
王伟中:立即成立调查组,彻查事故原因,严肃追责问责

王伟中:立即成立调查组,彻查事故原因,严肃追责问责

新京报政事儿
2026-01-19 00:34:45
“我74岁了,心态很好”新希望集团董事长刘永好:再谈不焦虑、不躺平、不跑路

“我74岁了,心态很好”新希望集团董事长刘永好:再谈不焦虑、不躺平、不跑路

每日经济新闻
2026-01-18 17:20:51
内科主任提醒:过了60岁后,宁可打打麻将,也别在家随意做5件事

内科主任提醒:过了60岁后,宁可打打麻将,也别在家随意做5件事

橘子约定
2025-12-18 20:05:39
宋庆龄拒绝与孙中山合葬,坦言:她陪我53年,我答应要和她葬一起

宋庆龄拒绝与孙中山合葬,坦言:她陪我53年,我答应要和她葬一起

史之铭
2026-01-12 16:26:19
我们必须要永远保持对吕蒙“白衣渡江”严厉的批判态度!保持警惕

我们必须要永远保持对吕蒙“白衣渡江”严厉的批判态度!保持警惕

吕醿极限手工
2026-01-09 21:45:13
别盯存储芯片了!这条传导链才是真机会,下周或走主升浪!

别盯存储芯片了!这条传导链才是真机会,下周或走主升浪!

元爸体育
2026-01-18 01:16:00
这位成熟阿姨完把丰满的身材穿出了独特的魅力

这位成熟阿姨完把丰满的身材穿出了独特的魅力

牛弹琴123456
2026-01-09 11:42:43
高云翔深夜在天津街头淋雪,边走边笑,网友:你这一生后悔不

高云翔深夜在天津街头淋雪,边走边笑,网友:你这一生后悔不

小椰的奶奶
2026-01-19 06:55:15
访华一结束,芯片立刻涨价70%还断供,中国何时能追上韩国水平?

访华一结束,芯片立刻涨价70%还断供,中国何时能追上韩国水平?

离离言几许
2026-01-18 10:48:44
澳洲一家人日本旅游破防:到处被嫌弃,只有7-11收留我们!

澳洲一家人日本旅游破防:到处被嫌弃,只有7-11收留我们!

新欧洲
2026-01-18 20:59:29
美国逼我国偿还百年前的债务,如若不还,欠我国的8600亿美元就赖账

美国逼我国偿还百年前的债务,如若不还,欠我国的8600亿美元就赖账

富强巨靠谱
2025-03-24 16:33:48
资深班主任才敢告诉你:小学成绩好的,到初中还是好,差的还是差

资深班主任才敢告诉你:小学成绩好的,到初中还是好,差的还是差

好爸育儿
2026-01-18 22:10:41
“地震中消失的人去哪了?”网友的扎心评论,直接看哭了上万网友

“地震中消失的人去哪了?”网友的扎心评论,直接看哭了上万网友

另子维爱读史
2026-01-15 18:13:19
LV做梦也想不到,请了一堆流量大咖,却被一个00后运动员抢尽风头

LV做梦也想不到,请了一堆流量大咖,却被一个00后运动员抢尽风头

以茶带书
2026-01-15 15:06:31
杨兰兰案风波再升级!疑派“替身”去警局报到,若坐实后果很严重

杨兰兰案风波再升级!疑派“替身”去警局报到,若坐实后果很严重

谈史论天地
2026-01-18 13:41:12
2026-01-19 07:24:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2057573文章数 5289关注度
往期回顾 全部

科技要闻

AI大事!马斯克:索赔9300亿元

头条要闻

特朗普建"联合国"自任主席 邀60国加入仅1国接受

头条要闻

特朗普建"联合国"自任主席 邀60国加入仅1国接受

体育要闻

21年后,中国男足重返亚洲四强

娱乐要闻

香港武打演员梁小龙去世:享年77

财经要闻

BBA,势败如山倒

汽车要闻

又一次闷声干大事,奇瑞进入2.0 AI+时代

态度原创

旅游
健康
本地
游戏
家居

旅游要闻

泸溪河畔藏千年,避开商业化,这座千年古镇才是真江南!

血常规3项异常,是身体警报!

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

《GTA6》两大主角开场任务泄露 60%的建筑可进去

家居要闻

岁月柔情 现代品质轻奢

无障碍浏览 进入关怀版