网易首页 > 网易号 > 正文 申请入驻

机器人可跨类别操作陌生物体,清华开发新方法提升泛化能力31.6%

0
分享至

机器人是否可以像人类一样灵活操作陌生物体?

要想做到这一点,关键在于赋予其“举一反三”的能力:当人类看到新物品时,能根据外形或功能,从历史记忆或与物理世界的交互过程中获得先验知识(比如用开瓶经验开新饮料)。

这种能力源于人类能够理解物体之间的相似性,并把对熟悉物体的操作经验用到新物体上。但是,机器人缺乏这样的经验,而让机器人在不熟悉的场景中操作物体,是实现智能机器人的关键一步。

清华大学团队提出了一种名为 Robo-ABC 的方法,使机器人具备跨类别的泛化能力。通过该方法,机器人可以在没有任何额外训练或人工标注的情况下,直接操作它从未见过的物体。

实验结果显示,Robo-ABC 在识别操作方式的准确性上比现有方法提高了 31.6%。在实际的抓取任务中,Robo-ABC 的成功率达到了 85.7%,证明了它在真实场景中的有效性。

图丨许华哲(来源:许华哲)

日前,相关论文以《Robo-ABC:通过语义对应实现机器人操作的超越类别的可供性泛化》(Robo-ABC: Affordance Generalization Beyond Categories via Semantic Correspondence for Robot Manipulation)为题发表在arXiv[1],并已经被欧洲计算机视觉会议(ECCV 2025,European Conferenceon Computer Vision)收录。

清华大学博士生鞠沅辰是第一作者,助理教授许华哲担任通讯作者。

图丨相关论文(来源:ECCV)

以往的泛化方法往往依赖于训练数据的相似性,只能在与训练数据相同的场景中实现泛化。该研究的创新之处在于从人类能力的角度出发去思考泛化问题,而不是从传统的机器学习能力出发,从而为实现更高级别的泛化能力提供了新的思路和方向。

该研究的初衷是赋予机器人类似人类的跨类别泛化能力,使机器人能够从不同类别的物体中学习并应用知识,从而实现更广泛的应用。

(来源:ECCV)

在该研究中,机器人通过“观看”海量人类操作视频,从中提取有用的操作信息。当机器人遇到陌生物体时,系统会从预先提取的“操作记忆”中快速匹配视觉/功能相似的参考物品。

接着,通过预训练 AI 模型将操作关键点(如握持位置)智能映射到新物体上,整个过程无需人工标注或额外训练,机器人能够以零样本(zero-shot)的方式直接操作从未见过的物体。

虽然这听起来颇具挑战性,但研究发现,用预训练的模型可以帮助机器人完成这一任务,即使物体的类别完全不同。

在该过程中,研究人员采用了扩散特征(DIFT,diffusion features)等技术手段。DIFT 特征本身具有一定的语义对应关系,但并不是直接拿来就能用的。该课题组对其进行了额外的处理,使其对旋转、平移等变化更加鲁棒,从而更好地适应不同场景下的需求。

(来源:ECCV)

VRB(Visual Reasoning Benchmark)是一个从大规模人类数据集中学习的端到端模型,其目标是理解物体的可用性,即物体可以被如何使用或操作。研究人员对比了 VRB 模型,特别是它在处理物体可用性方面的表现。

结果显示,Robo-ABC 在效果上显著优于 VRB。“这是因为 Robo-ABC 能够实现跨类别之间的相互迁移,从而更好地理解物体的可用性。”许华哲说。

例如,如果了解如何握住话筒,那么也能够推断出如何握住放大镜,尽管二者是不同的物体,但它们在形状和使用方式上有许多相似之处。这种能力正是该模型的核心优势。

相比之下,VRB 是纯数据驱动的模型。如果训练集中没有包含某个特定的物体(比如放大镜),那么模型在面对这个未见过的物体时可能会失效。

许华哲解释说道:“我们的模型之所以不会失效,是因为使用了 DIFT。它是在海量数据集上进行预训练得到的,能够捕捉到物体之间的对应关系,从而在面对未见过的物体时也能做出合理的推断。”

在后续的项目中,研究人员还将这种二维映射关系扩展到了三维空间,实现了一种称为“功能性映射”的技术。通过这种映射,可以将一个三维物体的所有位置映射到另一个三维物体的所有位置。

许华哲举例说道:“例如,可以将长豆角映射到短豆角上,或者将西瓜映射到南瓜上。这种技术不仅提升了模型的泛化能力,还使其能够更好地处理形状各异的物体。”

该技术与仅能应对标准工业品(如饮料瓶)的传统模型相比,实现了从“识别已知”到“学习并理解未知”的跨越,有望助力机器人在处理异形食材、修剪树枝等真实场景中展现出独特优势。

接下来,该团队将从两个方向继续推进这项研究:一方面,进一步扩大物体识别的范围,并提升其映射精度;另一方面,将该技术与端到端的方式相结合,以验证其在复杂任务中具备提升机器人性能和良好泛化能力的可能性。

参考资料:

1.Ju, Y., Hu, K., Zhang, G., Zhang, G., Jiang, M., Xu, H. (2025). Robo-ABC: Affordance Generalization Beyond Categories via Semantic Correspondence for Robot Manipulation. In: Leonardis, A., Ricci, E., Roth, S., Russakovsky, O., Sattler, T., Varol, G. (eds) Computer Vision – ECCV 2024. ECCV 2024. Lecture Notes in Computer Science, vol 15099. Springer, Cham. https://doi.org/10.1007/978-3-031-72940-9_13

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
调查发现:每天都走路的人,大多到了75岁后,身体或有5种变化

调查发现:每天都走路的人,大多到了75岁后,身体或有5种变化

医学原创故事会
2026-03-27 23:34:03
钟楚曦马尔代夫度假,大尺度泳衣大秀好身材,大长腿太吸睛!

钟楚曦马尔代夫度假,大尺度泳衣大秀好身材,大长腿太吸睛!

圆梦的小老头
2026-03-02 22:32:57
单依纯演唱会是有多难看?陈奕迅在台下直接呼呼大睡 笑死人了

单依纯演唱会是有多难看?陈奕迅在台下直接呼呼大睡 笑死人了

情感大头说说
2026-03-30 16:58:48
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

番外行
2026-02-26 19:53:05
民企衰退,会给老百姓带来什么影响

民企衰退,会给老百姓带来什么影响

生命可以承受之轻
2026-03-29 08:55:03
顶级军事天才有多恐怖?1万8千宋军残兵,硬撼20万金军精锐

顶级军事天才有多恐怖?1万8千宋军残兵,硬撼20万金军精锐

鹤羽说个事
2026-03-30 22:45:02
前女篮主帅郑薇带队2连败!爆大冷门被淘汰,2首发国手各得4分

前女篮主帅郑薇带队2连败!爆大冷门被淘汰,2首发国手各得4分

老吴说体育
2026-03-31 00:32:20
比缅北更恐怖!以前的旅游胜地,现在黄赌毒俱全,黄交易随处可见

比缅北更恐怖!以前的旅游胜地,现在黄赌毒俱全,黄交易随处可见

汽车通研社
2026-03-30 12:38:55
我突然发现,大多数女人退休以后,都会有以下几种情况出现,很准

我突然发现,大多数女人退休以后,都会有以下几种情况出现,很准

蝉吟槐蕊
2026-03-30 16:35:44
林立果的“未婚妻”到底多美?这是她42岁的一张老照片,气质犹存

林立果的“未婚妻”到底多美?这是她42岁的一张老照片,气质犹存

大运河时空
2026-03-03 13:35:03
女性“高潮”的秘密:别再假装了,教你的伴侣如何带你到达巅峰

女性“高潮”的秘密:别再假装了,教你的伴侣如何带你到达巅峰

精彩分享快乐
2025-11-12 00:05:03
一只曾在美国生活的大熊猫被送回中国后,发生了令人惊讶的变化

一只曾在美国生活的大熊猫被送回中国后,发生了令人惊讶的变化

西楼知趣杂谈
2026-03-20 11:25:40
特朗普宣布访华新日期,不到48小时,中方不留情面,连出两条公告

特朗普宣布访华新日期,不到48小时,中方不留情面,连出两条公告

老范谈史
2026-03-30 20:58:50
人老了,想多活几年,先管住自己十点:1、不摔倒,2、不劳累……

人老了,想多活几年,先管住自己十点:1、不摔倒,2、不劳累……

三农老历
2026-02-08 01:47:40
最新!上海最大综合商业终于“复活”....

最新!上海最大综合商业终于“复活”....

新浪财经
2026-03-30 17:14:24
四川宜宾一佳人,好漂亮,仙姿玉色,貌美如花,绝世佳人不过如此

四川宜宾一佳人,好漂亮,仙姿玉色,貌美如花,绝世佳人不过如此

小椰的奶奶
2026-03-10 21:01:12
4月1日起骑电动、摩托车注意!“3必带3不带”没做到,最高罚1万

4月1日起骑电动、摩托车注意!“3必带3不带”没做到,最高罚1万

吃货的分享
2026-03-31 03:55:05
美国发出全球通缉令,逮捕中国芯片科学家陈正坤,现在怎么样了?

美国发出全球通缉令,逮捕中国芯片科学家陈正坤,现在怎么样了?

观察者小海风
2026-03-30 14:55:36
41岁美女老板朱明月去世,生前常熬夜,喜欢吃烧烤,身价几千万

41岁美女老板朱明月去世,生前常熬夜,喜欢吃烧烤,身价几千万

180视角
2026-03-30 08:54:24
我今年55了,想用血泪教训告诉你:不要跟任何人,包括你的父母、子女、枕边人,分享这4件事

我今年55了,想用血泪教训告诉你:不要跟任何人,包括你的父母、子女、枕边人,分享这4件事

东林夕亭
2026-03-27 09:07:57
2026-03-31 05:55:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16508文章数 514818关注度
往期回顾 全部

科技要闻

一句谎言引发的硅谷血案

头条要闻

白宫:特朗普希望4月6日前与伊朗达成协议

头条要闻

白宫:特朗普希望4月6日前与伊朗达成协议

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

全红婵聊到体重哭了,每天只吃一顿饭

财经要闻

本轮地缘冲突,A股凭什么走出独立行情

汽车要闻

限时12.58万起 银河星耀8远航家系列上市

态度原创

游戏
本地
艺术
亲子
公开课

《红色沙漠》Steam热更新上线 修复光线重建问题

本地新闻

用Color Walk的方式解锁城市春日

艺术要闻

这父子俩的花鸟,堪称一绝

亲子要闻

父母学会放手么?孩子长大,父母应该放手么

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版