网易首页 > 网易号 > 正文 申请入驻

连续入选ICRA最佳论文,RoboScience机器科学如何突破具身智能泛化瓶颈?

0
分享至

编辑|Sia

在具身智能最难的泛化问题上,他们连续拿出顶会级成果,并把它们沉淀进其创新 VLOA 大模型,推动机器人迈向广阔现实。

6 月 1 日至 5 日,机器人领域顶级会议 ICRA 2026 在奥地利维也纳举行。RoboScience 机器科学首席科学家、新加坡国立大学助理教授邵林团队的论文 《Bi-Adapt: Few-Shot Bimanual Adaptation for Novel Categories of 3D Objects via Semantic Correspondence》入围机器人操作与运动方向(Robot Manipulation and Locomotion)最佳论文奖提名(Finalist)。同时入围该奖项提名的,还包括来自伯克利大学、斯坦福大学、麻省理工学院、清华大学等全球顶级高校的研究团队。

这已经不是邵林团队第一次站上 ICRA 的高光位置。去年 ICRA 2025 ,团队曾凭借通用灵巧抓取框架 D(R,O) Grasp 从四千多篇投稿中脱颖而出,斩获机器人操作与运动方向最佳论文奖( Winner ),成为近五年来亚洲机构首次以第一单位身份获此殊荣的团队。

而在 ICRA 2026 论文录用结果中,邵林带领的团队共有 10 篇研究成果成功入选。这些论文聚焦灵巧抓取、社交导航、低成本力感知与混合任务规划等核心方向,系统性地推进了具身智能的技术边界。


从 2025 年获奖,到 2026 年再度入围,邵林团队也成为近五年来亚洲唯一连续两年获得该方向最佳论文奖项认可的团队。这一成绩不仅体现其在机器人操作领域的持续创新能力,也进一步凸显中国具身智能企业在国际顶级学术舞台上的技术影响力。

但相比奖项本身,这两篇论文更值得关注的地方在于它们共同指向了具身智能走向真实世界前必须跨过的门槛:泛化操作能力。

Bi-Adapt:

一种用于高效学习通用双手操作的新型框架

对机器人来说,双臂操作远比单臂抓取复杂得多。两只手不仅要分别判断接触点和动作方向,还必须彼此配合。传统解决方案要么针对不同物体人工设计动作,要么依赖大规模数据,通过大量示范或交互训练模型。但前者难以覆盖真实世界复杂多变的几何结构,后者意味着高昂的数据采集和训练成本。

Bi-Adapt 的核心突破在于:机器人能将已经学会的双臂操作经验迁移到没见过的新物体类别上,并且只需要少量试错,就能在仿真和真实环境中保持较高成功率。


,一种用于高效学习通用双臂操作的新框架。

仿真测试显示,Bi-Adapt 在五类新类别双臂操作任务上的成功率达到 59%—70%,显著超过多个基线方法。


Bi-Adapt 在五类双臂任务上均显著超过启发式规则、M-Where2Act、DualAfford 等基线方法。

在真实机器人实验中,它也完成了展开、打开、取盖等任务,验证了跨类别操作能力从仿真到真实环境的可迁移性。



简单来说,Bi-Adapt 把跨类别双臂操作变成了三步曲:先找对位置,再学会配合,最后用少量试错修正。


pipeline 主要包括动作学习、可供性迁移、少样本适配和最终执行四个阶段。

第一步,是在已知类别上建立「操作经验库」。系统会记录成功操作时,两只夹爪分别接触哪里、以什么方向运动、如何协同发力。

这里有一个关键设计:Bi-Adapt 没有把两只手当成两个独立执行器,而是把双臂动作拆成两个相互依赖的模块。

与推理不同,训练时采用了反向数据流:先训练第二只夹爪在不同第一手动作下如何协同,再训练第一只夹爪学会提出更有利于整体协作的动作,让第一只手学会为第二只手创造配合条件。

第二步,是用视觉基础模型做跨类别语义对应。

机器人虽然没有见过钳子,但如果学过如何操作剪刀,就可以借助视觉基础模型判断:剪刀上的成功接触点,在钳子上最可能对应哪里。

论文中使用了 DIFT,也就是 diffusion feature,从扩散模型中提取图像特征,并比较源图像接触点与目标图像各个像素之间的相似度。相似度最高的位置,就被视为新物体上的候选接触点。

第三步,少样本交互适配。

视觉上的相似并不等于物理上一定可操作,因此机器人会拿候选接触点执行少量尝试,根据成功或失败反馈微调模型,过滤掉错误接触点,修正两只夹爪的动作方向。

最后,最终的控制策略被部署于全新类别的未知实例上。

如果说 Bi-Adapt 试图解决「不同物体怎么操作」,那么ICRA 2025 获奖的 D(R,O) Grasp 应对的是另一个泛化挑战:不同灵巧手之间如何复用同一套抓取能力。

通过将机器人手和物体都表示成点云,学习二者在稳定抓取时应该形成的空间距离关系,D(R,O) Grasp突破了传统「一机一策」的局限——基于这一统一表示,一个 AI 模型即可支持 LeapHand、Shadow Lite、XHand、SoftHand 等多种灵巧手,覆盖 3/4/5 指、软体与硬质等不同形态,完成复杂抓取操作。

两项顶会级工作放在一起,构成了邵林团队近两年的技术主线:机器人操作能力不应该绑定单一硬件、单一物体或单一场景,而应该逐步沉淀为可复用、可迁移的通用能力。

顶会神技「并网」到通用具身大脑 VLOA

邵林曾指出,具身智能大模型不能简单照搬 CV 或 NLP 的 scaling 经验。图像和文本天然拥有相对统一的数据格式,但机器人操作面对的是任务、物体和机器人本体三重多样性,若没有统一的数据格式,这些数据很难被纳入同一体系学习,模型也很难形成真正可迁移的操作能力。这也是现有 VLA 路线面临的核心瓶颈。

RoboScience 机器科学提出的 VLOA(Vision-Language-Object-Action)路线,正是为了解决这一问题。相比直接从 Vision-Language 跳到 Action,VLOA 在中间引入了 Object,也就是以物体为中心的状态变化表示——

无论是拿起杯子、打开盒盖,还是插入零件,最终都可以被描述为物体在三维空间中的位置、姿态和形态变化。Object Trajectory (物体 3D 连续点云轨迹)正是对这种变化的统一表达。

基于这一思考,邵林团队搭建了一个「具身世界模型 + 通用操作模型」的双引擎架构,指导「任意机器人操作任意对象、完成任意任务」。


机器科学提出的 VLOA(Vision-Language-Object-Action)框架,一个双引擎架构。

在这一框架中,上层具身世界模型负责理解任务语义,预演物体在三维空间中的状态变化,也就是 object trajectory。它更多从互联网视频、说明书、多模态数据中学习语义和常识。

下层通用操作模型负责把 object trajectory 转成具体机器人的动作。它学习的是物理规律、接触、力、约束和控制,可以通过公司自研的物理引擎和仿真数据大规模训练。

连接它们的灵魂纽带就是 Object Trajectory(物体 3D 连续点云轨迹) 接口。有了这一中间表示,不同来源的数据才能被统一纳入同一体系,犹如海纳百川。

这一框架的能力,也已经在真实任务中得到验证。2025 年 5 月,RoboScience基于 VLOA 大模型完成了全球范围内复杂度、精度和步骤数都极高的具身操作任务拼家具。

基于 VLOA 大模型完成拼家具人物,一镜到底。

这类任务考验的不是某一个单项「神技」,而是模型能否把一系列分散能力有效整合起来,在复杂物理环境中完成稳定、精细、连贯的操作。

也正是在这个背景下,Bi-Adapt 和D(R,O) Grasp 的价值不止于顶会论文,而是在为 VLOA 补齐关键底层能力——跨类别操作泛化、一个模型适配多种末端执行器。这一系列研究成果的落地,将显著降低机器人操作技能的学习成本与部署门槛,推动具身智能摆脱遥控器和预设技能库,自主理解世界,并在真实物理环境中稳定执行任务。

可以说,融合了世界模型的 VLA,也就是VLOA 路线,正成为具身智能迈向真实场景的一种更优解。

斯坦福学术 × 硅谷工程:

RoboScience 机器科学的双重底座

RoboScience 机器科学成立于 2024 年 12 月,是一家聚焦通用具身智能的全球领先企业,由前苹果 AI 平台技术负责人、斯坦福大学 AI Lab 硕士田野,与新加坡国立大学助理教授、斯坦福大学 AI Lab 博士邵林联合创立。


这组创始人搭配,正好对应了RoboScience 机器科学的技术路线:一端是机器人操作、灵巧手、跨本体抓取与仿真等方向的前沿学术积累,另一端则是大规模 AI 基础设施和工程系统的落地经验。

邵林本科毕业于南京大学,斯坦福大学博士,师从机器人学习领域学者 Jeannette Bohg,联合导师为美国三院院士 Leonidas J. Guibas,长期深耕机器人操作、灵巧手、跨本体抓取与仿真等方向。值得一提的是,邵林与 Hillbot 创始人苏昊、银河通用创始人王鹤、穹彻智能创始人卢策吾等同属斯坦福机器人与 AI 学术谱系,其中与王鹤为同届,苏昊、卢策吾为其师弟。

田野本科毕业于中科大物理系,后进入斯坦福大学 AI Lab 攻读硕士,师从「AI 布道者」吴恩达。他曾在苹果担任 AI Platform 技术负责人,主导打造了「苹果的 PyTorch 与 CUDA」核心平台,推动多项关键 AI 技术在苹果生态中大规模落地。

目前,公司已在机器人本体、末端执行器、多模态物理仿真等关键环节实现全栈布局,希望通过软硬一体路线,加速具身智能技术规模化落地。

自研的高精度通用物理仿真平台 「RoboMirage」

RoboScience 机器科学已获得京东集团、商汤科技、达晨财智、招商局创投、零一创投、普华资本等多家 CVC 和财务机构的投资及产业支持,近期又获得了多家国内外产业龙头、互联网大厂、头部财务机构等多轮注资,并在北京、深圳、苏州、杭州设有研发和生产中心。团队成员来自斯坦福、中科大、新加坡国立大学等顶尖高校,以及苹果、字节、腾讯、大疆等头部科技企业。

在产业化方面,公司已与多家零售、物流、康养服务企业,以及机器人本体、灵巧手公司开展试点合作,并计划于今年实现面向工业与商业场景的标准化机器人本体产品量产。

随着机器人进入零售、物流、工业、家庭等真实场景,真正的竞争也将从单点演示转向通用操作能力、数据闭环和系统工程能力。在这一行业拐点上,从顶会论文到工程系统,从泛化算法到真实机器人生产力,RoboScience 机器科学正试图打通具身智能从「学术顶尖」走向「规模化落地」的关键链路。在这场通往物理世界的万亿级长跑中,他们不仅在探索机器的边界,更在真实世界中加速未来的到来

https://nus-lins-lab.github.io/drograspweb/static/data/D(R,O)Grasp.pdf

https://arxiv.org/pdf/2602.08425

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
梅西建功阿根廷3连胜出线!赛后获3好消息+2坏消息,争冠形势出炉

梅西建功阿根廷3连胜出线!赛后获3好消息+2坏消息,争冠形势出炉

小火箭爱体育
2026-06-28 12:46:08
老父亲来电说弟弟赔了两千万,我平静说法人早改您了,您慢慢还吧

老父亲来电说弟弟赔了两千万,我平静说法人早改您了,您慢慢还吧

晓艾故事汇
2026-06-27 09:02:45
终于明白,中国为什么不趁机收回台湾了。

终于明白,中国为什么不趁机收回台湾了。

荆楚寰宇文枢
2026-06-27 23:18:39
武契奇宣布数周后辞职:18个月抗议压顶,“换岗”总理续掌大权?

武契奇宣布数周后辞职:18个月抗议压顶,“换岗”总理续掌大权?

上观新闻
2026-06-28 14:12:05
200万粉网红诋毁袁隆平水稻育种技术,被痛批

200万粉网红诋毁袁隆平水稻育种技术,被痛批

南方都市报
2026-06-28 13:58:01
我跟二叔赶夜路,驴突然不走了,二叔下车看完后说:赶紧绕道

我跟二叔赶夜路,驴突然不走了,二叔下车看完后说:赶紧绕道

千秋文化
2026-04-26 20:18:10
她是赖昌星“色贿”的牺牲品,给杨前线做情妇生儿子,现状如何?

她是赖昌星“色贿”的牺牲品,给杨前线做情妇生儿子,现状如何?

小蒋爱唠嗑
2026-05-23 01:17:54
同学聚会,发现一个扎心的现实:年过40的女同学中,1/3没有工作,1/3做着低薪但没前途工作,剩下的1/3基本都在体制内

同学聚会,发现一个扎心的现实:年过40的女同学中,1/3没有工作,1/3做着低薪但没前途工作,剩下的1/3基本都在体制内

品读时刻
2026-06-13 09:03:28
新华社消息|美军中央司令部称对伊朗实施新一轮打击

新华社消息|美军中央司令部称对伊朗实施新一轮打击

新华社
2026-06-28 09:46:56
秦始皇留下的这四件遗产,让中国永远无法分裂,欧洲人看了都沉默

秦始皇留下的这四件遗产,让中国永远无法分裂,欧洲人看了都沉默

掠影后有感
2026-06-28 10:15:36
发现一个有趣的现象:不管信不信,男人过了50,基本都有以下特征

发现一个有趣的现象:不管信不信,男人过了50,基本都有以下特征

小书虫妈妈
2026-06-25 12:36:46
韩国队无缘世界杯32强,李在明发声:感到震惊,文化体育观光部应查明情况

韩国队无缘世界杯32强,李在明发声:感到震惊,文化体育观光部应查明情况

环球网资讯
2026-06-28 17:44:11
张子强被枪毙后,34岁妻子独自上街,没想到被4名匪徒下了手

张子强被枪毙后,34岁妻子独自上街,没想到被4名匪徒下了手

浩渺青史
2026-06-27 16:55:05
葡萄牙主帅发声:拿C罗对比梅西哈兰德是幼稚行为,C罗不需要休息

葡萄牙主帅发声:拿C罗对比梅西哈兰德是幼稚行为,C罗不需要休息

顺静自然
2026-06-28 16:23:41
吴艳妮回应夺冠:我确实有破13秒的水平;并称自己赖床睡过头,直接素颜去比赛

吴艳妮回应夺冠:我确实有破13秒的水平;并称自己赖床睡过头,直接素颜去比赛

鲁中晨报
2026-06-28 17:43:02
网红滤镜碎一地!北京11家印度餐厅翻车,繁华热闹皆是灰色猫腻

网红滤镜碎一地!北京11家印度餐厅翻车,繁华热闹皆是灰色猫腻

小怪吃美食
2026-06-28 14:58:55
3-3,奥地利绝平阿尔及利亚,双方携手晋级世界杯淘汰赛

3-3,奥地利绝平阿尔及利亚,双方携手晋级世界杯淘汰赛

侧身凌空斩
2026-06-28 12:00:22
18岁被王全安选中,20岁登戛纳,后来为啥没人敢用她?

18岁被王全安选中,20岁登戛纳,后来为啥没人敢用她?

不似少年游
2026-05-21 14:26:19
时机已到,该收拾日本了!中方宣布驱逐日本船只,必须杀鸡儆猴

时机已到,该收拾日本了!中方宣布驱逐日本船只,必须杀鸡儆猴

杜榈手工制作
2026-06-17 22:03:23
毛主席视察南京,忽然问谭震林:老实交代,你银行里存了多少钱

毛主席视察南京,忽然问谭震林:老实交代,你银行里存了多少钱

芊芊子吟
2026-06-27 16:30:08
2026-06-28 18:31:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3816074文章数 8431关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

中央巡视后不久副部级官员任上落马 其上任不到一年半

头条要闻

中央巡视后不久副部级官员任上落马 其上任不到一年半

体育要闻

韩国可算确定被淘汰了

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

两只股票撑起的韩国股市,半年熔断 33 次

汽车要闻

蔚来ES大五座体验 全场景行李舱让你带着生活出发

态度原创

健康
教育
艺术
家居
旅游

“无糖汤圆”是否隐藏着健康陷阱?

教育要闻

要看录取线,也要看平均分!明后天来成都官方“中招会”,这些准备要做好

艺术要闻

赵孟頫比肩王羲之的一幅行书,能达到这种境界的,700年来只有他一人!

家居要闻

绿意盎然 自然之境

旅游要闻

海岛风吹进老洋房!崇明文旅嘉年华亮相思南公馆

无障碍浏览 进入关怀版