网易首页 > 网易号 > 正文 申请入驻

机器人学会预判接触:它石智航牵头四大顶尖机构发布TacForeSight

0
分享至



机器之心发布

机器人已经学会看见世界,也开始学会摸到世界。但对于真实接触操作而言,仅仅感知当前状态远远不够,机器人还需要预测物理世界接下来会如何变化。擦拭、插接、拧紧,这些人类几乎凭感觉就能完成的动作,对机器人来说却并非易事:接触力度会变化,物体位置会偏移,反馈慢一步,就可能打滑、卡住或丢失。

近日,它石智航联合新加坡国立大学、上海交通大学、中科院自动化所、复旦大学发布论文 “TacForeSight: Force-Guided Tactile World Model for Contact-Rich Manipulation”。该研究提出一种力条件触觉世界模型,首次将腕部力觉作为未来触觉状态的先导信号,用于预测短时接触演化,并将预测结果引入机器人动作生成过程。

  • 论文链接:https://arxiv.org/pdf/2606.11184
  • 项目主页:https://tacforesight.github.io/ProjectPage/
  • 视频链接:https://www.youtube.com/watch?v=ZY2xBTaR6ek



视频链接:https://mp.weixin.qq.com/s/5kGd-zsOCq_OahJhW88n3w

这意味着机器人不再只是依赖触觉反馈进行事后修正,而是能够提前理解接触变化、预测接触变化,并在物理世界发生变化之前主动调整动作。从 Reactive Feedback 到 Proactive Foresight,从 “摸到世界” 到 “预感世界”,TacForeSight 为接触智能提供了一种更接近人类操作逻辑的新范式。



这是它石智航在机器人精细操作领域的又一项关键进展。今年 3 月,它石智航发布 OmniVTA 视触觉操作框架和 OmniViTac 大规模视触觉数据集,帮助机器人通过视觉与触觉理解真实接触;此次 TacForeSight 则进一步补上 “提前预判” 的能力,让机器人不只是 “看见” 和 “摸到”,还能提前判断接触变化。

为什么机器人需要 “预判接触”?

当前,行业多数接触操作方法虽然融合了视觉、触觉和力觉等传感器,但本质上仍偏向 “看到问题后再反应”。然而,接触并不是一个静态状态,而是随时间连续演化的动态过程。这点在执行精细操作时的弊端尤其明显,一旦反馈滞后,就容易出现卡顿、错位甚至任务失败。

例如,擦拭时,接触压力会随着物体表面高度变化而改变;刷卡时,卡片姿态和轨道约束会持续影响滑动状态;插接与锁紧任务中,微小的位置偏差就可能导致卡滞、滑脱或接触丢失。机器人如果只依赖当前时刻的触觉反馈,往往已经慢了一步。

TacForeSight 的核心洞察正在于此:力觉与触觉并不是重复信息,而是具有 “时间先后关系” 的信息。以人类操作为例,在擦拭、刷卡、插接等过程中,手腕往往会先感知整体受力趋势,指尖随后感知局部接触细节,人也正是依靠这种连续反馈与提前判断,完成动态调整。



腕部力觉与双指触觉在接触转变中的互补关系

从 “反应式反馈” 到 “主动式预判”

基于这一核心观点,团队并未停留在力觉与触觉信息的简单融合,而是进一步利用力觉信号预测未来可能发生的触觉变化,打造了 TacForeSight 的核心模块 Force-Guided Tactile World Model,即 TacForceWM。

不同于直接重建高维触觉图像的传统思路,TacForceWM 将双指触觉场编码为紧凑的触觉潜变量,并利用高频腕部力 / 力矩信号预测短时未来的触觉演化。介绍显示,该框架由两个耦合阶段组成:第一阶段通过力条件触觉世界模型预测触觉动态,第二阶段将预测到的触觉动态作为接触先验,用于轻量级动作策略生成。

这种设计避免了高维触觉生成带来的计算开销,同时保留了关键接触动态信息,使触觉世界模型能够真正进入实时控制闭环。它本质上是在学习 “当前接触如何演化为未来接触”。因此,机器人不再只是知道自己此刻摸到了什么,而是开始预测接下来将会摸到什么。



TacForeSight 网络架构图

在获得未来触觉预测之后,TacForeSight 进一步提出 Predictive Tactile-Conditioned Policy,将未来触觉作为动作生成的前瞻性接触先验。通过 Cross-Attention 机制,策略显式建模当前接触状态与未来接触趋势之间的关系,使机器人在生成动作时不仅考虑 “现在的接触”,也考虑 “即将发生的接触变化”。

同时,触觉驱动的自适应门控机制会根据任务阶段动态调整视觉与触觉的权重:在接触密集阶段,策略更依赖触觉进行精细控制;在远离接触阶段,则更多依赖视觉提供全局信息。论文摘要也明确提到,该方法通过紧凑潜空间预测实现高效实时推理,适用于高频机器人操作控制。

真机验证各项性能优异,实时推理逼近人类速度

为进一步验证 TacForeSight 的性能,论文在真实机器人平台上开展实验。实验系统包括机械臂、夹爪、相机、六维力 / 力矩传感器以及双指触觉传感器,覆盖花瓶擦拭、卡片滑动、管件插入、灯泡锁紧、柔性线束插入五类典型接触密集型任务,并进一步设计了高度、角度、姿态、光照等高扰动场景,以验证模型的任务完成率与鲁棒性。



五类真机任务操作过程与三类动态扰动任务的操作过程

实验结果显示,TacForeSight 在五个标准接触任务上的平均完成率高达近 80%,明显优于纯视觉模型、简单视觉 - 触觉 - 力觉融合、KineDex、FoAR 和 RDP 等基线方法。在动态扰动场景下,TacForeSight 分别在高度扰动、角度扰动和姿态扰动任务中取得 90%、85%、85% 的成绩,平均达到 86.7%,展现出强大的扰动恢复能力。

尤其值得注意的是,TacForeSight 支持 20Hz 的实时推理,这意味它不只是离线展示的预测模型,而是能够真正嵌入机器人高频闭环控制、以接近人类操作的速度完成基于力和触觉的世界模型。



为了进一步解释模型有效性,论文对学习到的触觉潜变量进行了可视化分析。结果显示,在灯泡锁紧和花瓶擦拭任务中,预测触觉潜变量会比当前触觉潜变量提前约 200ms 出现接触相关变化。这说明模型并不是简单记忆动作轨迹,而是学到了接触状态随时间演化的趋势。

此外,在按压、扭转、滑动等未见过的力 - 触觉交互片段上,触觉编码器提取出的潜变量在 t-SNE 可视化中形成了清晰可分的簇,表明模型具备一定的接触模式判别能力,能够捕捉不同物理交互下的局部形变和受力变化。



触觉潜变量时序预测与接触模式聚类结果

这也说明,机器人要真正实现灵巧操作,关键不在于传感器的多少,而是要真正理解不同感知信号之间的关系:力觉提供全局先导信号,触觉提供局部精细反馈,而世界模型则将二者连接成可预测的接触动态。

从 OmniVTA 到 TacForeSight,它石智航展示了一种全新的机器人智能范式:从看见世界、摸到世界,到预感世界;从 Reactive Feedback,到 Proactive Foresight;从感知当前状态,到预测未来状态;从离线重型预测模型,到能够进入实时控制闭环的轻量级触觉世界模型。

未来,随着视觉、触觉与力觉等多模态感知进一步融合,机器人将逐渐学会像人一样预判世界、适应世界,并在复杂物理环境中完成更稳定、更精细的操作。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
16级还不够!米克拉憋大招,路径突然往西拐,转向期才是最狠时刻

16级还不够!米克拉憋大招,路径突然往西拐,转向期才是最狠时刻

王姐懒人家常菜
2026-06-25 13:29:29
全行业出清:他们终于把自己玩死了

全行业出清:他们终于把自己玩死了

美第奇效应
2026-06-24 03:21:11
红魔一家人,库尼亚赛前致意给了19岁的弗莱彻大大的拥抱

红魔一家人,库尼亚赛前致意给了19岁的弗莱彻大大的拥抱

懂球帝
2026-06-25 13:17:30
MLCC牛股,明日起停牌!

MLCC牛股,明日起停牌!

数据宝
2026-06-25 23:50:01
森保一:波特是位优秀的教练,他执教三笘薰时我就经常研究他

森保一:波特是位优秀的教练,他执教三笘薰时我就经常研究他

懂球帝
2026-06-25 06:02:15
你们再这么清醒下去,娱乐圈迟早要挂掉!

你们再这么清醒下去,娱乐圈迟早要挂掉!

走读新生
2026-06-23 17:32:04
真主党不让打,伊朗不能打:以色列开始暴打伊朗的另一个盟友

真主党不让打,伊朗不能打:以色列开始暴打伊朗的另一个盟友

至今
2026-06-23 22:47:36
轻松一刻:什么叫做我在陪你吃苦,吃苦的定义是什么?

轻松一刻:什么叫做我在陪你吃苦,吃苦的定义是什么?

莱月昂
2026-06-24 23:37:42
齐达内即将接手法国队!敲定 98 冠军队友巴特兹出任门将教练…

齐达内即将接手法国队!敲定 98 冠军队友巴特兹出任门将教练…

林子说事
2026-06-25 12:11:47
潜伏在台最长间谍李志豪,1998年揪出我军两名高级叛徒,后回香港

潜伏在台最长间谍李志豪,1998年揪出我军两名高级叛徒,后回香港

搜史君
2026-06-25 09:30:20
赖因德斯丨给米兰球迷一个大大的拥抱

赖因德斯丨给米兰球迷一个大大的拥抱

米兰圈
2026-06-25 09:17:05
英媒:切尔西需先出售5名球员,才能开始考虑对查洛巴的报价

英媒:切尔西需先出售5名球员,才能开始考虑对查洛巴的报价

懂球帝
2026-06-25 23:32:19
《给阿嬷的情书》让新加坡政府松了口!追加8场秒空,再申50场

《给阿嬷的情书》让新加坡政府松了口!追加8场秒空,再申50场

新加坡眼
2026-06-24 21:36:05
恭喜!中国女排弃将,1米87接应留洋续约,已带队获得冠军

恭喜!中国女排弃将,1米87接应留洋续约,已带队获得冠军

跑者排球视角
2026-06-25 21:43:53
内娱大洗牌!全员取消艺名,流量明星彻底慌了,冯绍峰最令人意外

内娱大洗牌!全员取消艺名,流量明星彻底慌了,冯绍峰最令人意外

林雁飞
2026-06-25 14:22:46
远程千里偷猪脚,已成财政工作先进经验?

远程千里偷猪脚,已成财政工作先进经验?

家传编辑部
2026-06-25 23:28:50
认识大王蛇,也叫菜花蛇,农村最受欢迎的蛇,为啥人人见了都不打

认识大王蛇,也叫菜花蛇,农村最受欢迎的蛇,为啥人人见了都不打

农夫也疯狂
2026-06-22 16:18:35
特殊岛:希望加入中国大陆或与台湾省合并,但绝不会承诺日本!

特殊岛:希望加入中国大陆或与台湾省合并,但绝不会承诺日本!

星星会坠落
2026-06-23 02:56:13
高中的潜规则:60%多的人上不了本科,能上985的,不会在普高出现

高中的潜规则:60%多的人上不了本科,能上985的,不会在普高出现

好爸育儿
2026-02-12 16:04:52
终于定了!两岸在福建签约,赖清德拦不住,大陆早就预言岛内结局

终于定了!两岸在福建签约,赖清德拦不住,大陆早就预言岛内结局

猪小艳吖
2026-06-25 15:56:51
2026-06-26 00:19:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13360文章数 142682关注度
往期回顾 全部

科技要闻

存储成本压力山大!苹果罕见全球提价

头条要闻

男子徒手抓蛇被咬还淡定合影 结果历经4次抢救两进ICU

头条要闻

男子徒手抓蛇被咬还淡定合影 结果历经4次抢救两进ICU

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

这国产剧太装了,居然还热播第一?

财经要闻

又有纸尿裤送检后被检测出甲酰胺!

汽车要闻

老板们的新座驾!65万元起,尊界V800/V680开启预订

态度原创

艺术
游戏
手机
教育
军事航空

艺术要闻

税务局大楼能是这样?5个立方体扭40度,高171米!

R星官方确认《GTA6》没光盘!且实体版数量有限

手机要闻

苹果官网Apple Store突然维护:iPhone可能要涨价了

教育要闻

暑假不补课,补“学习力”——为什么说暑假是ADHD孩子能力提升的最佳窗口?

军事要闻

特朗普:现在到了关注朝鲜问题的时候了

无障碍浏览 进入关怀版