网易首页 > 网易号 > 正文 申请入驻

融合语言模型的多模态触觉传感器,推动机器人触觉迈向人类水平

0
分享至



论文第一作者为清华大学博士、南洋理工大学博士后李寿杰,清华大学博士生吴同和人工智能硕士生徐建乐。论文通讯作者包括清华大学深圳国际研究生院副教授丁文伯,大连理工大学教授解兆谦,新加坡国立大学助理教授吴昌盛和香港城市大学教授于欣格。

随着机器人技术从「预设程序执行」向「具身智能交互」跨越,触觉感知作为理解物体属性、实现精细操作的核心感测方式,其重要性日益凸显,但当前系统在感知维度、分辨率及信号解读能力上仍远逊于人类,导致机器人往往处于「有感无知」的状态。

在此背景下,清华大学深圳国际研究生院丁文伯团队联合无界智航(Xspark AI)及多所国内外科研机构,从鸽子卓越的多光谱视觉和非成像感知机制中获得灵感,研发出了一种仿生多模态触觉传感器SuperTac。

该系统将多光谱成像、摩擦电感测与惯性测量融为一体,并通过构建8.5B参数的触觉语言模型DOVE,实现了触觉信号从底层感知到高层语义推理的突破。

相关成果作为封面元素发表于《Nature Sensors》第一期,也是国内以第一单位在该期刊发表的首篇,标志着机器人触觉感知向「人类水平」迈出了关键一步。



  • 论文标题:Biomimetic multimodal tactile sensing enables human-like robotic perception
  • 论文链接:
  • https://www.nature.com/articles/s44460-025-00006-y



图 1 Nature Sensors 第一期封面图,SuperTac 作为核心元素在封面上进行了展示(右下角)

一、仿生逻辑:

从鸽子眼球到多模态感知架构

鸽子拥有自然界最复杂的感知系统之一,SuperTac 的硬件设计对应了其生物学特征。



图 2 仿生学设计:受鸽眼启发的高分辨率多模态触觉传感器

多光谱视觉的迁移:从视锥细胞到多通道相机

鸽子的视网膜包含多种视锥细胞,不仅能感知可见光,还拥有人类不具备的紫外线(UV)感知能力。

SuperTac 集成了小型化的多光谱成像模块,覆盖了从紫外(390 nm)、可见光(400–700 nm)到近红外(940 nm)及中红外(5.5–14.0 μm)的超宽频段。

通过引入超宽频段成像,机器人能够在单一交互中同时解析热辐射、荧光位移等深层物理信息,实现了对物体形状、纹理、颜色和温度的全面表征。

非成像感知的映射:从地磁感应到 TENG / IMU

鸽子能通过视网膜中的隐花色素等分子感知地磁场,这是一种不依赖图像的物理感知。SuperTac 在 1 mm 厚的皮肤内嵌入了摩擦纳米发电机(TENG)和惯性测量单元(IMU)。

TENG 利用接触起电原理,根据不同物体的电负性差异识别材质(准确率 95%),并实现 15 cm 内的接近觉感知。IMU 模拟生物的本体感受,捕捉 0–60 Hz 的振动及碰撞信号。通过将摩擦电与惯性信号与光场调制耦合,传感器无需密集电极阵列即可扩展出对材质极性、震动及空间姿态的感知能力。

二、核心机制:

光场调制的「智能感知层」


SuperTac 的核心竞争力在于其厚度仅为 1 mm 的光场调制多层感知皮肤。皮肤最外层的导电层采用透明的 PEDOT:PSS,通过丝网印刷技术在具有优异拉伸性能的 TPU 薄膜上形成涡旋线电极设计。这种涡旋设计能提供均匀的电学信号,结合摩擦起电机制,使皮肤在接触不同电负性物体时产生截然不同的电学反馈,从而实现高精度的材质分类与 15 cm 范围内的接近觉探测。



图 3 多光谱机理

在导电层之下,单向透视反射层充当了光学开关,其透明度受两侧光强差调节。当内部 LED 开启形成「触觉模式」时,内侧光强占据主导,反射层变为不透明状态,CMOS 单元聚焦捕捉皮肤表面的微观纹理与形变;当内部光源关闭,反射层随之变为透明,允许外部可见光透射,使传感器能够直接获取物体的 RGB 颜色信息。

紧邻其下的紫外荧光标记层则利用在近红外波段不可见但在紫外光下激发的荧光标记,实现了形变监测与物体纹理检测的解耦,确保在复杂抓取过程中能够同步捕捉切向滑动与表面细节。



图 4 相关测试指标

三、触觉语言大模型:

8.5B 参数背后的多模态融合架构


为了构建跨模态物理信号与自然语言空间的统一表征对齐,DOVE 采用了分层架构设计,其底层骨干由预训练的大语言模型 Vicuna 构成,为系统提供了强大的语言理解与逻辑推理基础。

为了处理极其复杂的触觉输入,系统并行集成了四组预训练的 CLIP(对比语言—图像预训练)模型作为模态编码器,将图像化的触觉特征(包括颜色、纹理、温度和材质信号)提取为深层特征向量。



图 5 触觉语言大模型 DOVE

DOVE 的训练通过三阶段策略实现从底层感知到高层认知的递进:首先利用 CLIP 将异构传感器信号转化为通用的图像表征;随后通过投影层将触觉特征精准对齐至语言模型空间;最后针对 Vicuna 骨干网络进行微调,使其能够结合常识对触觉指令进行复杂推理。

四、应用场景:

从物理触碰到语义逻辑的跃迁


SuperTac 提供的多模态底层数据通过 DOVE 模型的深度解析,成功实现了从单纯的「物理感知」向高层「语义认知」的跨越,赋予了机器人类人的具身交互能力。



图 6 SuperTac + DOVE 的应用场景

在基础的识别维度,DOVE 能够实时融合传感器采集的异构多模态数据,为操纵目标建立起全方位的「物理画像」。例如,在抓取实验中,面对一个未知杯子,DOVE 能准确地将其感官印象转化为人类可理解的语言:「黄色,室温,表面具有规律排布的凸起纹理,判定为金属材质」。

最高层级的应用体现在常识指引下的功能决策与推理。DOVE 不仅解析当前的物理数据,还能将实时的触觉反馈与预训练的大模型常识相结合,从而推断物体的潜在功能并做出逻辑决策。

在极具挑战性的垃圾分拣任务中,这一能力得到了充分验证:当机器人接触到乱序堆放的杂物时,DOVE 能够根据触觉反馈进行逻辑建模。例如,它会推论道:「该物体具有典型的 PET 物理特征,结合其轻薄的结构,判定为废弃的塑料饮料瓶;基于环保常识,建议将其放入可回收垃圾桶」。

五、未来方向


本研究为机器人触觉提供了多个富有前景的发展方向:硬件方面通过传感器微型化、低功耗芯片及高集成封装,提升机器人手内操作的灵活性并解决高负载下的散热稳定性难题;认知层面则依托 DOVE 模型的模态无关框架,通过优化传感器配置与专用数据集来持续增强系统的泛化能力,从而为实现自然、高效的人机交互奠定坚实基础。



图 7 安装 SuperTac 的灵巧手

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
浙江一男子在后山种了棵杨梅树,三年后发现树会自己移动

浙江一男子在后山种了棵杨梅树,三年后发现树会自己移动

匹夫来搞笑
2026-05-11 10:09:23
中超无罚分积分榜:成都居首,山东升至第4积分追平铜梁龙

中超无罚分积分榜:成都居首,山东升至第4积分追平铜梁龙

懂球帝
2026-05-10 22:35:27
赫内斯谈克罗斯:多要一欧元,那就得走

赫内斯谈克罗斯:多要一欧元,那就得走

懂球帝
2026-05-10 17:07:24
冲2-0!U17国足vs卡塔尔生死战,日主帅:咱还活着 感谢足球之神

冲2-0!U17国足vs卡塔尔生死战,日主帅:咱还活着 感谢足球之神

大秦壁虎白话体育
2026-05-11 10:46:35
男子为泄愤将单身女邻居手机号写在公厕致其频遭骚扰,因诽谤罪一审获缓刑,赔偿5000余元;当事女子:量刑过轻,计划提起上诉

男子为泄愤将单身女邻居手机号写在公厕致其频遭骚扰,因诽谤罪一审获缓刑,赔偿5000余元;当事女子:量刑过轻,计划提起上诉

极目新闻
2026-05-11 07:34:42
“这环境,咋敢生孩子?”女孩因充电器被碰掉绝食,穷人家的公主

“这环境,咋敢生孩子?”女孩因充电器被碰掉绝食,穷人家的公主

妍妍教育日记
2026-05-09 13:31:49
宝马新车提回家 引擎盖现一窝猫 4S店:检测洗车未发现 愿提供检查与关怀补偿

宝马新车提回家 引擎盖现一窝猫 4S店:检测洗车未发现 愿提供检查与关怀补偿

快科技
2026-05-09 20:16:11
WTO 被架空无人提!中国入世谈判耗时 15 年,如今机制遭美国瘫痪

WTO 被架空无人提!中国入世谈判耗时 15 年,如今机制遭美国瘫痪

深析古今
2026-05-11 04:42:43
新一轮金融危机,开始了

新一轮金融危机,开始了

米宅
2026-05-11 07:22:58
没想到,失业后日子过得更好了,医生都震惊不工作结节都没了!

没想到,失业后日子过得更好了,医生都震惊不工作结节都没了!

另子维爱读史
2026-05-11 07:40:22
五万多人被套路!女子租共享充电宝被扣149元,涉事企业被撕底裤

五万多人被套路!女子租共享充电宝被扣149元,涉事企业被撕底裤

火山詩话
2026-05-10 14:42:17
内塔尼亚胡:伊朗战争“还没结束”

内塔尼亚胡:伊朗战争“还没结束”

参考消息
2026-05-11 11:16:11
颜宁不懂为何网友质疑她吗?其实她心里很清楚,只是不愿接受

颜宁不懂为何网友质疑她吗?其实她心里很清楚,只是不愿接受

明眼人谈教育
2026-05-10 08:30:03
邦本敢说大实话 老徐要变魔鬼!李金羽练啥了?球迷:上限是中甲

邦本敢说大实话 老徐要变魔鬼!李金羽练啥了?球迷:上限是中甲

刀锋体育
2026-05-11 08:38:03
欠了快400亿,骂了整十年,华西村硬是靠一笔意外投资活过来了

欠了快400亿,骂了整十年,华西村硬是靠一笔意外投资活过来了

小莜读史
2026-05-07 19:10:59
克里米亚大桥传出10起爆炸!乌克兰完全清理库皮扬斯克俄军

克里米亚大桥传出10起爆炸!乌克兰完全清理库皮扬斯克俄军

项鹏飞
2026-05-09 20:56:35
阿森纳争冠大捷却遭重创!两大主力后卫伤退,怀特含泪戴护具离场

阿森纳争冠大捷却遭重创!两大主力后卫伤退,怀特含泪戴护具离场

夜白侃球
2026-05-11 10:04:36
仅用2场比赛,王皓打破质疑彻底征服球迷,坚信梁靖崑只因两点

仅用2场比赛,王皓打破质疑彻底征服球迷,坚信梁靖崑只因两点

十点街球体育
2026-05-11 10:52:33
Nice!杜兰特点赞!勇士第一笔重磅签约

Nice!杜兰特点赞!勇士第一笔重磅签约

篮球实战宝典
2026-05-10 19:42:35
“金正恩遇袭就自动核反击”?朝鲜这条传闻把全网吓到了

“金正恩遇袭就自动核反击”?朝鲜这条传闻把全网吓到了

桂系007
2026-05-10 15:21:53
2026-05-11 12:27:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12965文章数 142648关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

特朗普时隔9年再度访华 今年特朗普还赞叹中国仪仗队

头条要闻

特朗普时隔9年再度访华 今年特朗普还赞叹中国仪仗队

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

谢霆锋没想到,王菲靠张艺谋重返巅峰

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

全球化成国内车企未来胜负手,谁是出海最强"水手"?

态度原创

旅游
艺术
手机
房产
军事航空

旅游要闻

河南洛阳栾川重渡沟景区,百米巨型瀑布被喷上油漆:瀑布暂停开放

艺术要闻

2026中央美术学院博士生毕业作品选

手机要闻

控制成本 三星Galaxy S27或引入京东方供货屏幕

房产要闻

低价甩卖!海口这个地标商业,无人接盘!

军事要闻

伊朗革命卫队深夜警告

无障碍浏览 进入关怀版