网易首页 > 网易号 > 正文 申请入驻

卡在触觉的AI,一目科技让机器人从“看世界”到“摸世界”

0
分享至

过去一年,具身智能的发展堪称“狂飙”,各大机构和企业纷纷投入世界模型与VLA(视觉-语言-动作模型)的研发。但在AI行业老兵、一目科技创始人兼CEO李智强看来,这些模型仍有明显缺失。如果机器人能像人一样理解并操作这个世界,仍差关键的一感:触觉

基于这样的判断,一目科技进行了从底层传感器到仿真算法的全链路布局,探索打造“触觉增强的世界模型”。

01

“世界模型”还缺什么?

如果将AI发展与人的五感对比,AI的“听觉”2015年已日趋成熟,视觉在过去10年也越来越发达,但嗅觉、味觉和触觉仍处于空白

李智强博士分析,在具身智能要解决的行动力、智力和精细化操作三大问题中,尤其精细化操作,离不开闭环感知能力。“如果只有视觉,在特定场景下会失效,比如根本无法夹取薯片这类脆性物体。”

他认为,世界模型要真正理解物理世界,必须补足触觉维度,因为人对物质世界的认知,正是源于不断触摸试探,在大脑中建立与物理世界的映射。“如果有一天,机器人能通过持续触碰与探索形成类人感知,便是世界模型达成终极目标的时刻。”

而这也正是一目科技的创业初心,“把类人的五感赋予机器里”,通过感知驱动“物理AI”的发展。李智强在卡内基梅隆大学攻读博士期间,研究方向是光谱仪芯片化及AI算法,“可以类比于人类的嗅觉和味觉。因为人的嗅觉、味觉主要是分子层面的一些感受和分析”,这也自然延伸到硬科技与物理AI的结合。

一目科技2015年成立于硅谷,2016年选择回国创业,原因是“物理AI”方向对硬件依赖极高,而中国在设计、制造工艺上优势显著。“比如设计一块电路板,国内七八天就能完成,在美国可能要三四个月。”

如今,经过学术界长达十多年的研究,以及一目科技的实践,均已验证:具备触觉后,机器人可完成夹薯片、穿针引线、拿起布料等操作,动作丝滑,这正是具身智能精细化操作的起点。触觉,正是世界模型走向完整的必由之路。

02

手指尖上的触觉“觉醒”

要让世界模型拥有“触觉”,离不开触觉数据的采集与感知技术的突破。“核心卡在传感器上”。

一目科技创业的第一阶段,着眼于分子光谱仪的芯片化,实现分子分析能力的AI化。团队花了四五年进行芯片研发、设计和流片,2020年推出首个产品线,应用于实验室和水质检测等场景。该产品线现已进入稳定期,实现持续盈利,为公司提供了宝贵的“造血能力”。

凭借在传感器方面的积累,两年前,一目科技开始向“触觉增强”迈进,启动视触觉传感器的研发,希望“通过视触觉传感器,让机器人真正能够触摸这个世界”。

2025年10月,在全球机器人顶会IROS上,一目科技展示了自主研发的全球最薄可商用仿生视触觉传感器。该传感器的核心在于“通过内置摄像头捕捉弹性材料接触物体时的细微形变,获取高清的‘触觉照片’序列,并通过AI解算出触觉信号”。不同于只能感知单一压力的传统传感器,这款产品能同时“感受”物体的软硬、表面纹理乃至滑动趋势



一目科技仿生视触觉传感器

李智强博士介绍,这一传感器实现了四个行业突破:其厚度仅为美国竞品的一半,解决了传统视触觉传感器因过厚,难以与灵巧手集成的行业痛点;克服了“温漂”问题工业级防尘达到IP65级传感器接触面都没有盲区,而竞品有10%到20%的盲区。此外,其响应时间仅8毫秒,可实现5毫牛级的多向力分辨,在多项性能上与全球最好水平持平。



一目科技CEO&创始人李智强

这款触觉传感器分辨率极高——可达数百万个像素,相当于手指尖拥有数百万个触点。得益于信号的高保真与数据的高准确度,能够解算出高精度的触觉信息,赋能机器人灵巧手的操作过程。

据悉,产品一经发布就获得多方合作和订单,团队预计未来一年出货量能跻身行业头部,“至少Top3的水平”。

不过,李智强博士也指出,目前许多机器人,包括人形机器人,虽然需要触觉传感硬件,但现有的世界模型和VLA模型仍未构建触觉感知的算法能力。为此,团队需要再进一步外延,“借助触觉,打通机器人精细操作的最后一环

03

打通触觉到世界模型的链路

我们未必自己去开发一整套世界模型,但是我们希望用触觉来增强世界模型。”李智强博士将这种理念概括为“触觉增强的世界模型”。团队主张“站在巨人的肩膀之上”,例如基于李飞飞团队发布的世界模型、阿里发布的VLM开源模型等,一目科技会在这些模型基础上进行补充和增强。

这项工作首先要解决数据采集难数据量不足两大难题。一目科技提出了“以真实触觉信号锚定仿真系统”的闭环路径。

我们靠人一条条采集出来的真实数据,其实在10万条级别,这个量对处理工作量来说很大,但对于大模型来说还是远远不够。”李智强博士坦言,目前开源社区也有数十万条触觉数据,但也是杯水车薪。

为突破数据瓶颈,一目科技在真实数据基础上,引入物理仿真与生成式AI结合的策略来扩展数据。团队有专家团队,利用有限元模型,将“桌子或鼠标”等物体在形态、硬度、摩擦力等维度上,用方程式仿真出来。“同时,我们还通过生成式AI去增加更多场景,比如光照、纹理、摆放位置和方向等,去做仿真的扩大化和无序化。”

从效果反馈看,物理仿真准确度更高,“因为它背后是物理方程,误差较小”;而生成式AI则“有一些幻觉,对物理规律的理解也有一定差距”。因此,团队持续优化物理模型,并随着生成式AI的进步,引入新模型和方法,“不断改进增强模拟数据的质量”。

有了这些物理仿真数据后,相当于在虚拟空间中搭建了一个可被“触摸”的世界。接下来要做的,便是让AI在仿真环境中去“触碰”它们,采集触觉信息

一目科技采用视触觉方式来完成这一过程。不同于传统靠压力或电阻的触觉传感器,视触觉方式不仅能“感觉”压力,内部摄像头还会捕捉到形变和光线的细微变化,从受力到光线变化再到力分布,完整还原触感生成的全过程。一目科技构建了视触觉传感器模型,输出的数字信号包含了纹理、形态、力方向等信息,来接入VLA与世界模型。

通过这种仿真增强方式,一目科技希望将触觉数据量扩展百倍以上。“只有这样,才能真正走上Scaling(规模化)的道路。”

完成数据扩展后,下一步是将触觉与视觉、语言等模态对齐,真正融入世界模型。具体而言,现有世界模型多围绕视觉与语言分配“token”,而一目科技的创新在于“引入新的触觉token”,通过训练增强模型的多模态理解能力,打通感知链路。

“其实后半部分和目前的大模型训练类似,市场上已有大量模型预训练、精调、强化学习的方法。”李智强博士介绍,“最终我们还会去做一些测试、验证方法。”

实际上,真正的挑战不在于训练方法,而在于触觉数据与其他模态的关系及对齐。当触觉、视觉等信息同时出现时,哪个可信度更高?该如何做综合决策?这些信息的关联度是什么?能否在同一域实现对齐?一目科技的创新重点正是围绕触觉信息的处理、对齐及其对决策的影响展开

这一阶段恰似20年前视觉模型的起点。就像20前做视觉模型时摄像头还不健全一样,现在的触觉感知也刚刚起步。“随着传感器的不断迭代和性能提升,这一切都将迎来改变。”

04

在狂飙的AI浪潮中站稳

人工智能的演进速度惊人。李智强回国创业时,正逢国内视觉AI热潮。当时,技术发展迅猛,但随着市场的快速变化,许多企业也被迅速淘汰。而如何在这一轮具身智能的激烈竞争中占据一席之地?他认为,关键在于技术壁垒和市场定位

“必须构建足够高的技术壁垒,特别是技术的不可复制性或不可替代性。”对一目科技而言,从感知传感器硬件到算法做全链路技术布局,而且要做到全球领先,技术壁垒才足够高。

市场选择也同样至关重要。“最好是找到那些巨头难以覆盖,或者不主要依赖客户关系的细分市场。”他说,“找到自己的生态位,并在技术上保持不可替代性,才是成功的关键。”

对于一目科技来说,团队投入最多的是有限元仿真光学仿真上。“作为创业公司,我们选择将业务收敛到极其细分、高度专业化的赛道。”

放眼全球业界,目前,真正做“触觉增强世界模型”的团队仍然稀少。早期Meta做过一些工作,但主要还是纯触觉领域。“我们尚未看到真正与世界模型深度打通的案例。”李智强博士直言,“在触觉与世界模型打通这一方向上,还有大量工作要做,现在仍严重不足。”

一目科技规划了循序渐进的路径。第一阶段基于开源模型,自己进行改造。当达到良好效果后,将开放部分模型和数据集,回馈开源社区。这将是第二阶段的事情。而从长远来看,有必要与一些模型巨头企业合作,更早地将触觉增强技术结合到他们的模型训练中去,这样,效果要好于模型成型后的再调整。目前,一目科技正处于第一阶段,预估跑通整个链路,需要9至12个月时间。

李智强告诉数智前线,未来5到10年将围绕这一主题做产品规划和投资。他认为,中国在“硬件+软件”融合模式下具有显著优势,这也为身处其中的行业和企业带来了极有前景的发展机遇。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深夜,美股大反转,英伟达拉升!金价跳水,加密货币重挫,超27万人爆仓

深夜,美股大反转,英伟达拉升!金价跳水,加密货币重挫,超27万人爆仓

每日经济新闻
2025-11-15 00:34:03
曾主任的运动照被扒出!笑容灿烂很有韵味,网友:挺阳光的人

曾主任的运动照被扒出!笑容灿烂很有韵味,网友:挺阳光的人

鋭娱之乐
2025-11-13 00:45:03
一夜负债200亿?电动车巨头轰然倒塌:终于活成贾跃亭信徒?

一夜负债200亿?电动车巨头轰然倒塌:终于活成贾跃亭信徒?

削桐作琴
2025-11-13 16:50:53
A股:3大利好,国常会、央行重磅发声,尾盘突然跳水下周会反弹吗

A股:3大利好,国常会、央行重磅发声,尾盘突然跳水下周会反弹吗

风风顺
2025-11-15 01:00:03
连续两场正负值最低,这位落选秀看起来很难得到来自火箭的关注?

连续两场正负值最低,这位落选秀看起来很难得到来自火箭的关注?

稻谷与小麦
2025-11-15 02:33:32
草台班子!方正证券研报火了,小散98.7%亏损?一眼假...

草台班子!方正证券研报火了,小散98.7%亏损?一眼假...

金石随笔
2025-11-15 00:08:47
全运会奖牌榜!山东还有3金优势,北京、四川、河南上升势头明显

全运会奖牌榜!山东还有3金优势,北京、四川、河南上升势头明显

烧体坛
2025-11-15 00:18:41
“诗与远方”的回响:刘诗雯换了搭档,依旧卫冕全运会混双冠军

“诗与远方”的回响:刘诗雯换了搭档,依旧卫冕全运会混双冠军

上观新闻
2025-11-15 02:53:06
高盛:三季度消费数据出现明显下滑

高盛:三季度消费数据出现明显下滑

黑噪音
2025-11-14 08:27:26
倒闭14万家!曾年赚22亿的奶茶之王,加盟商怒挂条幅:血本无归!

倒闭14万家!曾年赚22亿的奶茶之王,加盟商怒挂条幅:血本无归!

青眼财经
2025-11-13 23:02:27
两败俱伤!大陆市场700台光刻机全部回购?外媒:荷兰这次闹大了

两败俱伤!大陆市场700台光刻机全部回购?外媒:荷兰这次闹大了

闻识
2025-11-12 17:13:52
苏州市委书记调整

苏州市委书记调整

新京报
2025-11-14 18:38:31
中国“摸着石头过河”数十年,“石头”终于快被摸完了

中国“摸着石头过河”数十年,“石头”终于快被摸完了

朔方瞭望
2025-11-08 11:29:44
多家银行在拍卖平台挂牌卖房,有房产低于市场均价54%,分析人士:建议不要散售

多家银行在拍卖平台挂牌卖房,有房产低于市场均价54%,分析人士:建议不要散售

红星新闻
2025-11-15 00:22:09
全运乒乓,首冠诞生!林高远疯狂逆转,刘诗雯全场最佳,蒯曼遗憾

全运乒乓,首冠诞生!林高远疯狂逆转,刘诗雯全场最佳,蒯曼遗憾

知轩体育
2025-11-15 00:08:10
寒潮来袭!安徽气温猛降,最低-5℃!

寒潮来袭!安徽气温猛降,最低-5℃!

鲁中晨报
2025-11-13 10:47:05
仅20分钟!上海申花:重压之下,再添“劲敌”

仅20分钟!上海申花:重压之下,再添“劲敌”

话体坛
2025-11-14 16:02:13
韩国媒体惊呼:这位球员竟登顶亚洲市场价值榜首

韩国媒体惊呼:这位球员竟登顶亚洲市场价值榜首

星耀国际足坛
2025-11-14 23:51:41
神秘培训机构内男女学员赤裸上身集体狂舞,隐私成洗脑工具

神秘培训机构内男女学员赤裸上身集体狂舞,隐私成洗脑工具

诗意世界
2025-11-14 21:15:23
中国告全球,介入台海连着一块打!美国火速改口,支持两岸和统?

中国告全球,介入台海连着一块打!美国火速改口,支持两岸和统?

起喜电影
2025-11-15 02:43:00
2025-11-15 05:40:49
数智前线 incentive-icons
数智前线
关注数字化和智能化
1161文章数 617关注度
往期回顾 全部

科技要闻

京东“失去的五年”后,找到新增长了吗?

头条要闻

中方连发六张双语海报@高市早苗 媒体:总该看懂了吧

头条要闻

中方连发六张双语海报@高市早苗 媒体:总该看懂了吧

体育要闻

7-0狂胜!15万人口小岛离世界杯只差1分

娱乐要闻

王家卫让古二替秦雯写剧情主线?

财经要闻

财政部:加强逆周期和跨周期调节

汽车要闻

小鹏X9超级增程动态评测全网首发 高速实测车内65分贝

态度原创

时尚
艺术
亲子
手机
公开课

“羽绒服+半身裙”,混搭风太好看了!保暖又气质!

艺术要闻

中国唯一建在温泉上的城市,常年22℃,银杏美了千年

亲子要闻

细思极恐!全球1.14亿孩子患高血压,3大原因你娃可能都有!

手机要闻

双11霸榜后再爆!iPhone17激活破1000万,Pro Max凭新造型占近4成

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版