网易首页 > 网易号 > 正文 申请入驻

机器人启蒙,需要一所能“犯错”的幼儿园

0
分享至

2024年,强化学习奠基人理查德·萨顿与他的导师安德鲁·巴托共同获得了图灵奖。

这个奖项来得不算早。过去三十年,萨顿的理论支撑了AlphaGo、ChatGPT等系统的进化,但他三十年前写下的理论,直到今天才被具身智能行业真正理解:

智能体要从试错中学习,要从真实经验里进化。

2023年,萨顿参与创办非营利研究机构Openmind。2025年4月,萨顿在联合发表的文章《欢迎来到经验时代(Welcome to the Era of Experience)》中,再次一针见血地指出:

“新一代智能体,必须拥有像人类一样在长时间尺度上不断推进的经验流,在真实的物理反馈中实现自我进化。”

这一次,除了理论之外,萨顿把目光投向了更远的地方。

今年5月,萨顿与他山科技在加拿大正式签约,以长期合作的形式共同推进一个名为“机器人幼儿园”的项目。


一位图灵奖得主,与一家中国触觉公司一拍即合,共同为具身智能的下一个十年提前做出了判断:训练机器人的全新路径,也许就在真实的触摸与试错之中。

具身智能,缺的是“第一人称经验”

他山科技CEO马扬给出了一个很直白的判断。机器人要干活,无非解决两个问题:一个是机器人自己在物理世界的里移动,通过双足、四足、轮式等途径,很多公司都在做。

另一个就是操作目标物体,用手去抓、去放、去拧,行为流畅且不会被上一个动作的偏差打断。这两件事加起来,基本能覆盖目前人类需要机器人做的90%-95%的工作。

从一开始,他山科技想的就是从触觉切入,做好后面这件事。

2017年他山科技刚成立的时候,大多数机器人厂商都在做移动平台,展示的是跑跳翻滚的能力。然而,人类90%以上的物理交互,其实是通过手指完成的。手指不像腿,它要一直和不同的目标物体接触,感知、决策、调整,是一个难而持续的过程。

把具身智能的“手指位置”解决好,触觉感知能力是一个核心变量,也是“让机器人干活”的底层方法论。在这条路上,他山科技一做就是将近十年。

具身智能的主流训练方向,依赖的是静态数据集下端到端的模仿,就像在套用题库。人类演示的数据,本质上是第二人称经验,机器人在学习人的做法,但不能亲手“摸”出来,也就无法理解物理世界的运作规律。

他山科技很早就意识到这条路线面临的问题:正如人类幼年时需要从模仿和实践中成长,机器人“启蒙”训练需要的不仅是模仿,更是属于自己的第一人称经验。

在行动中感知后果、在反馈中调整行为的训练方式,可能是最接近能让具身智能进行“自我训练”的方法论。

这个判断,与萨顿的想法不谋而合。

萨顿提出的“经验流”概念,要求智能体的学习过程与行为过程完全融合,每一次行动都是数据采集,每一次反馈都是训练信号。因此,能提供第一人称体验的真实环境,是这个概念落地的关键。

然而,它长期停留在理论层面,也正是因为真实的物理环境提供不了低成本、高频率、标准化的交互反馈。长期以来,具身智能行业都在致力于解决大脑与眼睛的问题,缺少一个能够精准感知物理接触的通道。

触觉是物理交互中最核心的感知通道。机器人接触一个物体的时候,触觉传感器能够实时反馈接触点的三维力分布、物体的局部形变以及滑移趋势。有了这些信息,机器人才能迅速调整力量、角度,决定收紧或者放松。

高精度的触觉感知技术不断涌现,补齐了机器人曾经缺失的“传入神经”,萨顿为代表的理论先驱也开始重点关注这一领域。2025年11月,萨顿在中国走访,主动联系参访的两家具身智能企业之一,就是他山科技。


萨顿走访他山科技

他山科技是触觉感知赛道上技术储备最完整的公司。

他山科技自研的触觉传感器,力分辨率达到0.01N,这个精度“类似一根头发丝掉到手指上的力”。凭借在AI触觉感知技术及全栈触觉解决方案的多年研发,攻克了触觉多维感知信号同时解析的全球技术难题,构建起“芯片-传感器-算法模型-场景应用”的完整技术体系。

当大多数触觉传感器厂商还停留在单一维度的力测量或简单的电容变化时,他山科技已经实现了三维力、材质识别、接近觉和协同感知等同步解析。

更重要的是,他山科技把触觉感知能力做到了量产,过去两年里,他们的产品已经进入商业化阶段,开始为主流灵巧手厂商批量交付。2025年,他山科技占据人形机器人触觉传感器赛道超过80%的市场份额。


TS-VT视触融合训练平台

萨顿在他山科技参观后,双方快速推进合作,除了方法论契合之外,也是因为在他山科技的大楼里,他看到了一个已经把触觉感知从实验室推向了产业落地的团队。

于是,在强化学习理论发布三十年之后,理论与技术在具身智能领域实现了双向奔赴:学术泰斗找到了能够将理论工程化的盟友,他山科技补上了触觉加速机器人训练的理论拼图。

机器人幼儿园,在真实环境中“启蒙”

双方合作的落脚点,具体形态而言就是“机器人幼儿园”。

在他山科技,萨顿看到中国的小学生上机器人课,惊叹于国内的具身启蒙环境如此开放,人与机器人能够更自然地相处,机器人幼儿园的想法由此萌生。

机器人幼儿园是一套面向机器人持续学习的触觉与多模态经验训练平台,它把真实物理环境、仿真环境、多台机器人本体、触觉与多模态感知设备、任务课程、数据采集和评测机制整合在一起,让机器人在反复接触、尝试、失败和修正中形成可训练的经验。

为什么叫幼儿园?马扬说,现在的具身智能很像一个0到3岁阶段的婴儿。我们在视频里看到机器人能做到各种事情,觉得很厉害,实际上成功率并不高,而且它自己也不知道自己是成功还是失败。“它只是做出来了,人们就会鼓掌”。

人类的正确示范,其实很难让机器人理解到自己做对了什么。因为“正确”这件事很模糊,在一个很大的范围内。只有错误是有边界的,足够多的错误实验,才能让一个机器人知道任务的边界在哪里,下一次操作时应该如何调整。

“具身智能的安全感也不是大家一起画一条线界定出来的,而是它在客观交互中逐步探索出来的。”

马扬深信,就像人的安全本能不仅是靠阅读手册获得的,也是在一次次接触、跌倒、调整中长出来的,机器人也一样,只有通过足够多的真实试错,它才能理解什么是不安全的。如果机器人能自己划出安全的操作边界,既保护了机器人自身,也能演绎出对他人的安全性。

萨顿参访他山科技后,双方就合作事项快速推进,2026年5月11日完成了签约。

签约仪式上,萨顿谈到合作的意义:“早在我们读研究生的时候,就有人提出制造一个像婴儿一样的机器人,让它与世界互动并通过经验成长。这个想法在当时几乎不可能实现,现在我们有了足够的算力,也有了足够多的机器人经验,但我认为一直缺失的关键因素,是明确认识到这个理想的价值。它需要的不只是资金,更重要的是时间和坚持。”

萨顿表示,在参访他山科技的时候,他惊喜地发现,这家中国公司理解到了这一点。整个合作计划是五年的周期,目标是找到最适合具身智能的学习方法论。


签约仪式现场

接下来,“机器人幼儿园”将搭建真实环境,放置机器人本体在其中完成训练。尽管初期以同构本体的形式训练,马扬相信,在持续学习的探索之下,异构的机器人在后期不会成为太大的学习障碍。因为一个智能体如果理解了任务的底层逻辑,本体形态不同,也不会阻碍学习和经验的传递。

与之相比,现在更重要的是直面真实的环境变量。

马扬直言,具身智能行业的硬件已经达到了60分的水平,欠缺的是推理能力和持续学习的能力。缺少这两样能力,就没法做到更好的泛化和演绎,整个行业会被拖着去卷参数,找不到更广阔的应用空间。

因此,早期学习必须与真实环境不断交互,搭建的训练环境不能再刻意回避真实场景中的变量和不利因素,否则,机器人学到的经验天花板很低,很难再向前走。

他山科技与萨顿之间的合作,也是为了找到一套新的路径。"在这件事情上,没有什么高科技,只有方法论的选择。"

商业化的前提,是能“边干活边学习”

方法论最终还是要在应用场景里检验。马扬对于商业化落地也有一个很务实的判断:未来三到五年,具身智能最可能率先进入的,不会是那些高逻辑性、高时效要求的场景。

它更适合替代一类特定的工作:人不想干,容错率又不能太低。

这类工作有三个特征:任务重复,但不是完全固定的流水线;对成功率要求非常高,失败一次可能就会直接中断,需要强人工干预;单次任务的时效要求相对宽松,不需要秒级响应。

马扬举了几个例子:一个是服务业场景,北美餐馆里的洗碗工。他们的工作是把碗碟冲一下,放进洗碗机,动作很简单,但枯燥繁重。目前,美国有几百万人在这个岗位上,机器人如果能把这个动作的成功率做到足够高,就能释放巨大的商业价值。同时,洗碗这个任务没有太高的时效要求,一晚上洗完就行。但对成功率的要求很高,打碎一个碗,整个流程就得停下来。

农业加工领域有一个更具体的案例。潜江的小龙虾加工厂里,“小龙虾去头”这个步骤一直要靠人来完成。因为小龙虾大小不一样,壳的软硬度随季节变化,对设备的触觉感知技术要求很高。一个工厂每年在这道工序上的人力成本高达数千万元,高峰时段,一两千人在产线上干活。

他山科技花了半年时间,先做模仿学习和仿真训练,再让机器人在真实产线上用强化学习反复自主练习。最终把剥虾成功率提到了95%以上,在高效去除虾头的同时完整保留虾黄,提高产品价值结构。目前,他山科技智能化剥虾设备已经与头部小龙虾加工企业达成合作,首期签约100台。


他山科技智能化剥虾设备

这些场景的选择逻辑很清晰。机器人目前还不能去和人比推理速度,但很适合去填补那些自动化做不了、人又不愿意干的缺口。触觉感知则是解锁这些场景的钥匙。因为它提供实时反馈,机器人可以在执行过程中灵活调整力度和角度,不需要完美预设的轨迹。

如果行业内的大部分精力都放在训练机器人去模仿人,那么具身智能的“天花板就是人本身”。要突破这个天花板,需要整个行业一起探索。

马扬一直强调,比起他山科技自身的壁垒,他更希望看到的是有更多同行加入进来,一起往正确的方向去推动。他山科技和萨顿希望要建立一个开放、共享的研发基础设施,吸引全球学术界和产业界共同探索具身智能持续学习的方法论。

现阶段,他山科技和萨顿作为发起方会聚焦于把平台搭起来。而未来,整个体系将逐步面向行业开放,他山科技的产业链上下游、全球高校、科研机构可能都会成为这个合作项目中的生态伙伴。

触觉感知与持续学习的结合,正在为具身智能的下一个十年铺路。

萨顿的答案,已经写在了真实经验流的设想中。而他山科技即将用一座机器人幼儿园,把这个答案变成可执行的工程方案,让具身智能在真实的物理世界中,学会在“错误”中成长。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

杰丝聊古今
2026-05-03 13:35:27
陕籍演员李晓强:出道30多年,精通多种乐器,今出演《主角》红了

陕籍演员李晓强:出道30多年,精通多种乐器,今出演《主角》红了

白面书誏
2026-05-25 20:35:53
台湾专家赖岳谦:印度确实有一点比中国强很多,那就是——嘴。

台湾专家赖岳谦:印度确实有一点比中国强很多,那就是——嘴。

荆楚寰宇文枢
2026-04-22 23:16:37
越南谈中越战争:中国武器和士兵都不如越南,唯有一样装备超越

越南谈中越战争:中国武器和士兵都不如越南,唯有一样装备超越

鹤羽说个事
2026-05-21 22:57:52
意甲两位少帅崛起!一位受命于败军之际,一位创造队史百年纪录

意甲两位少帅崛起!一位受命于败军之际,一位创造队史百年纪录

体坛老球迷
2026-05-26 17:25:50
爆了!普京发出警告所有大使馆撤离,欧盟决不后退,美国打破僵局

爆了!普京发出警告所有大使馆撤离,欧盟决不后退,美国打破僵局

阿天爱旅行
2026-05-26 18:33:59
陈毅查出患癌后,沈阳军区司令员“质问”陈:我是不是得罪你了?

陈毅查出患癌后,沈阳军区司令员“质问”陈:我是不是得罪你了?

云霄纪史观
2026-05-26 19:36:57
人活到多大岁数离开,堪称完美谢幕,活到这个岁数即可,你赞同吗

人活到多大岁数离开,堪称完美谢幕,活到这个岁数即可,你赞同吗

暖风吹过竹林
2026-05-16 10:14:30
3.9元无限Token,Codex、Claude Code、龙虾都能用

3.9元无限Token,Codex、Claude Code、龙虾都能用

沃垠AI
2026-05-26 17:42:27
好热!突破35℃!今晚阵雨雷雨又来

好热!突破35℃!今晚阵雨雷雨又来

掌上金牛
2026-05-26 16:28:12
德媒感慨:中国人现在已不拿俄欧当回事了,觉得天下英雄唯有中美

德媒感慨:中国人现在已不拿俄欧当回事了,觉得天下英雄唯有中美

有范又有料
2026-05-25 21:01:43
宋凯致信赵松源:足协全力保障球员留洋;期待你在欧洲成才

宋凯致信赵松源:足协全力保障球员留洋;期待你在欧洲成才

懂球帝
2026-05-26 17:52:07
彼得雷乌斯戳破真相:乌克兰早已打醒世界,美国却还在装睡

彼得雷乌斯戳破真相:乌克兰早已打醒世界,美国却还在装睡

老马拉车莫少装
2026-05-24 22:40:10
于丹被北师大免职,跌落神坛后竟活成这样!人人都该警醒...

于丹被北师大免职,跌落神坛后竟活成这样!人人都该警醒...

华人星光
2024-11-07 13:39:41
他是天津泰达名宿,娶美女演员生一女,45岁在苏超执教还扎根青训

他是天津泰达名宿,娶美女演员生一女,45岁在苏超执教还扎根青训

青梅侃史啊
2026-05-26 19:32:02
14亿人的“高压锅”终于炸了:印度如何用一条黑产,冲垮整个发达国家?

14亿人的“高压锅”终于炸了:印度如何用一条黑产,冲垮整个发达国家?

美食格物
2026-05-26 11:35:19
王鹤棣深夜发文称“不舒服”后掉粉超20万,是真人秀炒作翻车还是情商低?

王鹤棣深夜发文称“不舒服”后掉粉超20万,是真人秀炒作翻车还是情商低?

新民周刊
2026-05-25 20:01:09
为队友发声!米切尔:很多人都是唯冠军论,却忽略了哈登的伟大

为队友发声!米切尔:很多人都是唯冠军论,却忽略了哈登的伟大

懂球帝
2026-05-26 15:01:09
英媒爆料:特朗普透露了他打算如何处理伊朗已经生产出的浓缩铀

英媒爆料:特朗普透露了他打算如何处理伊朗已经生产出的浓缩铀

时光流转追梦人
2026-05-26 20:10:16
严重撕裂的A股走势,背后到底隐藏了什么市场真相?

严重撕裂的A股走势,背后到底隐藏了什么市场真相?

立成说投资
2026-05-26 12:55:16
2026-05-26 21:40:49
36氪 incentive-icons
36氪
让一部分人先看到未来
151486文章数 2848774关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

团伙在上海高速碰瓷涉案60多万:定下每天1万5的KPI

头条要闻

团伙在上海高速碰瓷涉案60多万:定下每天1万5的KPI

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

旅游
艺术
健康
公开课
军事航空

旅游要闻

与辉同行山东行 |《我们的幕后》山东Day2

艺术要闻

中国之美,美到极致!

外泌体抗衰,什么时候能用上?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊在阿巴斯港附近短暂交火 交战过程披露

无障碍浏览 进入关怀版