网易首页 > 网易号 > 正文 申请入驻

机器人训练,北京男大有了技能玩法

0
分享至

一水 发自 凹非寺
量子位 | 公众号 QbitAI

还得是大学生会玩啊(doge)!

网上正高速冲浪中,结果意外发现:有男大竟找了个机器人队友?而且机器人还相当黏人(bushi~

白天超市打工它要跟着,一看东西装好就立马乐颠颠帮忙拉小推车,上楼下楼忙个不停:



等到中午去食堂兼职,它也自告奋勇帮忙推餐车,而且指哪打哪(拍拍头就知道你想让它停下):



甚至,一天劳作结束后,连健身它也要一起。既然来都来了,男大表示:那就练起来!



笑死,感觉可以以机器人视角去拍vlog了,标题就叫《高能量之机器人的一天》。



言归正传,不知道大家发现没有,图中男大和机器人伙伴的交流都是通过拍拍头、拉拉身体搞定的,既没有遥控、也没有语音





这就有点东西了!要知道目前绝大多数机器人都是靠外部传感器(摄像头、激光雷达等)和遥控驱动的,而这群男大竟提出了一种全新的方式——仅通过“本体感知(Proprioception)”就能和外界交互。

好好好,搞半天人家这还是个技术含量很高的正经研究,而且连论文都有。



速去扒了一扒,结果发现里面还真有不少好东西、新东西——

强化学习新方法:仅依赖本体感知搬运各种物体

先说说他们想解决什么问题吧。

在“人机协作搬东西”这一核心场景中,相关技术已在机械臂上验证充分,但在人形机器人领域仍探索不足。

这主要是因为人形机器人复杂的“全身动力学” ——相比机械臂仅需控制局部关节,人形机器人需要协调躯干、四肢等多个部位,且运动过程极易受自身平衡、环境接触等多因素影响。

于是,他们设定了一个大胆的目标:实现人形机器人与人类完美协作搬运各种东西



为此,他们在论文中提出了一种全新的强化学习方法COLA——不依赖摄像头、激光雷达等外部传感器,机器人仅通过“本体感知(Proprioception)”就能和外界进行交互



具体而言,COLA的设计思路可以拆解为以下3点:

让机器人学会“眼里有活儿”

第一点就是教会机器人如何“眼里有活”。

想象你正在和机器人一起搬柜子。传统机器人往往比较呆板——需要分别设计“机器人主导(领导者)” 和“人类主导(跟随者)” 两种独立策略,切换时容易卡顿。

而COLA将这两种情况整合到一个统一策略中:

  • 当你发力稳定、方向明确时,机器人就化身“跟随者”,配合你的动作。
  • 当你犹豫或柜子有倾斜风险时,它会立刻切换成“主导者”,主动调整动作稳住平衡。

无需任何人工干预或额外指令,机器人自己就能实现两种角色的丝滑切换。

不信你瞅,它现在搬东西上斜坡也不在话下:



在动态实战中训练

此外,为了让COLA能应对真实世界的混乱,它的训练场是一个高度动态的闭环环境

一方面,为避免模型仅在固定轨迹搬运中有效,他们在训练时模拟了各种突发状况,例如人类突然转向、物体重量分布变化、手部打滑……主打一个实战演练。

另一方面,训练过程中会逐渐形成一个闭环——机器人的动作会实时反馈给环境(如物体位置变化),环境变化又反过来影响机器人的决策(如物体倾斜后机器人需调整力度),形成“决策-反馈-再决策”的循环,就像真实搬运中持续的“你拉我推”。

点击就看人机反复推拉之术(手动狗头):



仅依赖 “本体感知”,无需外部传感器

“岗前培训”结束后,接下来真进入实战环节了。

前面也反复提到,COLA的关键优势之一是“不依赖外部传感器”,仅通过机器人的“本体感知”就能接收获取信息。

所谓“本体感受”是指机器人自身的内置感知数据,比如关节角度、肌肉执行器的力度反馈、自身的位置/速度信息等。采用这种设计,机器人这下不仅能免受外部环境干扰(如光线昏暗影响摄像头),而且交互方式也大变样了。

很直观的一点就是,一直以来广受吐槽的遥控这下真没了。

搬箱子一人一机就能搞定:



之所以能抛弃传感器,这主要得益于关键两步:

  • 残差教师微调:先让机器人学会稳定的运动策略,然后引入一个残差教师模型,专门学习在搬运协作中需要做出的额外调整(如何打配合),最终将两者结合微调出一个完整的协作策略;
  • 仿真训练与知识蒸馏:上述过程全部在仿真环境中完成,可以快速、安全地模拟数百万次训练。训练出强大的“教师”后,再通过知识蒸馏技术,将其能力迁移到一个更轻便、更适合在实体机器人上运行的“学生策略”中。

正是这个精巧的设计,让它彻底告别了传感器。 因为在整个过程中,无论是基础的运动能力,还是高级的协作技巧,模型学习和决策的全部依据,都来自于机器人的本体感知数据。



而且值得一提的是,这种设计也降低了硬件成本和系统复杂度,毕竟现在无需耗费时间金钱在外部传感器的采购和软硬件集成上了。

整体而言,COLA的终极目标不是去“猜”人类具体在想什么,而是通过本体感知数据“隐式预测(Implicitly Predict)”两个关键信息:

  • 物体的运动趋势(会不会翻?要往哪倒?)
  • 人类的协作意图(他想转弯吗?需要我多出力吗?)

最终,以“维持负载平衡”为核心指标,整个过程通过协调的轨迹规划来实现安全、顺滑的人机协作。

仿真/真实世界/人类用户实验,均验证了COLA的有效性

更多实验也验证了COLA设计的有效性。

在仿真实验中,通过可控虚拟环境,他们想精确测量COLA对人类effort(指用力大小、肌肉疲劳度)和物体稳定性的影响。

结果发现,不管是运动的精准度(线速度、角速度、高度误差),还是减轻人类搬运时的负担(平均外力),COLA系列都比之前的显式目标估计、Transformer方法强很多。

而且其中以“领导者”思路设计的COLA-L比“跟随者”COLA-F表现更突出,能更好地帮人类分担负载、保持稳定。



在真实世界中,面向不同类型物体(如规则形状的箱子、柔性物体担架等)和不同运动模式(如直线走、转弯等),他们还测试了COLA的泛化性。

结果发现,COLA在所有测试场景中均实现了“稳健的协作搬运”,相关定量结果如下:



除此之外,他们还找来了23名人类参与者,让他们分别体验与“COLA控制的机器人”和“其他基线方法控制的机器人”进行协作,然后通过问卷和动作传感器来收集主客观感受。

结果显示,COLA方法在参与者的评估中表现最好,无论是在高度跟踪还是平滑性方面都拿到了最高分。



“人机协作新范式”中国团队造

最后再来看看COLA背后的团队,成员清一色来自国内。

三位同等贡献作者均来自北京通用人工智能研究院:

Yushi Du,目前是香港大学电机及电子工程系刚入学新生,由于个人相对低调所以网上资料很少。

Yixuan Li,北京理工大学计算机科学与技术学院博士生。

从已发表的论文来看,他对人形机器人、3D场景理解与导航、以及人机协作等领域感兴趣。



Baoxiong Jia(兼通讯作者),北京通用人工智能研究院研究科学家。

本科毕业于北京大学,后获得加州大学洛杉矶分校硕博学位,对计算机视觉、AI和认知科学的交叉领域尤为感兴趣。

光是今年他就有多篇论文入选顶会,最新一篇关于统一力与位置控制的新论文就被CoRL 2025接收,并获得口头报告的机会(Oral)。



其他通讯作者分别为Wei Liang、Yanchao Yang和Siyuan Huang。

Wei Liang(梁玮),北理计算机科学与技术学院教授,负责领导感知、交互与具身化实验室(PIE Lab)。

她于2005年获得北理计算机科学博士学位,对计算机视觉、用于培训和教育的虚拟现实(VR)以及认知科学感兴趣。

前面提到的Yixuan Li大概率是她的学生,因为二人多次合发论文。



Yanchao Yang,香港大学助理教授,由电气与计算机工程系和数据科学研究所联合聘任。

本科毕业于中国科学技术大学,后获得沙特阿卜杜拉国王科技大学硕士学位,随后辗转至加州大学洛杉矶分校读博,并且曾在斯坦福大学做博士后研究。

他对具身智能感兴趣,致力于开发适用于低标注场景的自监督/半监督学习技术,以推动具身智能体的自主进化。



Siyuan Huang,北京通用人工智能研究院研究员,并担任该研究院具身人工智能与机器人研究中心主任。

本科毕业于清华大学自动化系,曾获得加州大学洛杉矶分校统计学博士学位,在读博期间还去了DeepMind和 Facebook Reality Lab实习。

目前他还在北京大学任教,对计算机视觉、机器学习等感兴趣,致力于开发通用机器人的泛化模型。



其余两位作者分别为Yutang Lin和Pei Zhou。

Yutang Lin,目前是北京大学元培学院大三学生,同时在北京通用人工智能研究院实习。

其研究兴趣集中在机器人技术、 计算机视觉和强化学习的交叉领域。



Pei Zhou,目前是香港大学电机及电子工程系博士生。和另一位同校同专业的朋友一样,网上资料也相对较少。

对于这项新研究,由于抛弃了目前常见的一些人机交互方式,人们预测它可能带来新的范式转变。



你看呢?

论文:
https://www.arxiv.org/abs/2510.14293
项目主页:
https://yushi-du.github.io/COLA/


https://x.com/siyuanhuang95/status/1980517755163185642

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江苏南京一模特太漂亮 身高177cm体重55kg五官精致到无懈可击

江苏南京一模特太漂亮 身高177cm体重55kg五官精致到无懈可击

陈意小可爱
2026-01-10 01:19:36
彭清华会见伊朗确定国家利益委员会考察团

彭清华会见伊朗确定国家利益委员会考察团

新华社
2026-01-09 20:27:05
切尔西最 “冤” 主帅!博阿斯 9 个月被炒,10 笔引援却封神!

切尔西最 “冤” 主帅!博阿斯 9 个月被炒,10 笔引援却封神!

澜归序
2026-01-11 03:06:51
演都不演了,徐帆回应离婚5个月后,冯小刚的小心思藏不住了

演都不演了,徐帆回应离婚5个月后,冯小刚的小心思藏不住了

卷史
2026-01-10 06:07:44
省长现场追问:之前反映的问题,解决了没?

省长现场追问:之前反映的问题,解决了没?

新京报政事儿
2026-01-10 13:15:45
那个转岗女保安的副教授,开始反击了

那个转岗女保安的副教授,开始反击了

大张的自留地
2026-01-09 17:21:09
重庆包工头李明春去世,年仅49岁,确诊前还在酒桌,经常不醉不休

重庆包工头李明春去世,年仅49岁,确诊前还在酒桌,经常不醉不休

天天热点见闻
2026-01-10 09:29:06
朝鲜发射高超音速导弹,金正恩就差明说了,决不能重蹈马杜罗覆辙

朝鲜发射高超音速导弹,金正恩就差明说了,决不能重蹈马杜罗覆辙

第一军情
2026-01-09 11:50:03
乱了套!捷克政府大楼突挂黑旗,随后乌国旗全撤!真相太冰冷!

乱了套!捷克政府大楼突挂黑旗,随后乌国旗全撤!真相太冰冷!

兴史兴谈
2026-01-10 03:38:33
伊朗巨变前夜

伊朗巨变前夜

凤眼论
2026-01-08 10:31:08
为何急着离开老鹰?特雷杨直言有两个原因,很多球迷听后表示理解

为何急着离开老鹰?特雷杨直言有两个原因,很多球迷听后表示理解

移动挡拆
2026-01-11 03:18:31
震撼!足总杯45万掀翻2.3亿 第6级别黑马球迷冲场狂欢+举起2功臣

震撼!足总杯45万掀翻2.3亿 第6级别黑马球迷冲场狂欢+举起2功臣

我爱英超
2026-01-10 22:41:08
上海多区陆续发布:致全体居民的一封信

上海多区陆续发布:致全体居民的一封信

上观新闻
2026-01-10 12:14:07
中国有源相控阵雷达真实水平:并非世界第一,和美差距有多大

中国有源相控阵雷达真实水平:并非世界第一,和美差距有多大

黑翼天使
2026-01-10 03:28:16
无语!男子地铁上猥亵女孩,被抓后辩称“女孩身形很像妻子年轻时”……公共场所女性该如何保护自己

无语!男子地铁上猥亵女孩,被抓后辩称“女孩身形很像妻子年轻时”……公共场所女性该如何保护自己

扬子晚报
2026-01-10 22:00:31
官媒发文,揭开王思聪与秦岚真实关系,原来汪小菲一个字都没说错

官媒发文,揭开王思聪与秦岚真实关系,原来汪小菲一个字都没说错

郭蛹包工头
2026-01-08 18:19:09
广湛高铁遇冷真相!500万高信化人沉默,3大硬伤戳中出行痛点

广湛高铁遇冷真相!500万高信化人沉默,3大硬伤戳中出行痛点

匹夫来搞笑
2026-01-10 13:31:59
洗碗机砸家后续:丈夫降薪,妻子爱美,每月多次海底捞,朋友发声

洗碗机砸家后续:丈夫降薪,妻子爱美,每月多次海底捞,朋友发声

李健政观察
2026-01-09 17:44:57
谢贤前女友大曝恋爱私隐!三年不碰她,却每天给她做“四哥菜芯”

谢贤前女友大曝恋爱私隐!三年不碰她,却每天给她做“四哥菜芯”

阿纂看事
2026-01-09 10:19:00
最高9.8分,美剧史上的入门级Top.10,建议收藏

最高9.8分,美剧史上的入门级Top.10,建议收藏

来看美剧
2026-01-04 20:33:49
2026-01-11 04:23:00
量子位 incentive-icons
量子位
追踪人工智能动态
11998文章数 176357关注度
往期回顾 全部

科技要闻

必看 | 2026开年最顶格的AI对话

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

家居
健康
教育
房产
军事航空

家居要闻

木色留白 演绎现代自由

这些新疗法,让化疗不再那么痛苦

教育要闻

表现不好,还不接受批评的学生,怎么教育比较合适?

房产要闻

66万方!4755套!三亚巨量房源正疯狂砸出!

军事要闻

海空英雄高翔逝世 曾驾驶歼-6打爆美军机

无障碍浏览 进入关怀版