网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

机器人训练，北京男大有了技能玩法

2025-11-08 12:46:56　来源: 量子位

北京举报

0

分享至

一水发自凹非寺
量子位 | 公众号 QbitAI

还得是大学生会玩啊（doge）！

网上正高速冲浪中，结果意外发现：有男大竟找了个机器人队友？而且机器人还相当黏人（bushi~

白天超市打工它要跟着，一看东西装好就立马乐颠颠帮忙拉小推车，上楼下楼忙个不停：

等到中午去食堂兼职，它也自告奋勇帮忙推餐车，而且指哪打哪（拍拍头就知道你想让它停下）：

甚至，一天劳作结束后，连健身它也要一起。既然来都来了，男大表示：那就练起来！

笑死，感觉可以以机器人视角去拍vlog了，标题就叫《高能量之机器人的一天》。

言归正传，不知道大家发现没有，图中男大和机器人伙伴的交流都是通过拍拍头、拉拉身体搞定的，既没有遥控、也没有语音

这就有点东西了！要知道目前绝大多数机器人都是靠外部传感器（摄像头、激光雷达等）和遥控驱动的，而这群男大竟提出了一种全新的方式——仅通过“本体感知（Proprioception）”就能和外界交互。

好好好，搞半天人家这还是个技术含量很高的正经研究，而且连论文都有。

速去扒了一扒，结果发现里面还真有不少好东西、新东西——

强化学习新方法：仅依赖本体感知搬运各种物体

先说说他们想解决什么问题吧。

在“人机协作搬东西”这一核心场景中，相关技术已在机械臂上验证充分，但在人形机器人领域仍探索不足。

这主要是因为人形机器人复杂的“全身动力学” ——相比机械臂仅需控制局部关节，人形机器人需要协调躯干、四肢等多个部位，且运动过程极易受自身平衡、环境接触等多因素影响。

于是，他们设定了一个大胆的目标：实现人形机器人与人类完美协作搬运各种东西

为此，他们在论文中提出了一种全新的强化学习方法COLA——不依赖摄像头、激光雷达等外部传感器，机器人仅通过“本体感知（Proprioception）”就能和外界进行交互

具体而言，COLA的设计思路可以拆解为以下3点：

让机器人学会“眼里有活儿”

第一点就是教会机器人如何“眼里有活”。

想象你正在和机器人一起搬柜子。传统机器人往往比较呆板——需要分别设计“机器人主导（领导者）” 和“人类主导（跟随者）” 两种独立策略，切换时容易卡顿。

而COLA将这两种情况整合到一个统一策略中：

当你发力稳定、方向明确时，机器人就化身“跟随者”，配合你的动作。
当你犹豫或柜子有倾斜风险时，它会立刻切换成“主导者”，主动调整动作稳住平衡。

无需任何人工干预或额外指令，机器人自己就能实现两种角色的丝滑切换。

不信你瞅，它现在搬东西上斜坡也不在话下：

在动态实战中训练

此外，为了让COLA能应对真实世界的混乱，它的训练场是一个高度动态的闭环环境

一方面，为避免模型仅在固定轨迹搬运中有效，他们在训练时模拟了各种突发状况，例如人类突然转向、物体重量分布变化、手部打滑……主打一个实战演练。

另一方面，训练过程中会逐渐形成一个闭环——机器人的动作会实时反馈给环境（如物体位置变化），环境变化又反过来影响机器人的决策（如物体倾斜后机器人需调整力度），形成“决策-反馈-再决策”的循环，就像真实搬运中持续的“你拉我推”。

点击就看人机反复推拉之术（手动狗头）：

仅依赖 “本体感知”，无需外部传感器

“岗前培训”结束后，接下来真进入实战环节了。

前面也反复提到，COLA的关键优势之一是“不依赖外部传感器”，仅通过机器人的“本体感知”就能接收获取信息。

所谓“本体感受”是指机器人自身的内置感知数据，比如关节角度、肌肉执行器的力度反馈、自身的位置/速度信息等。采用这种设计，机器人这下不仅能免受外部环境干扰（如光线昏暗影响摄像头），而且交互方式也大变样了。

很直观的一点就是，一直以来广受吐槽的遥控这下真没了。

搬箱子一人一机就能搞定：

之所以能抛弃传感器，这主要得益于关键两步：

残差教师微调：先让机器人学会稳定的运动策略，然后引入一个残差教师模型，专门学习在搬运协作中需要做出的额外调整（如何打配合），最终将两者结合微调出一个完整的协作策略；
仿真训练与知识蒸馏：上述过程全部在仿真环境中完成，可以快速、安全地模拟数百万次训练。训练出强大的“教师”后，再通过知识蒸馏技术，将其能力迁移到一个更轻便、更适合在实体机器人上运行的“学生策略”中。

正是这个精巧的设计，让它彻底告别了传感器。因为在整个过程中，无论是基础的运动能力，还是高级的协作技巧，模型学习和决策的全部依据，都来自于机器人的本体感知数据。

而且值得一提的是，这种设计也降低了硬件成本和系统复杂度，毕竟现在无需耗费时间金钱在外部传感器的采购和软硬件集成上了。

整体而言，COLA的终极目标不是去“猜”人类具体在想什么，而是通过本体感知数据“隐式预测（Implicitly Predict）”两个关键信息：

物体的运动趋势（会不会翻？要往哪倒？）
人类的协作意图（他想转弯吗？需要我多出力吗？）

最终，以“维持负载平衡”为核心指标，整个过程通过协调的轨迹规划来实现安全、顺滑的人机协作。

仿真/真实世界/人类用户实验，均验证了COLA的有效性

更多实验也验证了COLA设计的有效性。

在仿真实验中，通过可控虚拟环境，他们想精确测量COLA对人类effort（指用力大小、肌肉疲劳度）和物体稳定性的影响。

结果发现，不管是运动的精准度（线速度、角速度、高度误差），还是减轻人类搬运时的负担（平均外力），COLA系列都比之前的显式目标估计、Transformer方法强很多。

而且其中以“领导者”思路设计的COLA-L比“跟随者”COLA-F表现更突出，能更好地帮人类分担负载、保持稳定。

在真实世界中，面向不同类型物体（如规则形状的箱子、柔性物体担架等）和不同运动模式（如直线走、转弯等），他们还测试了COLA的泛化性。

结果发现，COLA在所有测试场景中均实现了“稳健的协作搬运”，相关定量结果如下：

除此之外，他们还找来了23名人类参与者，让他们分别体验与“COLA控制的机器人”和“其他基线方法控制的机器人”进行协作，然后通过问卷和动作传感器来收集主客观感受。

结果显示，COLA方法在参与者的评估中表现最好，无论是在高度跟踪还是平滑性方面都拿到了最高分。

“人机协作新范式”中国团队造

最后再来看看COLA背后的团队，成员清一色来自国内。

三位同等贡献作者均来自北京通用人工智能研究院：

Yushi Du，目前是香港大学电机及电子工程系刚入学新生，由于个人相对低调所以网上资料很少。

Yixuan Li，北京理工大学计算机科学与技术学院博士生。

从已发表的论文来看，他对人形机器人、3D场景理解与导航、以及人机协作等领域感兴趣。

Baoxiong Jia（兼通讯作者），北京通用人工智能研究院研究科学家。

本科毕业于北京大学，后获得加州大学洛杉矶分校硕博学位，对计算机视觉、AI和认知科学的交叉领域尤为感兴趣。

光是今年他就有多篇论文入选顶会，最新一篇关于统一力与位置控制的新论文就被CoRL 2025接收，并获得口头报告的机会（Oral）。

其他通讯作者分别为Wei Liang、Yanchao Yang和Siyuan Huang。

Wei Liang（梁玮），北理计算机科学与技术学院教授，负责领导感知、交互与具身化实验室（PIE Lab）。

她于2005年获得北理计算机科学博士学位，对计算机视觉、用于培训和教育的虚拟现实（VR）以及认知科学感兴趣。

前面提到的Yixuan Li大概率是她的学生，因为二人多次合发论文。

Yanchao Yang，香港大学助理教授，由电气与计算机工程系和数据科学研究所联合聘任。

本科毕业于中国科学技术大学，后获得沙特阿卜杜拉国王科技大学硕士学位，随后辗转至加州大学洛杉矶分校读博，并且曾在斯坦福大学做博士后研究。

他对具身智能感兴趣，致力于开发适用于低标注场景的自监督/半监督学习技术，以推动具身智能体的自主进化。

Siyuan Huang，北京通用人工智能研究院研究员，并担任该研究院具身人工智能与机器人研究中心主任。

本科毕业于清华大学自动化系，曾获得加州大学洛杉矶分校统计学博士学位，在读博期间还去了DeepMind和 Facebook Reality Lab实习。

目前他还在北京大学任教，对计算机视觉、机器学习等感兴趣，致力于开发通用机器人的泛化模型。

其余两位作者分别为Yutang Lin和Pei Zhou。

Yutang Lin，目前是北京大学元培学院大三学生，同时在北京通用人工智能研究院实习。

其研究兴趣集中在机器人技术、计算机视觉和强化学习的交叉领域。

Pei Zhou，目前是香港大学电机及电子工程系博士生。和另一位同校同专业的朋友一样，网上资料也相对较少。

对于这项新研究，由于抛弃了目前常见的一些人机交互方式，人们预测它可能带来新的范式转变。

你看呢？

论文：
https://www.arxiv.org/abs/2510.14293
项目主页：
https://yushi-du.github.io/COLA/

https://x.com/siyuanhuang95/status/1980517755163185642

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

“杭州六小龙”聚首乌镇对话接棒互联网大厂成新主角

财联社 2025-11-08 12:06:06
0 跟贴 0
40秒看2025年中国人形机器人高能进化

每日经济新闻 2025-11-08 07:37:26
59 跟贴 59

AI六巨头首次同台！纵论四十年AI风云、泡沫之辩与AGI时间表

DeepTech深科技 2025-11-07 18:28:54
7 跟贴 7

「不仅会想，还能准确去做」VLA-R1把「推理+行动」带进真实世界

机器之心Pro 2025-10-27 19:12:41
0 跟贴 0
「只参与，不参赛」奖牌数却仅次于宇树，这个幕后玩家如何做到的

机器之心Pro 2025-08-25 10:56:03
0 跟贴 0

波士顿机器狗练成“轻功”！连续七个后空翻

量子位 2025-09-07 01:03:18
9 跟贴 9

小鹏新一代人形机器人IRON亮相，完成猫步展示

每日经济新闻 2025-11-06 07:09:17
4 跟贴 4
机器人里藏真人？何小鹏回应

财联社 2025-11-07 07:27:18
0 跟贴 0

机器人管家Figure 03来了，承包一切家务！

量子位 2025-10-11 10:13:00
21 跟贴 21
人形机器人产业突破关键在于“大脑”核心技术

每日经济新闻 2025-09-16 20:30:32
0 跟贴 0
直击WAIC丨当人形机器人走入康养场景，如何满足人类多样需求？

每日经济新闻 2025-07-26 19:09:29
0 跟贴 0
机器狗被锯腿也能继续走，Skild Brain估值45亿美元

量子位 2025-09-27 17:49:32
0 跟贴 0
让机器人「不只是走路」，Nav-R1引领带推理的导航新时代

机器之心Pro 2025-09-18 11:55:45
0 跟贴 0
五八智能四足机器人平台Q20A 不止跑跳整活还能维护公共安全

量子位 2025-09-30 10:01:00
0 跟贴 0
五八智能四足机器人平台Q20A，适用于千行百业

量子位 2025-09-30 15:35:41
0 跟贴 0
史上首次！机器人当上全运会火炬手，稳稳完成火炬传递！

量子位 2025-11-08 07:47:22
0 跟贴 0
特斯拉官宣！第三代人形机器人生产线将于2026年建成投产

每日经济新闻 2025-11-07 13:58:19
1 跟贴 1
机器人叠衣，灵巧手抓万物，超实用机器人组合来了

量子位 2025-07-29 03:31:41
0 跟贴 0
李飞飞发起机器人家务挑战赛，老黄第一时间批钱赞助

量子位 2025-10-13 09:30:54
0 跟贴 0
机器人终于有自己的真机评测大考了

量子位 2025-10-15 20:05:44
0 跟贴 0
机器人当上火炬手了，机器狗传递全运会吉祥物

每日经济新闻 2025-11-03 06:56:14
0 跟贴 0
ICCV涌现自动驾驶新范式：统一世界模型VLA，用训练闭环迈向L4

量子位 2025-11-08 12:32:59
0 跟贴 0
采用全固态电池小鹏新一代机器人亮相

财联社 2025-11-07 07:27:19
0 跟贴 0
机器人首次踢5v5足球赛，摔跤是战术？我们和参赛队员聊了聊

量子位 2025-08-21 10:48:04
0 跟贴 0
机器人在运动会集体斗舞

财联社 2025-08-19 04:03:13
0 跟贴 0
AI六巨头罕见同台！李飞飞激辩LeCun，黄仁勋：你们都错了

新智元 2025-11-08 19:10:18
1 跟贴 1
研究人员提出并行时序编码器架构，提升人形机器人训练的稳定性

DeepTech深科技 2025-08-20 18:04:04
0 跟贴 0
荣耀CEO李健：明年将推出机器人手机

每日经济新闻 2025-11-08 13:30:21
1 跟贴 1
大模型也会赌博上瘾！理智出走！

量子位 2025-11-03 07:06:08
0 跟贴 0
格斗冠军机器人突然发疯！吓呆研究人员

量子位 2025-07-25 09:10:58
0 跟贴 0
ChatGPT智能体来了：自己操作电脑干活，接管你的电脑，自动执行各种任务

量子位 2025-07-18 18:08:35
0 跟贴 0
湖南将开发一批通用型人工智能教学工具

芥末堆看教育 2025-11-08 13:49:55
0 跟贴 0
AI重塑人机交互方式，下一代终端如何变革？

量子位 2025-09-24 20:17:01
0 跟贴 0
具身智能狂飙，安全却严重滞后？首个安全可信EAI框架与路线图！

机器之心Pro 2025-09-17 10:53:27
0 跟贴 0
李飞飞一年前究竟说了啥？怎么又火了

量子位 2025-09-11 14:27:04
0 跟贴 0
激光雷达降价，催生低速无人车开进景区

每日经济新闻 2025-10-19 07:44:27
0 跟贴 0
终结Transformer统治！清华姚班校友出手，剑指AI「灾难性遗忘」

新智元 2025-11-08 17:13:46
1 跟贴 1
从被群嘲到顶级玩家，阿里AI逆袭之路

华商韬略 2025-07-28 17:27:23
0 跟贴 0
学术圈最强AI工具：6.9亿专业文献，“搜读创编”全程辅助

量子位 2025-09-11 18:42:26
0 跟贴 0
机器狗跳千手观音，波士顿动力达人秀炸场

量子位 2025-06-13 15:55:52
0 跟贴 0

哺乳期的我刚回公司上班，就被领导儿子提这种要求，我该怎么办？

哺乳期的我刚回公司上班，就被领导儿子提这种要求，我该怎么办？

亲爱的落落

2024-10-18 11:47:50

郑州最新限行规定公布！新能源/外地车限行吗？详细时间及范围→

郑州最新限行规定公布！新能源/外地车限行吗？详细时间及范围→

白浅娱乐聊

2025-11-08 12:17:49

不到24小时，人民日报四次点名全红婵，陈若琳的话终于有人信了

不到24小时，人民日报四次点名全红婵，陈若琳的话终于有人信了

枫尘余往逝

2025-11-05 21:01:12

杭州市监部门：对淘宝“霸屏广告”展开调查

杭州市监部门：对淘宝“霸屏广告”展开调查

潇湘晨报

2025-11-08 10:19:14

游资章建平（章盟主）：从5万到百亿，冷门赛道的突击高手

游资章建平（章盟主）：从5万到百亿，冷门赛道的突击高手

复利种韭菜

2025-11-01 19:04:09

61年造币厂职工偷走800两黄金，19年后兑换，银行一眼识破

61年造币厂职工偷走800两黄金，19年后兑换，银行一眼识破

兴趣知识

2025-11-06 03:15:03

3名学生，火灾中不幸身亡

蓬勃新闻

2025-11-08 11:22:21

98年他花5万买下上海弄堂破阁楼,邻居都笑他痴,20年后全都闭嘴了

98年他花5万买下上海弄堂破阁楼,邻居都笑他痴,20年后全都闭嘴了

温情邮局

2025-10-21 11:41:22

血管悄悄硬化、堵塞？不用去医院！在家2招自查，早发现早救命

血管悄悄硬化、堵塞？不用去医院！在家2招自查，早发现早救命

孟大夫之家1

2025-10-29 20:18:06

被嘲“脓包”后，郑丽文任命新大将，向大陆摊牌，蔡正元表态亮了

被嘲“脓包”后，郑丽文任命新大将，向大陆摊牌，蔡正元表态亮了

知鉴明史

2025-11-07 17:58:09

欧洲这次允许台湾“副总统”到欧洲造势，硬生生的撞在我们枪口上

欧洲这次允许台湾“副总统”到欧洲造势，硬生生的撞在我们枪口上

我心纵横天地间

2025-11-08 19:45:32

副院长与眼科主任，两个月前办公室的一次关系！

副院长与眼科主任，两个月前办公室的一次关系！

闲侃闲侃

2025-11-07 08:25:25

这一次当众落泪的陈芋汐，给全红婵提了个醒，原来周继红说的没错

这一次当众落泪的陈芋汐，给全红婵提了个醒，原来周继红说的没错

小鬼头体育

2025-11-08 01:47:10

封海58个小时，福建舰终于参军，美方猜测全错，中国还有更强航母

封海58个小时，福建舰终于参军，美方猜测全错，中国还有更强航母

通文知史

2025-11-08 20:50:03

你这辈子听过最诛心的话是啥？网友：老公的爸爸，要我去找好人家

你这辈子听过最诛心的话是啥？网友：老公的爸爸，要我去找好人家

带你感受人间冷暖

2025-11-05 00:20:06

母亲给宝宝喂安眠药后去上班，妇联：确属经济困难，公安等部门已介入，宝宝身体无大碍

母亲给宝宝喂安眠药后去上班，妇联：确属经济困难，公安等部门已介入，宝宝身体无大碍

鲁中晨报

2025-11-06 14:19:13

未能带队保级，前田浩二：我要向球迷和俱乐部说声对不起

未能带队保级，前田浩二：我要向球迷和俱乐部说声对不起

懂球帝

2025-11-08 21:42:04

定居泰国、高调炫富，43岁的张默再也没人能管住，连张国立也没辙

定居泰国、高调炫富，43岁的张默再也没人能管住，连张国立也没辙

墨印斋

2025-10-13 10:46:13

特朗普：只要我在任，无人敢收台，话音刚落，中方划下4条红线

特朗普：只要我在任，无人敢收台，话音刚落，中方划下4条红线

时时有聊

2025-11-07 09:15:43

日本人硬是将喝水的玻璃杯，卖出了钻石的价格！

日本人硬是将喝水的玻璃杯，卖出了钻石的价格！

日本窗

2025-11-07 16:23:14

追踪人工智能动态

11646文章数 176329关注度

往期回顾全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

豁免到手欧尔班：谢谢您总统先生

头条要闻

豁免到手欧尔班：谢谢您总统先生

体育要闻

马刺绞赢火箭，不靠文班亚马？

娱乐要闻

古二再度放料！秦雯王家卫吐槽出现新人物

财经要闻

小马、文远回港上市但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线：28.85 万元

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

时尚

亲子

家居

军事航空

房产要闻

封关倒计时！三亚主城 2.3 万 /㎡+ 即买即住，手慢无！

她不靠穿搭谋生，却因穿搭走红，在穿衣上找到主体性是什么体验？

亲子要闻

韩网热帖：在身体最美丽、最健康的20多岁中期生养孩子是最好的！

家居要闻

现代自由功能美学居所

军事要闻

福建舰常驻地为三亚军港

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版