网易首页 > 网易号 > 正文 申请入驻

从按图索骥到动态推理,研究人员提出人形机器人自主认知新方式

0
分享至

当前,人形机器人已逐渐应用于情感交互、工业自动化、服务行业和研究探索等诸多领域,但不可忽视的是,其控制系统仍然依赖预设的状态机和固定策略优化,缺乏类人的认知自主能力。

例如,美国波士顿动力公司的 Atlas 机器人、日本 PAL 机器人公司的 Talos 机器人、美国 Agility Robotics 公司的 Digit 机器人均采用基于模型预测控制和任务特定的强化学习,其在面对复杂场景变化时,仍需依赖于静态预先设定的策略,从而难以进行自主学习和动态实时决策。

这些技术支持机器人模仿人类执行重复性任务,但其感知与执行能力不足以弥补在思维、规划和决策等高级认知能力上的缺陷。尽管部分研究探索了多模态数据融合(视觉、听觉、触觉),但由于跨模态对齐技术的局限性,人形机器人在高动态环境下的语义理解和连贯推理仍存在挑战。

那么,是否可将机器人置于动态环境中,让它自主感知不同的物体和信息,并做出合理的预处理和决策呢?这是一个巨大的挑战,也是当前机器人研究的重点方向。

为解决该问题,就读于马来西亚思特雅大学(UCSI University)的博士研究生王立博在发表于预印本网站arXiv的《多场景推理:解锁人形机器人在多模态理解中的认知自主性》(Multi-Scenario Reasoning:Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding)的论文中,提出多场景推理(MSR,Multi-Scenario Reasoning)控制系统的框架 [1]。

MSR 旨在实现高效的跨模态感知,利用稀疏注意力过滤与记忆增强推理机制,使机器人能够在多变环境中,进行高精度信息提取与推理,避免现有系统因静态预训练数据而产生的响应不连贯问题。

为提升仿人机器人在不确定环境中的自主适应能力,该研究以情境认知理论为基础,模拟人类大脑在复杂环境下的跨模态语义整合、情境分析和动态决策能力。

不同于传统依赖静态预训练模型或单一模态数据的认知架构,MSR 通过注意力的优先级(Attention-Based Prioritization)、记忆增强推理(Memory-Augmented Reasoning)和行动决策建模(Action-Decision Modeling)等关键模块,实现机器人在视觉、听觉和触觉数据融合上的高效性,以解决当前跨模态理解的瓶颈问题。

同时,作者发展了 Sim2Real 通过结合场景表征和情境信息、注意力、记忆和反馈机制,来优化人形机器人适应在不同场景的动态自适应能力。

人脑具有短期记忆和长期记忆,目前多数研究表明机器人已逐步具备短期记忆能力,但它在长期记忆方面的能力仍然有待提升。当前多数机器人仍依赖工程师预设的指令,缺乏自主性和灵活性,其任务执行效果往往受限于静态预设程序。

为了突破这一局限,需要开发一种能够根据环境动态生成变形指令的控制系统。这样的系统需要具备强大的感知能力,能够综合分析环境因素并做出合理的决策。

该研究在多场景理解、机器人的认知系统设计和自适应力开发等方向具有应用前景。

第一,多场景理解:从长思维链到动态思维链。

静态环境下任务可预设定,但在动态环境下机器人需要自主感知和推理,这种推理能力至关重要。

借鉴长思维链(Long Chain-of-Thought)方法虽可行,但由于静态的预设定同样可能造成产生冗余计算和资源耗费。相比之下,该研究中的动态思维(Dynamic Chain-of-Thought)通过自适应推理触发机制,结合自适应剪枝原理,能够识别关键语义,仅在必要情况下延展推理链,以优化计算资源。

例如,“微波炉禁用铁器”这类具有明确因果关系的知识无需推理,可直接根据常识生成答案。动态思维链展示出针对 token 的重要性进行剪枝(pruning),本质上就是筛选最关键的语义,从而决定是否推理以及步骤长度。

对于显著减少人形机器人控制系统计算资源的消耗和实现精准场景识别来说,筛选是推理路径的关键环节。

第二,认知系统设计:模拟人脑动态决策。

基于认知科学理论,该研究构建了“感知-推理-决策-执行”的完整控制链路。通过多模态信息融合解析环境数据,利用自适应推理模块动态调整决策流程,并最终通过“信号-动作映射”将推理结果转化为控制指令,以实现模拟人脑的自主决策。

第三,自适应力开发:从物理调参到动态迁移。

传统方法通过调整物理数据获取方式,但这种方式较为低效。目前,控制系统需要一种让机器人摆脱静态训练的局限,突破在模拟-现实域迁移方面的策略泛化不足的技术瓶颈。针对自适应域随机化依赖静态预训练导致机器人在复杂任务中的推理与决策能力受限的问题,这项研究提出了目标域优化。

该框架通过因果推理和策略自适应调整优化机器人在模拟-现实迁移(Sim-to-Real Transfer)中的策略泛化能力,提高其在高动态环境下的执行稳定性。

通过传感解析、因果推理、策略自适应和跨域泛化优化机器人,在现实环境的适应性。传感感知系统采用稀疏注意力和特征金字塔提取分层解析多模态数据,来提高环境理解。

动态因果推理通过预测误差监控和因果推理引擎调整状态-行为映射,优化实时决策。自适应策略优化结合策略调整引擎与上下文参数调优,动态调整策略。相比自适应域随机化,目标域优化在因果推理和跨场景适应,对于复杂环境中的泛化能力方面更具显著效果。

同时,该研究中所提出机器人的发展不应仅是为了替代人类从事低端工作,而应更多地聚焦于那些对人类来说危险或难以完成的任务。“我们需要确保机器人的开发能够为社会生产带来积极影响,而非从事减少人类就业资源的行为。”王立博说。

例如,在高空建筑施工中,机器人凭借精准判断和动态环境适应能力,能更安全高效地完成任务;在医疗领域,机器人手术精确度高于人类医生,尤其在精细操作和高度稳定性手术中优势明显;在地震废墟、深海或太空等极端环境中,勘探机器人和救援机器人可在那些人类难以到达或存在安全风险的环境中工作。这些应用场景表明,机器人可承担更多人类难以完成或危险的工作,让人类生活更安全便捷。

据介绍,王立博接下来的设计是致力于构建与 Transformer 原理不同的新型架构“Defierithos”。特别是通过“自共振场”技术的开发替代,它不同于 Transformer 的自注意力机制依赖于计算每一个 token 对其他所有 token 的关系。这使得新架构一定程度上避免了计算复杂度和内存消耗呈二次增长,尤其在处理长序列时有效捕捉远距离的依赖。

此外,他还模拟人类超级大脑运行的原理,尝试采用自共振场通过子频带分解(Subband Decomposition)与波干涉(Wave Interference)的方式,将信息以波形的形式持续流动、进行迭代干涉、减少必要的计算量,并通过动态调整局部波干涉精确模拟复杂的长程依赖。

相比于 Transformer 需要依赖昂贵的全连接矩阵运算,自共振场不仅降低计算成本,而且能以稀疏并行的方式,处理更加复杂且不容易被 Transformer 捕捉的微妙特征。王立博希望,能够突破 Transformer 变体无法从根本上避免的内存消耗与长序列建模的瓶颈。

参考资料:

1.https://doi.org/10.48550/arXiv.2412.20429

2.https://www.techrxiv.org/users/877969/articles/1275276-defierithos-the-lonely-warrior-rises-from-resonance

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
钉在耻辱柱上!国家文物局出手,这三个跳梁小丑,真的彻底凉凉了

钉在耻辱柱上!国家文物局出手,这三个跳梁小丑,真的彻底凉凉了

户外阿崭
2025-12-28 17:07:24
女卡车司机“半挂西施”去世后,网友分析网名,4个字竟字字应验

女卡车司机“半挂西施”去世后,网友分析网名,4个字竟字字应验

千言娱乐记
2025-12-28 20:02:42
苦等5年,蒙古熟鸭子还是飞了,中俄谁也不让步,坐视大项目泡汤

苦等5年,蒙古熟鸭子还是飞了,中俄谁也不让步,坐视大项目泡汤

科普100克克
2025-12-07 18:20:34
美国国务院发火,要求中国大陆“必须停止”,岛内一个时代或终结

美国国务院发火,要求中国大陆“必须停止”,岛内一个时代或终结

三石记
2025-12-27 15:03:24
米兰20天首胜!暂登顶意甲,10战维罗纳全胜,连刷4大纪录

米兰20天首胜!暂登顶意甲,10战维罗纳全胜,连刷4大纪录

奥拜尔
2025-12-28 21:33:44
杭州姑娘“兔子警官”主动回应“哄孩子式执法”:“他们需要外力推一下……”

杭州姑娘“兔子警官”主动回应“哄孩子式执法”:“他们需要外力推一下……”

都市快报橙柿互动
2025-12-28 14:07:18
保定大量商户突然关闭,整个街道冷冷清清

保定大量商户突然关闭,整个街道冷冷清清

映射生活的身影
2025-12-27 18:09:05
统治澳洲!韩旭26分钟12中9高效22+5 加盟6战全胜狂胜138分

统治澳洲!韩旭26分钟12中9高效22+5 加盟6战全胜狂胜138分

醉卧浮生
2025-12-28 18:09:56
瓜子二手车发布榜单,保值排名出乎意料

瓜子二手车发布榜单,保值排名出乎意料

ZAKER新闻
2025-12-26 15:23:34
1960年春节,周总理请溥仪吃饭,酒桌上溥仪讲了个慈禧的“笑话”,总理听完,当场陷入了沉思

1960年春节,周总理请溥仪吃饭,酒桌上溥仪讲了个慈禧的“笑话”,总理听完,当场陷入了沉思

历史回忆室
2025-12-24 10:29:12
香港男子命丧天水围桥底,嫌疑人在深圳湾口岸落网!押回现场

香港男子命丧天水围桥底,嫌疑人在深圳湾口岸落网!押回现场

南方都市报
2025-12-28 12:18:04
直击:日本发生重大交通事故,67辆车连环撞,幸存者颤抖回忆惨烈现场……

直击:日本发生重大交通事故,67辆车连环撞,幸存者颤抖回忆惨烈现场……

日本物语
2025-12-27 20:32:22
闪评丨泽连斯基访美之际 普京再就俄乌冲突局势表态

闪评丨泽连斯基访美之际 普京再就俄乌冲突局势表态

国际在线
2025-12-28 15:07:02
畸形儿风波反转!医院回应透露2个关键信息 阚清子的沉默早有预兆

畸形儿风波反转!医院回应透露2个关键信息 阚清子的沉默早有预兆

观察鉴娱
2025-12-28 10:26:06
201米!40亿!腾讯西南总部,世界“第一扭”摩天楼

201米!40亿!腾讯西南总部,世界“第一扭”摩天楼

GA环球建筑
2025-12-25 23:00:32
羽球天王杯:铜牌诞生!世界第8复仇乔纳坦,石宇奇首局7-11落后

羽球天王杯:铜牌诞生!世界第8复仇乔纳坦,石宇奇首局7-11落后

刘姚尧的文字城堡
2025-12-28 20:01:00
61岁奥巴马夫人暴瘦后“逆生长”,与前总统丈夫合照笑开了花

61岁奥巴马夫人暴瘦后“逆生长”,与前总统丈夫合照笑开了花

艳儿说电影
2025-12-27 21:11:14
甚至来不及准备,湘超冠军永州队巡游花车为临时切割公交车改造而成

甚至来不及准备,湘超冠军永州队巡游花车为临时切割公交车改造而成

懂球帝
2025-12-28 16:35:07
广东一小伙,因入住毛坯房而走红,花费仅1万,却无一丝穷酸气!

广东一小伙,因入住毛坯房而走红,花费仅1万,却无一丝穷酸气!

阿离家居
2025-12-28 10:19:49
冲上热搜!黄子韬因脑淤血接受开颅手术缝了43针,本人回应

冲上热搜!黄子韬因脑淤血接受开颅手术缝了43针,本人回应

半岛晨报
2025-12-28 18:04:45
2025-12-28 21:52:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16048文章数 514441关注度
往期回顾 全部

科技要闻

特斯拉将在华布局自动驾驶?记者求证→

头条要闻

新华社发文:积蓄统一大势

头条要闻

新华社发文:积蓄统一大势

体育要闻

83分钟绝杀!曼城2-1年度收官:英超6连胜狂飙

娱乐要闻

白敬亭现身冰雪大世界 拍视频还翻车了

财经要闻

英伟达的收购史

汽车要闻

理想的2026:L9不容有失,i9再战纯电?

态度原创

旅游
游戏
本地
手机
公开课

旅游要闻

各地持续推动冰雪旅游释放新活力

醉酒兔女郎护送回家!重磅更新可偷看裙底?

本地新闻

云游安徽|踏访池州,读懂山水间的万年史书

手机要闻

1486.41万台!iPhone17系列中国市场销量刷新纪录,力压国产机!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版