网易首页 > 网易号 > 正文 申请入驻

从按图索骥到动态推理,研究人员提出人形机器人自主认知新方式

0
分享至

当前,人形机器人已逐渐应用于情感交互、工业自动化、服务行业和研究探索等诸多领域,但不可忽视的是,其控制系统仍然依赖预设的状态机和固定策略优化,缺乏类人的认知自主能力。

例如,美国波士顿动力公司的 Atlas 机器人、日本 PAL 机器人公司的 Talos 机器人、美国 Agility Robotics 公司的 Digit 机器人均采用基于模型预测控制和任务特定的强化学习,其在面对复杂场景变化时,仍需依赖于静态预先设定的策略,从而难以进行自主学习和动态实时决策。

这些技术支持机器人模仿人类执行重复性任务,但其感知与执行能力不足以弥补在思维、规划和决策等高级认知能力上的缺陷。尽管部分研究探索了多模态数据融合(视觉、听觉、触觉),但由于跨模态对齐技术的局限性,人形机器人在高动态环境下的语义理解和连贯推理仍存在挑战。

那么,是否可将机器人置于动态环境中,让它自主感知不同的物体和信息,并做出合理的预处理和决策呢?这是一个巨大的挑战,也是当前机器人研究的重点方向。

为解决该问题,就读于马来西亚思特雅大学(UCSI University)的博士研究生王立博在发表于预印本网站arXiv的《多场景推理:解锁人形机器人在多模态理解中的认知自主性》(Multi-Scenario Reasoning:Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding)的论文中,提出多场景推理(MSR,Multi-Scenario Reasoning)控制系统的框架 [1]。

MSR 旨在实现高效的跨模态感知,利用稀疏注意力过滤与记忆增强推理机制,使机器人能够在多变环境中,进行高精度信息提取与推理,避免现有系统因静态预训练数据而产生的响应不连贯问题。

为提升仿人机器人在不确定环境中的自主适应能力,该研究以情境认知理论为基础,模拟人类大脑在复杂环境下的跨模态语义整合、情境分析和动态决策能力。

不同于传统依赖静态预训练模型或单一模态数据的认知架构,MSR 通过注意力的优先级(Attention-Based Prioritization)、记忆增强推理(Memory-Augmented Reasoning)和行动决策建模(Action-Decision Modeling)等关键模块,实现机器人在视觉、听觉和触觉数据融合上的高效性,以解决当前跨模态理解的瓶颈问题。

同时,作者发展了 Sim2Real 通过结合场景表征和情境信息、注意力、记忆和反馈机制,来优化人形机器人适应在不同场景的动态自适应能力。

人脑具有短期记忆和长期记忆,目前多数研究表明机器人已逐步具备短期记忆能力,但它在长期记忆方面的能力仍然有待提升。当前多数机器人仍依赖工程师预设的指令,缺乏自主性和灵活性,其任务执行效果往往受限于静态预设程序。

为了突破这一局限,需要开发一种能够根据环境动态生成变形指令的控制系统。这样的系统需要具备强大的感知能力,能够综合分析环境因素并做出合理的决策。

该研究在多场景理解、机器人的认知系统设计和自适应力开发等方向具有应用前景。

第一,多场景理解:从长思维链到动态思维链。

静态环境下任务可预设定,但在动态环境下机器人需要自主感知和推理,这种推理能力至关重要。

借鉴长思维链(Long Chain-of-Thought)方法虽可行,但由于静态的预设定同样可能造成产生冗余计算和资源耗费。相比之下,该研究中的动态思维(Dynamic Chain-of-Thought)通过自适应推理触发机制,结合自适应剪枝原理,能够识别关键语义,仅在必要情况下延展推理链,以优化计算资源。

例如,“微波炉禁用铁器”这类具有明确因果关系的知识无需推理,可直接根据常识生成答案。动态思维链展示出针对 token 的重要性进行剪枝(pruning),本质上就是筛选最关键的语义,从而决定是否推理以及步骤长度。

对于显著减少人形机器人控制系统计算资源的消耗和实现精准场景识别来说,筛选是推理路径的关键环节。

第二,认知系统设计:模拟人脑动态决策。

基于认知科学理论,该研究构建了“感知-推理-决策-执行”的完整控制链路。通过多模态信息融合解析环境数据,利用自适应推理模块动态调整决策流程,并最终通过“信号-动作映射”将推理结果转化为控制指令,以实现模拟人脑的自主决策。

第三,自适应力开发:从物理调参到动态迁移。

传统方法通过调整物理数据获取方式,但这种方式较为低效。目前,控制系统需要一种让机器人摆脱静态训练的局限,突破在模拟-现实域迁移方面的策略泛化不足的技术瓶颈。针对自适应域随机化依赖静态预训练导致机器人在复杂任务中的推理与决策能力受限的问题,这项研究提出了目标域优化。

该框架通过因果推理和策略自适应调整优化机器人在模拟-现实迁移(Sim-to-Real Transfer)中的策略泛化能力,提高其在高动态环境下的执行稳定性。

通过传感解析、因果推理、策略自适应和跨域泛化优化机器人,在现实环境的适应性。传感感知系统采用稀疏注意力和特征金字塔提取分层解析多模态数据,来提高环境理解。

动态因果推理通过预测误差监控和因果推理引擎调整状态-行为映射,优化实时决策。自适应策略优化结合策略调整引擎与上下文参数调优,动态调整策略。相比自适应域随机化,目标域优化在因果推理和跨场景适应,对于复杂环境中的泛化能力方面更具显著效果。

同时,该研究中所提出机器人的发展不应仅是为了替代人类从事低端工作,而应更多地聚焦于那些对人类来说危险或难以完成的任务。“我们需要确保机器人的开发能够为社会生产带来积极影响,而非从事减少人类就业资源的行为。”王立博说。

例如,在高空建筑施工中,机器人凭借精准判断和动态环境适应能力,能更安全高效地完成任务;在医疗领域,机器人手术精确度高于人类医生,尤其在精细操作和高度稳定性手术中优势明显;在地震废墟、深海或太空等极端环境中,勘探机器人和救援机器人可在那些人类难以到达或存在安全风险的环境中工作。这些应用场景表明,机器人可承担更多人类难以完成或危险的工作,让人类生活更安全便捷。

据介绍,王立博接下来的设计是致力于构建与 Transformer 原理不同的新型架构“Defierithos”。特别是通过“自共振场”技术的开发替代,它不同于 Transformer 的自注意力机制依赖于计算每一个 token 对其他所有 token 的关系。这使得新架构一定程度上避免了计算复杂度和内存消耗呈二次增长,尤其在处理长序列时有效捕捉远距离的依赖。

此外,他还模拟人类超级大脑运行的原理,尝试采用自共振场通过子频带分解(Subband Decomposition)与波干涉(Wave Interference)的方式,将信息以波形的形式持续流动、进行迭代干涉、减少必要的计算量,并通过动态调整局部波干涉精确模拟复杂的长程依赖。

相比于 Transformer 需要依赖昂贵的全连接矩阵运算,自共振场不仅降低计算成本,而且能以稀疏并行的方式,处理更加复杂且不容易被 Transformer 捕捉的微妙特征。王立博希望,能够突破 Transformer 变体无法从根本上避免的内存消耗与长序列建模的瓶颈。

参考资料:

1.https://doi.org/10.48550/arXiv.2412.20429

2.https://www.techrxiv.org/users/877969/articles/1275276-defierithos-the-lonely-warrior-rises-from-resonance

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女司机踏宝马引擎盖后续!真相曝光车主身份被扒,难怪女方暴怒

女司机踏宝马引擎盖后续!真相曝光车主身份被扒,难怪女方暴怒

阿纂看事
2026-03-26 16:20:25
全球货币支付排名:美元跌至49.25%,欧元涨到22.82%,人民币呢

全球货币支付排名:美元跌至49.25%,欧元涨到22.82%,人民币呢

张嘴说财经
2026-03-26 20:56:17
风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

乐天闲聊
2026-03-26 03:40:35
新加坡总统公开警告中国:要想世界和平,中国得放弃一样东西

新加坡总统公开警告中国:要想世界和平,中国得放弃一样东西

闻香阁
2026-03-25 22:28:31
你知道我在床上有多厉害吗?

你知道我在床上有多厉害吗?

果粉之家
2026-03-20 12:35:16
张晋去年4月突发心脏病险丧命 蔡少芬公开细节:血管堵塞近80%

张晋去年4月突发心脏病险丧命 蔡少芬公开细节:血管堵塞近80%

宝哥精彩赛事
2026-03-26 13:42:10
泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

TVB的四小花
2026-03-26 12:18:20
捡漏成功!广州市一栋三层别墅拍卖,被人捡漏170.6万就竞得,还要啥套间

捡漏成功!广州市一栋三层别墅拍卖,被人捡漏170.6万就竞得,还要啥套间

阿离家居
2026-03-26 16:52:37
体长超2米、重达40多斤!广东一大蟒蛇河边晒太阳被捕,将择机放生

体长超2米、重达40多斤!广东一大蟒蛇河边晒太阳被捕,将择机放生

环球网资讯
2026-03-26 19:40:47
复出遥遥无期!热刺进攻核心再次接受手术 此前已伤缺10月

复出遥遥无期!热刺进攻核心再次接受手术 此前已伤缺10月

雪狼侃体育
2026-03-26 23:13:58
第81轮反击来了!飞弹直击以军集结地

第81轮反击来了!飞弹直击以军集结地

星火聊天下
2026-03-26 07:27:33
心态凉了,勇士队格林就斯蒂芬·库里伤愈复出问题发表看法

心态凉了,勇士队格林就斯蒂芬·库里伤愈复出问题发表看法

好火子
2026-03-26 23:56:40
陈云晚年首次披露:遵义会议上这两个人死活不同意毛主席,吵得面红耳赤

陈云晚年首次披露:遵义会议上这两个人死活不同意毛主席,吵得面红耳赤

老杉说历史
2026-03-21 17:38:44
这些“垃圾花”也该被315曝光,别再坑害花友了,白送都不能要

这些“垃圾花”也该被315曝光,别再坑害花友了,白送都不能要

三农老历
2026-03-20 00:32:02
随着雷霆12连胜被终结,湖人137-130,西部最新排名出炉!马刺第2

随着雷霆12连胜被终结,湖人137-130,西部最新排名出炉!马刺第2

薇说体育
2026-03-26 10:48:02
美军司令:一旦台海战争打响,6个航母战斗群2个陆战师将全都出动

美军司令:一旦台海战争打响,6个航母战斗群2个陆战师将全都出动

混沌录
2026-03-24 22:31:03
性商教母复出,周媛换平台直播,狡辩称没有违法,火速被封

性商教母复出,周媛换平台直播,狡辩称没有违法,火速被封

非常先生看娱乐
2026-03-26 16:57:03
索尼本田合作造车,倒在了量产前一步

索尼本田合作造车,倒在了量产前一步

澎湃新闻
2026-03-26 20:56:35
岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

仙味少女心
2026-03-24 16:47:29
被抓后家中查出20吨黄金?秘密移民国外?赵本山身上的谣言太离谱

被抓后家中查出20吨黄金?秘密移民国外?赵本山身上的谣言太离谱

潮鹿逐梦
2026-03-24 17:58:35
2026-03-27 01:56:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16491文章数 514798关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
亲子
游戏
艺术
军事航空

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

亲子要闻

看看把孩子吓得哈哈哈

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版