网易首页 > 网易号 > 正文 申请入驻

不等人开口,机器人先把活干了!北京人形慧思开物Agent让大脑再进化

0
分享至


让机器人眼里有活、手上有数。

作者 |许丽思

编辑 |漠影

当公众还在讨论机器人什么时候能听从人的指令、稳妥把活干好时,有的机器人又悄悄进化了!

不用等人说,机器人就能很有“眼力见”地发现需求,主动干活;它还能在脑子里搭起一座动态更新的“记忆宫殿”,东西放哪、位置不停变化,都能记得一清二楚。

比如,家里来熟人了,机器人就能够识别出这个人过去的习惯,不用人开口,就主动端上一杯水;发现有人做出擦鼻子的动作时,就赶紧递上纸巾;刚说想吃个橘子,机器人就能想起橘子放哪,顺利找到后再帮你送过来。


这是发生在昨天晚上一场真机实景直播中的场景。天轶机器人基于北京人形机器人创新中心自主研发的慧思开物Agent,能够做到“眼里有活儿、手上有数”,能感知环境、理解需求,把任务真正执行到位。

今年以来,AI Agent已经成为人工智能领域最火热的方向之一。从OpenClaw等框架受到关注,到大模型厂商纷纷入局,Agent正在从数字世界走向真实物理世界。

机器人是Agent进入物理世界最直接的载体,它不能只会对话,也不能只会规划,还必须与复杂多样的物理世界产生交互。

相比很多近期才被关注的Agent框架,慧思开物Agent早于OpenClaw等框架一年启动,并经历了14个月持续迭代。过去一年,北京人形围绕慧思开物平台,先后发布和开源了世界模型、VLA、VLM等关键技术成果。

这次的Agent展示,北京人形长期沉淀的底层能力进一步推向真机实操与场景验证。慧思开物Agent的核心突破主要集中在三件事:让机器人拥有全局动态空间记忆,让机器人能够记住不同用户的身份和偏好,让机器人在物理操作中具备更精细的多模态力控能力。

01.

避免转身就忘事,

让机器人拥有全局动态记忆

过去,很多机器人对环境的理解往往停留在眼前,物体一旦被遮挡、移走或离开视野,机器人就容易失忆。

这种“所见即所得”的短视情况,会限制机器人完成长程任务,例如整理房间、寻找物品、物料分拣、跨区域搬运等任务,都需要机器人记住过去看到过什么,也要理解物体和空间之间的关系,这是一个持续动态更新的过程。

慧思开物Agent的空间记忆能力,正是为了解决这个问题。它打造了业内首个全局场景感知与动态空间记忆系统,可以构建动态语义地图,记录物体类别、颜色、位置和相对关系,并支持实时更新。

同时,它能实现跨时间、跨视角的持久记忆,即便物品离开机器人当前视野,机器人依然可以基于记忆进行定位;还支持关系推理,可以根据空间记忆推理出目标物体的位置、状态、与环境的关系。

据了解,根据实际测试,机器人在涉及多步移动、感知、抓取等的复杂多步骤长程任务中,这套空间记忆完整链路的准确率都能够稳定在100%,即便在面对视角切换、物体遮挡等真实扰动影响下,整体任务完成率仍维持在98%以上


在家庭环境中,这意味着机器人可以在不停移动、变换位置后,依旧记住刚刚被放到桌边的水杯、在沙发旁边的纸巾、在门口的快递盒等等琐碎物品,而不是转身就忘事了。

比如,你随手把手机放在角落,转身后突然找不到了。慧思开物Agent启动空间记忆系统后,可以回忆手机此前出现的位置,再结合当前环境变化进行判断,最终帮人找到目标物品。

在工业和物流场景中,货架会遮挡物品,物料会被搬动,托盘和包装箱的位置会不断变化。而慧思开物Gent的空间记忆能力,就能够帮助机器人在变化的环境中持续作业,从单点Demo走向更稳定的任务闭环。

02.

记住每个人特点、喜好,

机器人这下真有眼力见了

机器人要真正进入家庭、酒店、商业接待等近人场景,光会执行命令还不够,它还得足够有“眼力见”,知道服务对象是谁、喜欢什么、过去发生过什么。

传统服务机器人最大的短板之一,就是每次交互都像第一次见面,记不住用户身份,无法形成持续的个性化服务体验。刚刚帮你拿过文件,过一会儿,机器人就不知道“上次那个文件”指的是什么。

慧思开物Agent在用户记忆系统上的突破,不止是让机器人会记人,还会理解人。

它通过Face-ID用户记忆系统实现拟人化主动交互,可以进行身份绑定,沉淀用户画像与行为偏好,提供个性化服务。

比如,家里突然来熟客,当客人随口说“有点口渴”时,一个传统机器人可能会继续追问想喝什么,而拥有用户记忆后,机器人可以通过人脸匹配调取历史记忆,识别出这位客人此前更喜欢可乐、冰水或茶饮,再主动完成取物服务。


又或者,机器人刚看到你擦了下鼻子,就能马上反应过来,主动给你递上纸巾。


这种“千人千面”的能力,还能支持跨任务上下文延续,让机器人理解“继续昨天的事”“把上次那个文件拿来”等更接近人类日常表达的需求。

这种能力,让机器人从一次性执行任务,进化到具备持续服务能力,不等人给它下具体指令,就能够主动观察、主动判断、主动服务。

机器人既记得住人,也记得住场景,它才可能从一个冷冰冰的执行工具,变成家庭里的生活助手、酒店里的贴心管家、商业空间里的智能接待员。

03.

让机器人实现精准物理交互,

真正做到“有手感”

机器人进入真实物理世界,会面对形态各异的物品。这些物品的材质、重量、受力方式都不一样,很容易导致机器人出现“能抓起但抓不好,能接触但控不住”的问题。

就像在家庭中,机器人如果要帮人倒水、递杯子、收拾桌面,就得知道玻璃杯握的时候得小心会滑,一次性塑料杯不能握得太使劲,装满水的杯子移动时还要控制速度和姿态。

慧思开物Agent以“多模态融合操作+全场景真机验证”的模式,通过搭载视觉+触觉的多模态感知能力,以及根据目标物品特性调节的动态⼒控抓取,让机器人对物理交互更有感知、更能理解,最终实现“手上有数”的效果。

另外,慧思开物Agent还具备跨物体泛化、失败监测和重试能力,这意味着机器人并不是一次抓不好就结束,而是可以根据反馈调整策略。

在这次实景真机直播中,机器人左手握着光滑的玻璃杯,右手拿着轻薄柔软的塑料杯,稳妥地把水倒进杯中,就是靠的这种多模态融合操作的能力。


多模态力控的价值,让机器人开始具备真实物理交互中的安全性、稳定性和容错能力为机器人在家庭服务、商业接待、工业操作等落地奠定基础。

04.

结语:从最强大脑到开放生态,

加速具身智能落地步伐

北京人形作为具身智能国家队,推出慧思开物平台,不只是给机器人装上“最强大脑”,更是为了给行业提供一套可开发、可复用、可扩展的底层智能基础设施。

慧思开物Agent采用配置驱动和模块化架构可以接入XR-1、Pelican、WoW、DeepSeek、Pi0.5、Dreamzero等不同模型,通过轻量配置化实现模型、工具、任务Prompt的快速切换。

它还支持更开放的技能开发方式,开发者只需维护模块化的轻量技能描述,相比传统提示词方法体积压缩80%以上;运行时指令缓存命中后,机器人单次响应耗时降低50%,执行长链路任务时整体响应开销下降20%。

慧思开物Agent具备超强的跨本体硬件适配性,大幅减轻了在不同机器人上运用的门槛和成本,开发者只需专注创新,不必再重复造轮子。

从世界模型、VLA、VLM到此次的Agent,慧思开物打造的是一个可以不断进化迭代的生态,推动智能机器人从单一任务执行向复杂环境下的自主决策与执行能力跃升。

机器人开始记得住环境、看得懂人、拿得稳物品,具身智能也由此迈向可持续落地的新阶段。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
油价7月3日或大跌815元/吨,今年最大下跌,油价连降超1.03元/升

油价7月3日或大跌815元/吨,今年最大下跌,油价连降超1.03元/升

油价早知道
2026-06-30 09:39:22
库明加成为自由球员!老鹰拒绝执行2430万选项 国王骑士有意签他

库明加成为自由球员!老鹰拒绝执行2430万选项 国王骑士有意签他

罗说NBA
2026-06-30 05:30:56
整容失败不可怕,一股姨味才尴尬!52岁苏有朋给所有男星提了个醒

整容失败不可怕,一股姨味才尴尬!52岁苏有朋给所有男星提了个醒

胡一舸南游y
2026-06-28 22:43:38
女演员千万别盲目整容,看45岁马苏和40岁江疏影同框对比,就知道了

女演员千万别盲目整容,看45岁马苏和40岁江疏影同框对比,就知道了

情感大头说说
2026-06-30 15:54:27
火控雷达锁定辽宁舰!岸田文雄喊话被围攻,中日结局只有一个

火控雷达锁定辽宁舰!岸田文雄喊话被围攻,中日结局只有一个

黑鹰观军事
2026-06-30 13:28:48
日本1:2!淘汰不可怕,可怕的是森保一的这番话,夺冠目标不变!

日本1:2!淘汰不可怕,可怕的是森保一的这番话,夺冠目标不变!

田先生篮球
2026-06-30 05:54:58
Shams:罗威3年4400万美元重返开拓者

Shams:罗威3年4400万美元重返开拓者

懂球帝
2026-06-30 23:56:07
伊朗:超30国官员拟出席已故最高领袖哈梅内伊悼念活动,为保障活动举行,将在部分地区实施临时公共假期安排

伊朗:超30国官员拟出席已故最高领袖哈梅内伊悼念活动,为保障活动举行,将在部分地区实施临时公共假期安排

极目新闻
2026-06-30 22:01:14
印度闯大祸!iPhone18 Pro Max真机曝光,外观配置全泄露

印度闯大祸!iPhone18 Pro Max真机曝光,外观配置全泄露

泡泡网
2026-06-30 11:11:10
网红一栗小莎子最后一次化疗:最后一次治疗前,记一下普通的一天

网红一栗小莎子最后一次化疗:最后一次治疗前,记一下普通的一天

韩小娱
2026-06-30 16:43:17
男子在KTV饮酒后猝死,家属索赔143万;KTV和两名同饮者被判共赔偿58万,判决书披露详情

男子在KTV饮酒后猝死,家属索赔143万;KTV和两名同饮者被判共赔偿58万,判决书披露详情

大风新闻
2026-06-30 18:04:02
房子是有灵性的,若出现了这7个迹象,定是难得的旺宅!

房子是有灵性的,若出现了这7个迹象,定是难得的旺宅!

老覃讲历史
2026-06-28 12:22:50
1950年志愿军缴获美军新坦克,无人会开,一原国军俘虏站了出来

1950年志愿军缴获美军新坦克,无人会开,一原国军俘虏站了出来

人生录
2026-06-30 16:24:22
奥迪A6L暴跌20万!创20年历史最低,豪华信仰崩塌?

奥迪A6L暴跌20万!创20年历史最低,豪华信仰崩塌?

音乐时光的娱乐
2026-06-30 19:46:32
一掷千金的“大哥”越来越少!女主播群体从深圳迁到惠州路边帐篷

一掷千金的“大哥”越来越少!女主播群体从深圳迁到惠州路边帐篷

火山詩话
2026-06-29 04:37:21
民心所向!四川航空发布,7月底全部回迁双流,终于不用再跑天府了

民心所向!四川航空发布,7月底全部回迁双流,终于不用再跑天府了

原广工业
2026-06-30 13:34:38
看完这7件事,我终于懂了:中国足球的离谱,早就超出了人类认知

看完这7件事,我终于懂了:中国足球的离谱,早就超出了人类认知

圣西罗的太阳
2026-04-23 13:24:10
世界杯乱了:随着摩洛哥4-3,世界前十已有2队被送回家

世界杯乱了:随着摩洛哥4-3,世界前十已有2队被送回家

侧身凌空斩
2026-06-30 12:03:38
央八首播!开播一天就冲上全国收视率第一,阵容雄厚,越看越上瘾

央八首播!开播一天就冲上全国收视率第一,阵容雄厚,越看越上瘾

乐枫电影
2026-06-30 17:59:32
走面风波升级,“一言不发”的冯小刚,终于不再顾及所谓的体面!

走面风波升级,“一言不发”的冯小刚,终于不再顾及所谓的体面!

摸爬滚打的烙印
2026-06-29 07:20:54
2026-07-01 00:12:49
机器人前瞻
机器人前瞻
智东西AI媒体矩阵品牌。机器人前瞻,机器人产业新媒体,专注报道全球机器人创新。
637文章数 12关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

体育要闻

大热倒灶压力给到法国 王楚揭法国队隐患

娱乐要闻

广电总局发布2026年“微短剧+”行动计划推荐剧目

财经要闻

万亿“寒王”,历史时刻

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

本地
数码
时尚
手机
公开课

本地新闻

贵州小城的新目标:举办“村超”世界杯!

数码要闻

AMD自适应SoC首次集成封装上内存!32GB LPDDR5X、15年生命周期

Meiinpsn的穿衣风格,清新又叛逆

手机要闻

iPhone 18 Pro跌落测试画面疑似流出,随后迅速下架

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版