“我觉得未来机器人真正走进家庭的时候,整个人形机器人的产业规模一定非常巨大,我们认为它是一个手机数量乘以汽车价格的产业空间。前景非常广阔,但挑战也非常大。”
在日前举办的人形机器人与具身智能标准化(HEIS)年会上,智元机器人联合创始人、总裁兼CTO彭志辉表示。
![]()
彭志辉在发表演讲
这一观点代表着彭志辉对于家庭市场的宏观预判,而2026年2月下旬,北京大学董豪课题组与智元机器人旗下上纬启元团队联合发布的两项研究成果,在机器人学术与产业界引起了关注。
值得注意的是,董豪的另一重身份是上纬启元首席科学家——而智元机器人已在2025年完成对上纬新材的收购,智元联合创始人彭志辉任上纬新材董事长,上纬启元正是上纬新材旗下专注个人机器人业务的子品牌。
![]()
董豪相关信息介绍Github
这两篇发表于顶级会议ICRA 2026的论文,聚焦于两个极其具体且关键的难题:如何让机器人在复杂环境中不迷路,以及如何让它在家庭里完成精细的物件摆放任务。
它们共同指向了智元在具身智能领域一个清晰而务实的技术路径:优先攻克“大脑”的感知、推理与决策能力,为机器人最终走进千家万户打下地基。
让机器人看懂世界,干好家务
第一篇论文,构建了业内首个空间智能导航评测基准NavSpace。
“去一楼厨房找水槽”“在客厅左侧第三扇门后停下”“绕八人餐桌走一圈再回来”……这些人类习以为常的空间指令,对机器人而言却是“天书”。
![]()
现有导航模型要么能理解语言但不懂空间关系,要么能感知环境但无法将视觉信息转化为连续动作。
NavSpace设计了超过1200条涵盖方位、距离、地标、空间关系、环境状态、空间结构等六大类的动态指令,要求机器人不是简单地走到某个点,而是在移动中持续进行空间推理。
研究团队发现即使是市面上优秀的开源多模态大模型,其表现也接近随机猜测;专用模型虽好一些,但整体成功率仍然很低。
这揭示了当前机器人“大脑”在空间认知上的普遍短板。
为此,团队提出了SNav模型,该模型在所有类别指令上的表现均超越基线,并且在真实世界的办公室、校园等场景测试中,将机器人的导航成功率提升至32%,远高于其他模型。
![]()
这项工作的核心价值在于,它为机器人装上了一个能理解复杂空间关系的“大脑”,让机器人不再是只能沿着预设路线移动的机器,而是能够真正理解“周围有什么、我在哪里、该怎么走”的智能体。
其应用场景直接指向未来的家庭服务、商场导引、仓库巡检等需要自主移动与定位的领域。
如果说NavSpace解决了机器人“去哪”的问题,那么第二篇论文则致力于解决“怎么干”的难题,而且是家庭场景中最常见的精细操作问题。
这一研究瞄准的是“关系性物体重排”任务,例如将花插入花瓶、将盘子放入碗架、将笔插入笔筒。这些任务对人类而言轻而易举,但对机器人却异常困难:它不仅需要知道花该插进花瓶这样的语言逻辑,还必须了解花茎对准瓶口的角度和位置这一几何信息,稍有偏差就会失败。
传统方法要么缺乏对这种几何关系的显式推理,要么因生成目标时的噪声导致误差累积。
![]()
Imagine2Act框架提出了一个巧妙的思路:让机器人“先想象,再动手”。
具体而言,系统会首先生成一个与真实场景精确对齐的“想象目标”点云(例如,花在花瓶中的正确姿态),为机器人提供清晰的几何先验。
然后,通过一套“物体-动作一致性学习”机制,确保机器人的实际操作动作与这个“想象目标”紧密对齐,从而在利用先验知识的同时,避免了直接执行生成目标可能带来的误差。实验表明,该框架在插花、叠杯等7项仿真任务中平均成功率达到79%,在6项真实世界任务中达到68%,显著优于主流方法。
![]()
这项研究的实用性极为明确:它就是为未来的家庭服务机器人准备的“基本功”。当机器人需要整理书桌、收纳餐具、摆放物品时,Imagine2Act所提升的毫米级操作精度和几何理解能力,是它能否可靠、安全地融入日常生活环境的关键。
这两篇论文一“行”一“操”,共同勾勒出智元在机器人“大脑”研发上的聚焦点:深入具体场景,解决空间理解和精细操作的核心认知与执行瓶颈。
而这一切的最终出口,正是最具挑战性也最广阔的市场——家庭。
从舞台到车间,再到家门
回顾2025年至2026年初的行业动态,一条清晰的演进路径已经浮现:从舞台表演的流量引爆,到探索工厂车间的商业化落地,最终迈向家庭家门的规模普及。
而机器人“大脑”的成熟度,是贯穿这三个阶段的主线。
春晚机器人表演带来的租赁市场火爆,给行业上了深刻的一课。
![]()
它证明了机器人具备吸引眼球的情绪价值和运动智能,但这背后一定存在的,是单一表演场景的脆弱性和商业模式的单一性。
市场在新鲜感过后,必然会发出最朴素的追问:“这东西究竟能干什么?”
这个阶段的价值在于完成了初步的市场教育和资本聚焦,但距离真正的产业需求还很远。
现在,行业共识正在迅速形成:机器人必须“进厂打工”。
工厂,尤其是存在“波峰波谷”用工难题的中小企业,被智元高级副总裁姜青松认为是机器人实现“生产价值”最现实、最稳定的场景。租赁模式在这里找到了与人力派遣高度契合的商业逻辑。
特斯拉、宝马、小米等公司已开始在实际工厂工站进行试点,例如螺丝拧紧、料箱搬运、简单装配等。这个阶段的核心挑战是操作智能的可靠性。
![]()
小米机器人正在“打螺丝”小米官方微博
工厂环境要求7x24小时稳定运行,容错率极低。
当前机器人的能力,正如行业判断,仍处于“L2级辅助自主”阶段,在复杂、非标任务中仍需人类远程遥操作(Teleoperation)作为补充和教学。
然而,正是这种人类在环的模式,为机器人“大脑”提供了最宝贵的高质量操作数据,驱动其向“L3级条件自主”迭代。
家庭是终极市场,也是难度最高的无人区。
工业场景的成熟为家庭场景的发展还积累了三项关键能力。
在硬件可靠性方面,工业机器人长期应对高强度作业的实践,使其伺服电机、减速器、传感器等核心部件具备了高耐受性,这为家庭机器人的耐用性需求奠定了基础。
在成本控制能力方面,工业机器人的规模化生产能够通过批量制造降低核心部件成本,直接推动家庭机器人向平民化迈进。
此外,智能算法的复用进一步打通了工业与家庭场景的技术迁移通道。工业场景中成熟的“视觉引导抓取”“路径规划”等算法,经针对性改造后可直接应用于家庭场景。
在家庭场景中,环境完全非结构化、任务琐碎多样、安全要求极高、且需要与人类进行亲密、自然的交互。
仅仅会跳舞或拧螺丝的机器人无法走进家庭。
它需要的一定是高度融合的空间智能、精细的操作智能、以及对人类意图的深度理解。
此前,上纬启元发布了全球首款全身力控小尺寸人形机器人“启元Q1”,并邀请董豪教授出任首席科学家,战略意图非常清晰:将科研级的技术成果逐步下沉,打造面向个人和家庭的消费级机器人产品。
![]()
行业的趋势表明,从舞台到车间,是机器人从玩具和工具向生产力的转型;而从车间到家门,则是从专用生产力向通用助手的飞跃。
这条路径是一个“大脑”能力逐级解锁、数据闭环逐场景构建的漫长过程。
智元的选择是,在工业场景攻坚操作智能的同时,并行研发未来家庭场景所需的更高级别的认知智能和空间智能,为最终的跨越积蓄技术资本。
一场机器人的“大脑”长征
当前的人形机器人行业热闹非常,资本喧嚣、概念迭出、竞争日益激烈。
在这样一幅纷繁的产业图景中,智元以两篇扎实的学术论文,体现了自己认真做"大脑"的长期主义底色。
这种选择背后,是对产业核心矛盾的清醒认知。正如智元机器人联合创始人彭志辉在演讲中所言:"如果说硬件是躯体,那AI就是机器人的灵魂。"他将机器人的"灵魂"分为运动智能、交互智能、作业智能三个领域,并强调运动智能是交互智能和作业智能的基座。
彭志辉指出,2024年以来,整个行业在运动控制领域的进步主要得益于算法范式的转变、仿真框架的普及以及关节技术的收敛,这些综合收益使得运动智能得到突破性提升。
彭志辉的论述揭示了机器人产业发展的关键瓶颈:并非本体硬件的快速迭代(虽然这的确很重要),而是智能水平的实质性突破。
![]()
彭志辉在发表演讲
一个不够智能的机器人,即使成本再低、动作再炫,在复杂的真实场景中依然难以创造稳定的价值。智元通过NavSpace和Imagine2Act所展示的,正是一种"问题驱动"的研发思路:从真实场景中提炼出最关键的学术问题,通过前沿方法寻求突破,再将成果反馈到产品与平台迭代中。
这并非意味着忽视硬件与商业化。恰恰相反,智元的生态布局呈现出一种"软硬协同、分层推进"的立体策略。
相关资料显示,智元已经在八大典型场景里面,开展了大量应用,比如文娱商业、导购、工业制造、物流、安防、科研、素材、商演等,还在持续探索新的场景。
在硬件层面,通过"擎天租"平台整合多品牌机器人,快速覆盖文娱和早期商用租赁市场,积累运营数据和商业经验;在工业层面,与合作伙伴推进试点,为"操作智能"寻找落地出口和训练数据;在"大脑"层面,通过前沿研究,瞄准家庭和个人市场的长期未来。
目标“家门”,意味着智元选择了一条最艰难但也最具想象力的道路。
家庭市场当然不会因为一次成功的春晚表演或一个低廉的售价而瞬间打开,它需要技术、产品、生态、成本、安全、社会接受度等多个维度的漫长准备。
智元正在做的,是在行业热衷于短期流量和市场份额争夺时,默默为这条通往“家门”的道路浇筑最关键的技术基石——一个能真正理解空间、理解物体、理解任务,并能安全、精细地动手操作的“大脑”。
小结
近期,世界移动通信大会(MWC)正在西班牙巴塞罗那举行,来自中国的机器人成为大会亮点。
在大会上,智元机器人集中展示了其全系列产品线,涵盖A2系列人形机器人、X2紧凑型机器人、G2轮式机器人、D1四足机器人以及高灵活度的OmniHand灵巧手。这些产品不仅能够承担迎宾接待、导览指引等基础服务,更可针对零售、制造与物流等场景提供定制化集成解决方案。
![]()
智元旗下机器人在MWC
除智元外,宇树科技与魔法原子等国内企业也在本届MWC亮相。宇树科技重点演示了G1人形机器人的“搏斗”能力,突出其高动态运动控制性能;魔法原子则展出了全尺寸人形机器人GEN1、双足机器人MagicBot Z1以及四足机器人MagicDog。
此外,在六号与七号展馆内,还有多家中国机器人企业展示了面向工业协作、导览服务与高动态控制等场景的人形及四足机器人产品。部分参展商在现场表示,正积极拓展欧洲市场,寻求本地代理商与合作伙伴。
春晚舞台上,中国机器人大展身手,MWC上,中国机器人受到世界瞩目,中国的机器人赛道正空前火热。
但机器人行业的核心从来不是表面的炫酷,而是能在场景里解决多少问题。
当喧嚣渐退,真正留在技术赛场上的,将是那些既仰望星空,又肯俯身夯实脚下每一步技术道路的践行者。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.