网易首页 > 网易号 > 正文 申请入驻

信通观察丨中国信通院许志远:具身智能取得阶段性突破,未来方向仍在快速演化中

0
分享至


12月13日,“2026中国信通院深度观察报告会”在北京举办。中国信息通信研究院副总工程师许志远针对具身智能发表了自身观点和见解。

在他看来,当前具身智能已经取得认知智能与物理智能的双线突破,但模型路线、数据范式以及最佳机器人形态仍未定型,大规模落地仍处于早期阶段,其未来方向仍在持续竞争与快速演化中。

具身智能取得阶段性突破 仍需关注三大核心焦点问题

许志远详细介绍了具身智能当前实际进展及需要重点关注的内容。他表示,当前具身智能的确取得了阶段性突破。一方面,机器人的“认知智能”实现明显跃升(即“大脑”能力),大模型使机器人能够完成传统机器人难以处理的复杂任务,具备“可感知、可思考、可交互”的智能特征。另一方面,“物理智能”加速突破:基于强化学习,人形机器人在复杂地形行走、高难度舞蹈等动态任务上表现显著提升;基于模仿学习与大模型范式,上肢操作能力快速增强,已能执行切黄瓜、倒水、叠衣服等精细操作。

“然而,尽管技术突破不断,具身智能的大规模落地仍处于早期阶段”, 许志远指出:“当前行业仍面临三个核心焦点问题。”

具体而言,一是模型路线之争:大模型范式是否适用于机器人?虽然大模型在语言、图像、视频领域取得巨大成功,但“同样的范式能否直接迁移到机器人控制”仍未被证明。业界正在探索多种途径。

二是数据训练范式之争:哪类数据才是机器人智能提升的关键?数据仍然是限制机器人能力跃升的核心瓶颈。目前机器人模型主要依赖三类数据:真机数据,质量最高但采集昂贵、规模有限;合成/仿真数据,规模大、成本低,但逼真度与物理一致性有差距;人类第一视角视频数据,自然、丰富,但动作标注与映射存在挑战。当前尚无结论表明机器人领域是否会像NLP、CV一样遵循Scaling Law——即“更多数据一定带来更强能力”。因此,数据范式仍在快速演化,混合数据、多模态数据、世界模型生成数据等方向均在探索中。

三是形态路线之争:人形机器人是否是“真需求”?具身智能的落地呈现出两大派系:① 人形坚守派(Tesla、Figure AI 等)。这些企业坚持全人形路线,原因包括:人形最契合人类社会现有环境与工具体系;人形形态最利于学习人类动作、利用人类数据;长期看具备最大通用性。特斯拉和Figure AI因此持续投入大量资源,力图构建“通用劳动机器人”。② 折中派(大量国内企业)。国内今年涌现出多款“轮-臂式复合机器人”,其特点是:轮式底盘更可靠、成本更低、部署更简单;动作可控性强,更适合集成到商业场景快速落地。这种路径更强调“工程可落地性”,旨在在短期内形成可规模化的商业应用。

在 VLA 基础上引入世界模型 有望成为提升机器人大模型能力的重要路径

据许志远介绍,目前,利用大模型提升机器人的泛化能力已成为业界共识,但如何有效地将大模型应用于机器人系统,仍存在多条技术路径,行业也在持续探索中。

第一条路径是采用大语言模型(LLM)对人类指令进行语义理解与任务分解,这是赋予机器人高层智能的关键能力,谷歌的 SayCan 是早期代表性工作。第二条路径是在LLM的基础上引入视觉,使模型具备语言与视觉跨模态融合能力,通过视觉语言模型(VLM)进行机器人控制。借助视觉信息,模型不仅能分析环境的空间关系和物体属性,也能更好支撑高层任务规划。谷歌的 PaLM-E 展示了跨模态推理在机器人控制中的潜力。第三条路径是在VLM的基础上进一步加入动作生成能力,形成视觉-语言-动作模型(VLA)。这类模型以视觉图像和语言指令为输入,直接输出机器人控制指令。VLA路线自2024年底以来受到高度关注。各家厂商在模型架构、模块设计和动作生成方式上不断优化,例如美国的Figure AI、PI,以及国内的智元、银河通用等均聚焦于这一方向。

许志远强调,目前,许多VLA模型采用MoE架构,以VLM作为骨干网络,动作层常使用自回归预测、扩散模型或流匹配等生成方式。同时,在VLM与动作预测之间通常加入隐向量用于信息传递,以兼顾复杂任务推理与实时控制需求。VLA在复杂、多步骤、多样化任务上展示出一定适应性。“然而,我们也观察到,尽管VLA在结构上不断演进,其实际落地效果仍未达到预期。原因在于物理世界具有高度多样性与不确定性,而当前可获取的机器人数据量级有限、覆盖场景不足,使得VLA难以充分学习并泛化到真实环境中。”

展望未来,在VLA的基础上引入世界模型(World Model),借助其对物理世界的理解、预测与推演能力,有望成为进一步提升机器人大模型能力的重要发展路径。

重视利用合成数据和视频数据 满足机器人模型训练需求

“机器人的真机数据虽然质量最高,但人工采集的成本极高,高质量样本更是稀缺,远远无法满足模型的训练需求。因此,业界开始越来越重视合成数据和视频数据的利用。” 许志远指出。

一方面,业界开始采用混合数据训练模式:先利用合成数据或视频数据进行模型预训练,再用真机数据进行微调。例如,银河通用使用10亿帧合成数据完成抓取模型的预训练;英伟达GROOT N1模型中,合成、视频和真机数据分别占25%、31% 和 44%。“我们发现,主流方案的非真机数据占比通常在80%~99%,但是哪个比例对于机器人性能提升更加有效仍需产业界来不断试错验证。”

另一方面,今年以来,使用人类第一视角拍摄的视频数据成为破解数据瓶颈的一类重要方案。具体做法是让操作员佩戴头戴式摄像设备,在不影响日常工作的前提下记录其操作过程,为模型训练提供高质量的人类示范数据。6月份有消息称,马斯克将延续自动驾驶“全视频学习”的路线,未来的训练将主要依赖来自人类第一视角的视频数据。Figure AI也在9月份发布了Go-Big项目,目标就是构建全球最大、最多样化的视频预训练数据集。国内清华大学、地平线、智元机器人等也在做相关路线的探索。

来源:中国信通院CAICT、飞象网

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
新婚15天就爆不伦!日谐星床战照外泄 人妻私讯「穿最色内裤」求欢

新婚15天就爆不伦!日谐星床战照外泄 人妻私讯「穿最色内裤」求欢

ETtoday星光云
2026-05-14 15:58:05
访华途中,特朗普突然发文!一句话引爆中美舆论,拜登被骂惨了

访华途中,特朗普突然发文!一句话引爆中美舆论,拜登被骂惨了

菁菁子衿
2026-05-15 15:40:44
37岁小托马斯回归绿军!获聘担任球探 至今仍未正式宣布退役

37岁小托马斯回归绿军!获聘担任球探 至今仍未正式宣布退役

罗说NBA
2026-05-15 07:16:41
中美是否在农业方面达成协议?外交部:愿同美方不断拉长合作清单

中美是否在农业方面达成协议?外交部:愿同美方不断拉长合作清单

澎湃新闻
2026-05-15 15:30:26
特朗普起飞后,日本传来消息!高市派出女大臣来华,也想破冰了

特朗普起飞后,日本传来消息!高市派出女大臣来华,也想破冰了

至今
2026-05-15 13:36:38
特朗普爱吃的两道中国菜,好多老外都猜不到

特朗普爱吃的两道中国菜,好多老外都猜不到

阿莱美食汇
2026-05-15 00:03:02
白左圣母被驱赶出家:还会说有一天我们也是难民吗

白左圣母被驱赶出家:还会说有一天我们也是难民吗

侠客栈
2026-05-14 12:43:23
情怀难抵现实!即使骑士能挺进东决,41岁詹姆斯依然回归无望!

情怀难抵现实!即使骑士能挺进东决,41岁詹姆斯依然回归无望!

田先生篮球
2026-05-14 13:43:57
正式取消!知名985高校:公众进校不用预约了

正式取消!知名985高校:公众进校不用预约了

南方都市报
2026-05-14 13:02:01
特朗普突然透露:北京明确表态,不会向伊朗提供军援

特朗普突然透露:北京明确表态,不会向伊朗提供军援

桂系007
2026-05-14 23:59:15
故宫建造时使用的木材,来自哪里?为何这些木材至今没有腐烂

故宫建造时使用的木材,来自哪里?为何这些木材至今没有腐烂

云霄纪史观
2026-05-15 01:49:45
1-2!0-3!国足U17倒下,亚洲杯接近出局,创22年耻辱纪录

1-2!0-3!国足U17倒下,亚洲杯接近出局,创22年耻辱纪录

阿晞体育
2026-05-15 14:35:09
张柏芝为19岁儿子选国产新车,母爱选择显心意

张柏芝为19岁儿子选国产新车,母爱选择显心意

街上的行人很刺眼
2026-05-15 02:59:23
一个人最大的本事,就是解决问题的能力!(深度好文)

一个人最大的本事,就是解决问题的能力!(深度好文)

辛东方
2026-02-12 08:00:03
第一次和男友同居:我直接惊呆了,原来男女私下可爱到犯规

第一次和男友同居:我直接惊呆了,原来男女私下可爱到犯规

那年秋天
2026-05-15 09:00:11
基本盘被指用来嘲讽有爱国情怀的人

基本盘被指用来嘲讽有爱国情怀的人

映射生活的身影
2026-05-13 21:13:11
一座天坛,横跨51年:美国总统再次踏上中美交往的历史现场

一座天坛,横跨51年:美国总统再次踏上中美交往的历史现场

澎湃新闻
2026-05-14 13:34:30
张本美和真敢说!发布会直言:王曼昱赛场胆怯,出手不果断太犹豫

张本美和真敢说!发布会直言:王曼昱赛场胆怯,出手不果断太犹豫

观鱼听雨
2026-05-14 22:25:52
水汽堪比盛夏,超长降雨带跨越千里,局地可能大暴雨!北京傍晚有雨,未来三天持续阴雨

水汽堪比盛夏,超长降雨带跨越千里,局地可能大暴雨!北京傍晚有雨,未来三天持续阴雨

鲁中晨报
2026-05-15 13:34:35
最美女星坏事干尽:三次入狱、鼓励丈夫肉体出轨、被摘5个器官

最美女星坏事干尽:三次入狱、鼓励丈夫肉体出轨、被摘5个器官

临云史策
2026-05-15 13:49:40
2026-05-15 16:19:00
重庆市物联网产业协会
重庆市物联网产业协会
会员为根 服务为本
1728文章数 146关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

女游客以1分钱拍下标价1980元的三亚海景房 酒店回应

头条要闻

女游客以1分钱拍下标价1980元的三亚海景房 酒店回应

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛为何要来《桃花坞6》没苦硬吃?

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

教育
时尚
亲子
数码
房产

教育要闻

新华读报|抛绣球、游泳进中考,体育改革让学生“玩有所得”

56岁逆风翻盘,她怎么从全网群嘲变成了大家的天才女友?

亲子要闻

考前焦虑家长扎堆问诊!济南六一儿童医院:学习困难需医学“破局”,暑假正当时

数码要闻

25999元!华硕ROGxAMD联名主机发布:一身极品装备

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

无障碍浏览 进入关怀版