网易首页 > 网易号 > 正文 申请入驻

对话智源研究院理事长黄铁军:构建完整的世界模型是一条漫长的道路

0
分享至

世界模型正在成为当前人工智能产业出现频率最高的关键词之一,越来越多的研究机构和企业,开始将世界模型视为下一阶段人工智能竞争的重要方向。

与此同时,围绕世界模型究竟是什么、与当前主流的VLA路线有何区别、又将依靠什么样的数据继续进化等问题,行业内仍存在诸多争议。6月13日,在接受包括《每日经济新闻》记者在内的媒体采访时,智源研究院理事长、北京大学计算机学院教授黄铁军系统回应了这些问题。

在黄铁军看来,当前大量企业采用VLA路线推动具身智能落地,与世界模型的发展并不矛盾。对于产业而言,成熟技术解决具体问题是一种现实选择。但如果将来出现一个通用大脑作为基座,支撑垂直模型解决各个领域的问题,那么通用世界模型将会扮演这样一个角色。


智源研究院理事长黄铁军 图片来源:主办方供图

从VLA到世界模型:机器人需要一个理解现实世界的大脑

随着具身智能成为资本和产业共同追逐的热点,VLA(Vision-Language-Action)路线已经迅速成为行业主流之一,大量具身智能企业都依靠这一路线推动具身智能落地应用。

面对这一趋势,外界也开始产生一个问题:既然VLA已经能够解决很多现实问题,世界模型是否还有必要?

在黄铁军看来,两者本质上并不构成竞争关系。企业采用VLA,是因为这是一条已经被证明能够解决现实问题的路径。在制造、搬运、抓取等特定场景中,现有大模型技术已经具备相当程度的可用性。但从研究机构的角度来看,如果目标是打造能够像人一样在不同环境中行动、解决不同问题的具身智能,仅靠针对具体任务训练出来的能力远远不够。

“人脑就是一个小宇宙,人类其实对这个世界是有一个模型的,我们在做什么事的时候,有一个基本的判断依据。”黄铁军认为,真正意义上的世界模型不仅要理解物体运动、空间关系等基础规律,还要理解材料性质、环境变化以及人与人之间复杂交互后的因果关系。

黄铁军表示,机器人面对的不只是搬箱、抓取物体这类简单任务,还会涉足灾害救援、极端环境作业等高度开放的复杂场景。

例如,当机器人面对火灾现场时,人类会本能地避开火焰,因为人体无法承受高温,但机器人如果能够判断自身材料不会被融化,就可能作出完全不同的决策。

对于世界模型的发展速度,黄铁军认为,如果目标是构建一个能够掌握物理、化学、生物乃至社会运行规律的完整世界模型,这仍然是一条非常漫长的道路。因为人类自身对世界的认知在不断扩展,“把所有的科学知识、生物的、化学的、生命的所有都希望这个世界模型能装进去,是一个长远的、理想的目标”。

相比之下,更现实的目标是让机器人先获得类似普通人的常识能力,“未来两三年,能跟人日常工作相比的这样一个世界模型,是有可能出来的”。

与此同时,黄铁军还特别强调了另一个经常被忽视的问题,即效率。在他看来,从世界模型的角度,一方面追求功能完备,另一方面要求其在低功耗状态下,做到操作精准、反应灵敏。

新的范式:世界模型正在寻找新的“数据燃料”

如果说世界模型的目标是理解现实世界,那么支撑其成长的核心资源仍然是数据。不过,在黄铁军看来,世界模型时代的数据逻辑正在发生变化。

过去几年,大模型的发展主要依赖静态数据集。企业通过采集数据、构建数据集,再进行离线训练,从而不断提升模型能力,这种模式推动了语言模型和多模态模型的快速发展,但在世界模型阶段,单纯依赖静态数据已经难以满足需求。

黄铁军认为,数据本身就是对环境的一种不完备的表达,当前,数据这个概念本身有些过于静态,“我们甚至可以把数据这个词再稍微推广一点,生物正是通过与环境交互,获取进化所需的信息”。在人类认知世界的过程中,知识并不仅仅来自书本,更多时候,人是在与环境持续互动中形成认知。踢球、游泳、弹琴,甚至每天的工作和生活,本质上都在不断获取新的信息。

因此,黄铁军认为,在世界模型阶段,实时交互性的数据会越来越多,耳机、智能眼镜等可穿戴设备的发展,将推动这一变化加速发生。用户看到什么、听到什么、说了什么,都可能被实时记录下来,并同步成为智能体理解环境的一部分,“你看见了他也看见了,你不要把你看见的东西翻译给他”。

当这种同步感知成为常态时,人们的工作和生活过程实际上正在被数字化,而这些第一视角、实时同步的数据,也将成为训练世界模型的重要资源。

这一判断背后,实际上对应着数据采集模式的改变。

当前不少机器人企业仍在建设专门的数据采集中心,通过遥操作、人工示范等方式获取训练数据。黄铁军认为,从长期来看,这未必是成本最合理的方式。相比之下,让工人在正常工作过程中佩戴设备同步采集数据,或者让用户在使用智能体服务过程中自然产生数据等模式也需要探索,“我相信穿戴式的这些传感器会越来越多,会对未来的更多的数据产生提供一个重要的来源”。

代码能力的重要性在过去被行业低估

过去半年,以Anthropic为代表的科技公司正在不断强化代码能力建设,Claude Code等产品引发产业关注。

“代码本身逻辑性肯定是比自然语言要强,这是设计计算机语言编程的重要原因,所以它肯定是对大语言模型的性能是有重要影响的。”黄铁军表示,Anthropic在其部分的模型训练中,代码数据占比已经达到极高水平,其中不仅包括开源代码,还包含大量经过长期迭代的高质量商业软件代码。

黄铁军坦言,很多人最初关注代码数据,是为了提升模型性能,却忽视了Coding本身巨大的产业价值,这是需要反思的问题。

黄铁军表示,今天社会运行的底层已经越来越依赖数字系统。电网、金融系统、企业管理软件乃至互联网服务,本质上都是由代码构成的数字世界。相比受制于硬件、传感器和现实环境的具身智能,数字世界的重构门槛更低、见效更快。

在他看来,这也是OpenAI、Anthropic等现阶段持续强化Coding能力的重要原因。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国和伊朗猝不及防!打完仗发现,沙特千亿资本疯狂投往中国!

美国和伊朗猝不及防!打完仗发现,沙特千亿资本疯狂投往中国!

飘逸语人
2026-07-04 14:24:35
4日上午大满贯:男单8强诞生,张本智和0-3被横扫,男单格局大变

4日上午大满贯:男单8强诞生,张本智和0-3被横扫,男单格局大变

阿讯说天下
2026-07-04 11:44:29
三部门官宣 2027 年起恢复对 4 类车辆征车船税,如何解读?

三部门官宣 2027 年起恢复对 4 类车辆征车船税,如何解读?

贵重物品爱美食
2026-07-05 00:03:13
桂林电子科技大学顶着双非帽子,凭什么能把大批毕业生直接送进深圳南山区的写字楼

桂林电子科技大学顶着双非帽子,凭什么能把大批毕业生直接送进深圳南山区的写字楼

金哥说新能源车
2026-07-04 09:51:19
西安赛格以125亿年销售额位列全国第11名!网友:厦门sm不及一半

西安赛格以125亿年销售额位列全国第11名!网友:厦门sm不及一半

火山詩话
2026-07-04 10:46:41
每周往返13小时,这位上海专家连续两年坚持周末回乡坐诊

每周往返13小时,这位上海专家连续两年坚持周末回乡坐诊

上观新闻
2026-07-04 13:44:16
签下了!4年5600万!A级操作啊!

签下了!4年5600万!A级操作啊!

左右为篮
2026-07-05 00:37:56
宝马Q2美国卖爆:停产的Z4翻倍,3系狂飙56.8%

宝马Q2美国卖爆:停产的Z4翻倍,3系狂飙56.8%

赛场速报局
2026-07-04 00:56:10
霉霉和超模闺蜜:从烤饼干到陌路,再到婚礼同框

霉霉和超模闺蜜:从烤饼干到陌路,再到婚礼同框

娱圈观察员
2026-07-05 00:28:56
普京这步棋走得太精了,派梅德韦杰夫去伊朗,美国才反应过来晚了

普京这步棋走得太精了,派梅德韦杰夫去伊朗,美国才反应过来晚了

奇思妙想生活家
2026-07-04 13:04:56
王力宏演唱会突发!他意外摔倒,脸上耳朵上全是血,爬起来继续唱……网友:耳骨断裂,要缝针了

王力宏演唱会突发!他意外摔倒,脸上耳朵上全是血,爬起来继续唱……网友:耳骨断裂,要缝针了

都市快报橙柿互动
2026-07-04 20:57:49
风水轮流转!中国网友集体反对欧洲吹空调,奥巴马回旋镖砸中西方

风水轮流转!中国网友集体反对欧洲吹空调,奥巴马回旋镖砸中西方

丁丁鲤史纪
2026-07-04 17:44:46
改革、重组,中国央国企马上要迎来一场大洗牌?

改革、重组,中国央国企马上要迎来一场大洗牌?

时尚的弄潮
2026-06-28 12:01:37
演员保剑锋方声明:自愿离婚

演员保剑锋方声明:自愿离婚

鲁中晨报
2026-07-03 11:22:08
财政部回复:搭乘他人顺风车或者自驾车(费用由出差人自己承担)前往,市内交通补助该如何报销?

财政部回复:搭乘他人顺风车或者自驾车(费用由出差人自己承担)前往,市内交通补助该如何报销?

新理财杂志
2026-07-03 19:20:21
陌生号码一律不接,中国社会正在支付一笔隐形信任税

陌生号码一律不接,中国社会正在支付一笔隐形信任税

小陆搞笑日常
2026-06-25 11:30:41
GDP会骗人,个税不会:谁才是中国真正的高薪之城

GDP会骗人,个税不会:谁才是中国真正的高薪之城

互联网大观
2026-07-02 08:52:16
测量319位中国女性外阴,他们发表全球首例研究

测量319位中国女性外阴,他们发表全球首例研究

医学界妇产科频道
2026-06-27 19:51:42
日本「撞人族」大阪街头嚣张,被韩国壮汉铁拳教育,秒变缩头乌龟……

日本「撞人族」大阪街头嚣张,被韩国壮汉铁拳教育,秒变缩头乌龟……

日本物语
2026-07-03 23:49:05
以色列宣布:打死穆罕默德·纳伊姆·詹迪亚

以色列宣布:打死穆罕默德·纳伊姆·詹迪亚

每日经济新闻
2026-07-03 17:46:37
2026-07-05 01:11:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1605967文章数 2726931关注度
往期回顾 全部

科技要闻

韬定律论文V2版,充工程细节和实测数据

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

白鹿打戏抠图惹非议 连累丞磊遭扒皮

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

游戏
教育
数码
房产
公开课

韩版“全境封锁”PC配置降低 内存改为32GB起步

教育要闻

参考!2026年高考分数对应2025年同位分!

数码要闻

苏姿丰签名同款!极摩客EVO-X3 AI工作站全球开卖:国行版21699元起

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版