网易首页 > 网易号 > 正文 申请入驻

智源研究院王仲远:世界模型的关键是真正预测下一个状态

0
分享至


经济观察报 记者 周悦

2025年,“世界模型”(World Model)成为AI领域最受关注的词汇之一。它指的是让AI理解世界运作规律,不再停留在识别或生成层面,而是能想象并预测世界的变化。

随着大模型红利逐渐减弱,各家公司都在寻找新的增长点。DeepMind推出可生成交互式3D世界的Genie 3,OpenAI继续强化 Sora的物理一致性;英伟达、华为、百度等也正从机器人与自动驾驶场景切入,让AI从看懂迈向参与。

10月30日,智源研究院发布悟界·Emu3.5多模态世界大模型。智源研究院院长王仲远在接受经济观察报等媒体采访时表示,随着互联网文本数据被充分利用,大语言模型的增长进入相对缓慢阶段,行业正在寻找新的突破口,而多模态与世界模型正是被寄予厚望的方向。

王仲远认为,Emu3.5很可能开启第三个规模定律范式(Scaling)。在语言预训练和推理优化之后,Emu3.5进一步证明,多模态模型同样具备可规模化成长的潜力。“它的最大贡献,是用自回归架构统一了图像、文本与视频的生成和理解。它能够预测下一个状态(Next-State),这一点非常接近人类大脑对世界进行理解的方式”。

与主流的Diffusion Transformer(DiT)架构不同,智源从“第一性原理”出发,构建原生多模态大模型。在Emu架构下,模型能在同一系统中完成感知、理解、推理与生成,形成一个可持续进化的世界模型。

智源研究院多模态大模型负责人王鑫龙介绍,Emu3.5基于超过10万亿token的多模态数据训练,其中视频数据累计时长达790年,参数规模为340亿。智源团队提出的“离散扩散自适应(DiDA)”推理方法,使图像生成速度提升近20倍,同时保持高质量输出。模型在三个维度上实现突破:一是从意图到规划,能够理解更高层级人类意图,例如,如何制作一艘宇宙飞船,并生成连贯的多步骤行动路径;二是动态世界模拟,能在统一框架内预测物理动态、时空演化与因果关系;三是泛化交互能力,为AI与人类及物理环境之间的协作提供认知基础。

针对外界将世界模型等同于视频生成的看法,王仲远不认同。他认为,世界模型的核心并非视频生成,而是对因果与物理规律的理解。比如机器人要抓起一杯靠近桌边的咖啡,它必须预测哪种动作会让杯子掉下去,哪种才安全——这才是真正的理解。

他认为,人类学习世界时不会区分语言或动作,Emu3.5也不限定用途。它既可支撑具身智能,也能生成多模态训练数据。在他看来,这不仅是一次架构创新,也展示了中国科研团队的原创路线,在世界模型这一尚未收敛的领域中,尝试提出自己的答案。

2024年10月,智源研究院发布了全球首个原生多模态世界模型悟界·Emu3。该模型仅基于“下一个token预测”机制。Emu3.5则在此基础上进一步完善,使AI具备更强的物理直觉与跨场景规划能力。

王仲远认为,未来的AI,不只是理解指令,而要理解世界本身,并在其中行动。

(作者 周悦)

免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。


周悦

TMT编辑,关注科技、大健康交叉领域,擅长行业研究,深度报道。“新闻是历史的初稿”。
欢迎联系:zhouyue@eeo.com.cn。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
何祚庥:我对核聚变研究的质疑,就是向杨振宁先生这样的先贤学习

何祚庥:我对核聚变研究的质疑,就是向杨振宁先生这样的先贤学习

怀疑探索者
2025-11-02 21:29:01
投资遭“强行接管”:民企的县城之殇

投资遭“强行接管”:民企的县城之殇

三人成虎V5
2025-10-31 11:51:58
国锦赛:赵心童两连鞭轻取范争一,世界冠军轰单杆111分进32强

国锦赛:赵心童两连鞭轻取范争一,世界冠军轰单杆111分进32强

世界体坛观察家
2025-11-03 22:14:23
又暴雷!48小时卷走129亿,200万会员血本无归,“传销巨头”凉了

又暴雷!48小时卷走129亿,200万会员血本无归,“传销巨头”凉了

卷史
2025-11-03 17:55:58
二手房房价下跌幅度扩大!

二手房房价下跌幅度扩大!

地产观点
2025-11-03 08:30:03
俄军占领红军城主城区,10000名乌军被围遭弃!

俄军占领红军城主城区,10000名乌军被围遭弃!

汉唐智库
2025-11-03 17:46:15
本周北京明显降温!该穿啥衣服?最新预报——

本周北京明显降温!该穿啥衣服?最新预报——

BRTV新闻
2025-11-03 17:35:20
官宣!首都医科大学校长调整

官宣!首都医科大学校长调整

医学界
2025-11-03 20:46:52
86岁老人随口乱说代号,儿子上报后,国安领导:马上接通中央部委

86岁老人随口乱说代号,儿子上报后,国安领导:马上接通中央部委

知鉴明史
2025-10-23 14:01:49
惊天反转!荷兰大选结果万万没想到,维尔德斯输给了他!

惊天反转!荷兰大选结果万万没想到,维尔德斯输给了他!

南宫一二
2025-11-03 15:52:02
交易截止日之前,几位可能被交易的球员

交易截止日之前,几位可能被交易的球员

篮球盛世
2025-11-03 11:45:10
中国首善李春平离世,13年软饭换268亿遗产,大39岁女星身份曝光

中国首善李春平离世,13年软饭换268亿遗产,大39岁女星身份曝光

壹月情感
2025-10-31 15:08:21
里夫斯调侃东契奇:他就是个白痴,他像个孩子但总有一天需要长大

里夫斯调侃东契奇:他就是个白痴,他像个孩子但总有一天需要长大

懂球帝
2025-11-03 15:06:11
日本人全球最长寿,这5种食物,他们顿顿都要吃,你吃过几种

日本人全球最长寿,这5种食物,他们顿顿都要吃,你吃过几种

削桐作琴
2025-11-03 19:29:12
中日韩全军覆没,固态电池布局了10多年,为什么还没有实现量产?

中日韩全军覆没,固态电池布局了10多年,为什么还没有实现量产?

削桐作琴
2025-10-28 13:10:37
限制文班最好的居然是他们?看看现在的哈腾,再想想现在的周琦

限制文班最好的居然是他们?看看现在的哈腾,再想想现在的周琦

篮球神吐槽
2025-11-03 23:15:30
伏尸百万,这个国家已经进入大屠杀模式 | 地球知识局

伏尸百万,这个国家已经进入大屠杀模式 | 地球知识局

地球知识局
2025-11-03 21:00:07
于海青:为何说越来越多城投开发以及城建相关老总被查发人深思?

于海青:为何说越来越多城投开发以及城建相关老总被查发人深思?

于海青
2025-11-03 00:27:43
老实的家长,根本接触不到小学的这些真相!

老实的家长,根本接触不到小学的这些真相!

好爸育儿
2025-10-29 08:40:03
莫雷加德夺得冠军,振臂欢呼 没想到松岛辉空却是这种反应

莫雷加德夺得冠军,振臂欢呼 没想到松岛辉空却是这种反应

削桐作琴
2025-11-03 22:34:06
2025-11-03 23:28:49
经济观察报 incentive-icons
经济观察报
经济观察报是专注于财经新闻与经济分析的全国性综合财经类媒体。聚焦商道、商技和商机。
111464文章数 1605996关注度
往期回顾 全部

科技要闻

余承东内部信:鸿蒙下一步要实现上亿覆盖

头条要闻

57名储户在银行大厅受骗损失千万本金 当地成立调查组

头条要闻

57名储户在银行大厅受骗损失千万本金 当地成立调查组

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

男导演曝丑闻 蒋欣的含金量还在上升

财经要闻

最新省市GDP:谁在飙升,谁掉队了?

汽车要闻

环比增长28.7% 方程豹品牌10月销量31052辆

态度原创

房产
手机
艺术
本地
公开课

房产要闻

信达·繁花里 | 老照片征集活动 温情启幕

手机要闻

OPPO 11月升级机型公布:搭载ColorOS16正式版

艺术要闻

90后跨国夫妻,到浙江山居:花20万租20年,值了!

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版