网易首页 > 网易号 > 正文 申请入驻

智源研究院王仲远:世界模型的关键是真正预测下一个状态

0
分享至


经济观察报 记者 周悦

2025年,“世界模型”(World Model)成为AI领域最受关注的词汇之一。它指的是让AI理解世界运作规律,不再停留在识别或生成层面,而是能想象并预测世界的变化。

随着大模型红利逐渐减弱,各家公司都在寻找新的增长点。DeepMind推出可生成交互式3D世界的Genie 3,OpenAI继续强化 Sora的物理一致性;英伟达、华为、百度等也正从机器人与自动驾驶场景切入,让AI从看懂迈向参与。

10月30日,智源研究院发布悟界·Emu3.5多模态世界大模型。智源研究院院长王仲远在接受经济观察报等媒体采访时表示,随着互联网文本数据被充分利用,大语言模型的增长进入相对缓慢阶段,行业正在寻找新的突破口,而多模态与世界模型正是被寄予厚望的方向。

王仲远认为,Emu3.5很可能开启第三个规模定律范式(Scaling)。在语言预训练和推理优化之后,Emu3.5进一步证明,多模态模型同样具备可规模化成长的潜力。“它的最大贡献,是用自回归架构统一了图像、文本与视频的生成和理解。它能够预测下一个状态(Next-State),这一点非常接近人类大脑对世界进行理解的方式”。

与主流的Diffusion Transformer(DiT)架构不同,智源从“第一性原理”出发,构建原生多模态大模型。在Emu架构下,模型能在同一系统中完成感知、理解、推理与生成,形成一个可持续进化的世界模型。

智源研究院多模态大模型负责人王鑫龙介绍,Emu3.5基于超过10万亿token的多模态数据训练,其中视频数据累计时长达790年,参数规模为340亿。智源团队提出的“离散扩散自适应(DiDA)”推理方法,使图像生成速度提升近20倍,同时保持高质量输出。模型在三个维度上实现突破:一是从意图到规划,能够理解更高层级人类意图,例如,如何制作一艘宇宙飞船,并生成连贯的多步骤行动路径;二是动态世界模拟,能在统一框架内预测物理动态、时空演化与因果关系;三是泛化交互能力,为AI与人类及物理环境之间的协作提供认知基础。

针对外界将世界模型等同于视频生成的看法,王仲远不认同。他认为,世界模型的核心并非视频生成,而是对因果与物理规律的理解。比如机器人要抓起一杯靠近桌边的咖啡,它必须预测哪种动作会让杯子掉下去,哪种才安全——这才是真正的理解。

他认为,人类学习世界时不会区分语言或动作,Emu3.5也不限定用途。它既可支撑具身智能,也能生成多模态训练数据。在他看来,这不仅是一次架构创新,也展示了中国科研团队的原创路线,在世界模型这一尚未收敛的领域中,尝试提出自己的答案。

2024年10月,智源研究院发布了全球首个原生多模态世界模型悟界·Emu3。该模型仅基于“下一个token预测”机制。Emu3.5则在此基础上进一步完善,使AI具备更强的物理直觉与跨场景规划能力。

王仲远认为,未来的AI,不只是理解指令,而要理解世界本身,并在其中行动。

(作者 周悦)

免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。


周悦

TMT编辑,关注科技、大健康交叉领域,擅长行业研究,深度报道。“新闻是历史的初稿”。
欢迎联系:zhouyue@eeo.com.cn。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普宣称“与伊朗不会达成任何协议”

特朗普宣称“与伊朗不会达成任何协议”

新华社
2026-03-06 22:14:06
特朗普神操作!当众聊轰炸德黑兰+当面提C罗 梅西脚趾抠地全网爆火

特朗普神操作!当众聊轰炸德黑兰+当面提C罗 梅西脚趾抠地全网爆火

劲爆体坛
2026-03-06 08:50:03
特殊时点,金正恩再上“最大的船”

特殊时点,金正恩再上“最大的船”

中国新闻周刊
2026-03-06 18:14:11
下饭文化杀死了多少中国胃,一碗米饭的阴谋

下饭文化杀死了多少中国胃,一碗米饭的阴谋

富贵说
2026-03-05 15:56:38
中国女篮拒14分逆转双杀巴西获4连胜 刘禹彤17+7张子宇11分

中国女篮拒14分逆转双杀巴西获4连胜 刘禹彤17+7张子宇11分

醉卧浮生
2026-03-06 21:13:26
连民生用水都不能吐槽了吗?到底是谁在害怕?不去解决问题,解决提问题的?

连民生用水都不能吐槽了吗?到底是谁在害怕?不去解决问题,解决提问题的?

盐城市民网
2026-03-06 11:25:34
宁夏大学教授:为什么哈梅内伊不慌张?

宁夏大学教授:为什么哈梅内伊不慌张?

必记本
2026-03-06 18:21:35
重回国乒?尘埃落定,刘国梁发声,岗位曝光,布局国乒男队发展

重回国乒?尘埃落定,刘国梁发声,岗位曝光,布局国乒男队发展

卿子书
2026-03-06 09:25:27
伊拉克库尔德第一夫人宣言:我们不是任人驱使的炮灰!

伊拉克库尔德第一夫人宣言:我们不是任人驱使的炮灰!

胜研集
2026-03-06 13:44:23
外媒:中国防空又被打脸了?美军空袭摧毁伊朗一套红旗-2防空导弹

外媒:中国防空又被打脸了?美军空袭摧毁伊朗一套红旗-2防空导弹

近史博览
2026-03-07 02:15:04
今天,我无聊地想起了马杜罗……司机

今天,我无聊地想起了马杜罗……司机

忽然亦周
2026-03-06 09:59:41
神袍之下,三千亿财富帝国

神袍之下,三千亿财富帝国

老鹰哥
2026-03-04 09:52:15
安徽大学有学生研究哈梅内伊思想

安徽大学有学生研究哈梅内伊思想

深度报
2026-03-05 22:44:32
长城汽车魏建军承认抄袭路虎海报:责任主要在我,愿承担全部法律和经济责任

长城汽车魏建军承认抄袭路虎海报:责任主要在我,愿承担全部法律和经济责任

新浪财经
2026-03-06 20:19:19
国内成品油价格将迎调整

国内成品油价格将迎调整

环球网资讯
2026-03-06 10:08:08
伊朗反击变弱,导弹和无人机数量断崖式下降,这是一个危险的信号

伊朗反击变弱,导弹和无人机数量断崖式下降,这是一个危险的信号

麓谷隐士
2026-03-06 07:37:46
全国政协委员周世虹:建议废除劳务派遣制度,该制度已成为克扣和剥削劳动者收入的手段和工具

全国政协委员周世虹:建议废除劳务派遣制度,该制度已成为克扣和剥削劳动者收入的手段和工具

湖南法治报
2026-03-05 14:11:50
政府报告三提“休假”背后:一年117天假 为什么中国人还休不够

政府报告三提“休假”背后:一年117天假 为什么中国人还休不够

冷观互联网
2026-03-06 11:48:12
万万没想到!两会最火提案不是医疗和就业,而是霍启刚的这一举动

万万没想到!两会最火提案不是医疗和就业,而是霍启刚的这一举动

查尔菲的笔记
2026-03-05 20:24:50
广东一女子收到男友送的生日礼物刮刮乐花束,刮出一等奖80万元,最新回应:奖金将孝敬父母、旅游、存银行

广东一女子收到男友送的生日礼物刮刮乐花束,刮出一等奖80万元,最新回应:奖金将孝敬父母、旅游、存银行

大象新闻
2026-03-06 02:03:20
2026-03-07 02:59:00
经济观察报 incentive-icons
经济观察报
经济观察报是专注于财经新闻与经济分析的全国性综合财经类媒体。聚焦商道、商技和商机。
113384文章数 1606544关注度
往期回顾 全部

科技要闻

独家|除夕加班、毫无黑料!林俊旸无奈离场

头条要闻

伊朗:大规模发射新一代导弹 打击美军多个基地

头条要闻

伊朗:大规模发射新一代导弹 打击美军多个基地

体育要闻

跑了24年,他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

关于经济、股市等,五部门都说了啥?

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

亲子
教育
手机
家居
公开课

亲子要闻

一个不关心孩子的母亲,根本不会看到这个视频

教育要闻

校园食堂让机器人来掌勺!普陀小学引进智能烹饪机器人

手机要闻

荣耀600系列曝光:9000mAh+2亿像素+超声波指纹,这波堆料太狠

家居要闻

暖棕撞色 轻法奶油风

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版