网易首页 > 网易号 > 正文 申请入驻

智源研究院王仲远:世界模型的关键是真正预测下一个状态

0
分享至


经济观察报 记者 周悦

2025年,“世界模型”(World Model)成为AI领域最受关注的词汇之一。它指的是让AI理解世界运作规律,不再停留在识别或生成层面,而是能想象并预测世界的变化。

随着大模型红利逐渐减弱,各家公司都在寻找新的增长点。DeepMind推出可生成交互式3D世界的Genie 3,OpenAI继续强化 Sora的物理一致性;英伟达、华为、百度等也正从机器人与自动驾驶场景切入,让AI从看懂迈向参与。

10月30日,智源研究院发布悟界·Emu3.5多模态世界大模型。智源研究院院长王仲远在接受经济观察报等媒体采访时表示,随着互联网文本数据被充分利用,大语言模型的增长进入相对缓慢阶段,行业正在寻找新的突破口,而多模态与世界模型正是被寄予厚望的方向。

王仲远认为,Emu3.5很可能开启第三个规模定律范式(Scaling)。在语言预训练和推理优化之后,Emu3.5进一步证明,多模态模型同样具备可规模化成长的潜力。“它的最大贡献,是用自回归架构统一了图像、文本与视频的生成和理解。它能够预测下一个状态(Next-State),这一点非常接近人类大脑对世界进行理解的方式”。

与主流的Diffusion Transformer(DiT)架构不同,智源从“第一性原理”出发,构建原生多模态大模型。在Emu架构下,模型能在同一系统中完成感知、理解、推理与生成,形成一个可持续进化的世界模型。

智源研究院多模态大模型负责人王鑫龙介绍,Emu3.5基于超过10万亿token的多模态数据训练,其中视频数据累计时长达790年,参数规模为340亿。智源团队提出的“离散扩散自适应(DiDA)”推理方法,使图像生成速度提升近20倍,同时保持高质量输出。模型在三个维度上实现突破:一是从意图到规划,能够理解更高层级人类意图,例如,如何制作一艘宇宙飞船,并生成连贯的多步骤行动路径;二是动态世界模拟,能在统一框架内预测物理动态、时空演化与因果关系;三是泛化交互能力,为AI与人类及物理环境之间的协作提供认知基础。

针对外界将世界模型等同于视频生成的看法,王仲远不认同。他认为,世界模型的核心并非视频生成,而是对因果与物理规律的理解。比如机器人要抓起一杯靠近桌边的咖啡,它必须预测哪种动作会让杯子掉下去,哪种才安全——这才是真正的理解。

他认为,人类学习世界时不会区分语言或动作,Emu3.5也不限定用途。它既可支撑具身智能,也能生成多模态训练数据。在他看来,这不仅是一次架构创新,也展示了中国科研团队的原创路线,在世界模型这一尚未收敛的领域中,尝试提出自己的答案。

2024年10月,智源研究院发布了全球首个原生多模态世界模型悟界·Emu3。该模型仅基于“下一个token预测”机制。Emu3.5则在此基础上进一步完善,使AI具备更强的物理直觉与跨场景规划能力。

王仲远认为,未来的AI,不只是理解指令,而要理解世界本身,并在其中行动。

(作者 周悦)

免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。


周悦

TMT编辑,关注科技、大健康交叉领域,擅长行业研究,深度报道。“新闻是历史的初稿”。
欢迎联系:zhouyue@eeo.com.cn。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原来他是日本人!演了10年“鬼子”没火,如今靠着雷佳音终于红了

原来他是日本人!演了10年“鬼子”没火,如今靠着雷佳音终于红了

老范谈史
2026-01-07 15:52:08
大家都是怎么度过人生至暗时刻的?网友:记住无论多暗都不能灭!

大家都是怎么度过人生至暗时刻的?网友:记住无论多暗都不能灭!

另子维爱读史
2026-01-08 21:02:14
乌军2025年伤亡15万人,川普“夺取格陵兰岛”声东击西

乌军2025年伤亡15万人,川普“夺取格陵兰岛”声东击西

史政先锋
2026-01-07 21:59:13
四川农商行采购“乱象”:同款华为电脑,中标价相差1500元

四川农商行采购“乱象”:同款华为电脑,中标价相差1500元

野武士
2026-01-09 10:32:16
山姆一夜崩盘,3亿中产天塌了

山姆一夜崩盘,3亿中产天塌了

首席品牌观察
2026-01-09 15:57:31
4年2.75亿,浓眉哥目标明确!美媒建议老鹰4换1交易割爱状元郎

4年2.75亿,浓眉哥目标明确!美媒建议老鹰4换1交易割爱状元郎

锅子篮球
2026-01-09 15:53:36
北京市发布沙尘蓝色预警

北京市发布沙尘蓝色预警

界面新闻
2026-01-09 15:01:11
1月翻身转运:这三大生肖贵人相助,财运顺遂上扬

1月翻身转运:这三大生肖贵人相助,财运顺遂上扬

人閒情事
2026-01-07 13:44:15
湾区“变态妈”在自家$400万房子办高中生失控派对,竟全程围观

湾区“变态妈”在自家$400万房子办高中生失控派对,竟全程围观

北美省钱快报
2026-01-09 08:15:05
为何不许大陆统台?特朗普说了实话:中国统一后,将颠覆全世界

为何不许大陆统台?特朗普说了实话:中国统一后,将颠覆全世界

爱看剧的阿峰
2026-01-09 14:14:53
4年5500万!场均轰26+7+7,NBA最失望球队,把重建基石便宜卖掉了

4年5500万!场均轰26+7+7,NBA最失望球队,把重建基石便宜卖掉了

巴叔GO聊体育
2026-01-09 12:09:18
2299元的精品茅台上新首日“秒空”

2299元的精品茅台上新首日“秒空”

财闻
2026-01-09 14:05:31
揭秘《寻秦记》片酬:古天乐0片酬,林峯200W,白百何成最大赢家

揭秘《寻秦记》片酬:古天乐0片酬,林峯200W,白百何成最大赢家

八卦南风
2026-01-09 15:16:02
TVB红毯:佘诗曼风韵犹存,黄宗泽真老了,高海宁、陈自瑤太敢穿

TVB红毯:佘诗曼风韵犹存,黄宗泽真老了,高海宁、陈自瑤太敢穿

糊咖娱乐
2026-01-05 11:39:41
狐狸尾巴终究藏不住,他“妻妾成群”,大儿子和巩俐越长越像?

狐狸尾巴终究藏不住,他“妻妾成群”,大儿子和巩俐越长越像?

丰谭笔录
2026-01-03 07:50:06
2026土葬新规:深埋、不留坟头、不立碑!

2026土葬新规:深埋、不留坟头、不立碑!

达文西看世界
2026-01-09 14:12:49
于正怕是比吃苍蝇还难受!被他弃用的两个好苗子,如今红的发烫

于正怕是比吃苍蝇还难受!被他弃用的两个好苗子,如今红的发烫

东方不败然多多
2026-01-09 16:21:20
泽连斯基:有望在2026年上半年结束俄乌冲突

泽连斯基:有望在2026年上半年结束俄乌冲突

新京报
2026-01-08 07:48:07
安圣基葬礼,玄彬哭红了脸,朱智勋抬棺,郑雨盛抱着他的遗像!

安圣基葬礼,玄彬哭红了脸,朱智勋抬棺,郑雨盛抱着他的遗像!

好贤观史记
2026-01-09 14:28:22
伊朗外交部就美干涉主义立场发表声明

伊朗外交部就美干涉主义立场发表声明

国际在线
2026-01-08 06:43:10
2026-01-09 18:24:49
经济观察报 incentive-icons
经济观察报
经济观察报是专注于财经新闻与经济分析的全国性综合财经类媒体。聚焦商道、商技和商机。
112443文章数 1606317关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

10岁抗癌"小王子"病情加重:用药都已无效 不能吃饭

头条要闻

10岁抗癌"小王子"病情加重:用药都已无效 不能吃饭

体育要闻

金元时代最后的外援,来中国8年了

娱乐要闻

檀健次恋爱风波越演越烈 上学经历被扒

财经要闻

投资必看!瑞银李萌给出3大核心配置建议

汽车要闻

英伟达的野心:做一套自动驾驶的“安卓系统”

态度原创

家居
时尚
旅游
亲子
军事航空

家居要闻

木色留白 演绎现代自由

60+女性穿搭“高级感”秘诀:4个日常技巧,轻松美出优雅气质

旅游要闻

冬日入川,踏雪寻暖,赴一场冰与火的诗意邀约|长图

亲子要闻

检查结果出来松了口气,带着医生处方去拿药,没想到又出新插曲?

军事要闻

特朗普:已开始从委石油资源中赚钱

无障碍浏览 进入关怀版