网易首页 > 网易号 > 正文 申请入驻

智源研究院王仲远:世界模型的关键是真正预测下一个状态

0
分享至

经济观察报 记者 周悦

2025年,“世界模型”(World Model)成为AI领域最受关注的词汇之一。它指的是让AI理解世界运作规律,不再停留在识别或生成层面,而是能想象并预测世界的变化。

随着大模型红利逐渐减弱,各家公司都在寻找新的增长点。DeepMind推出可生成交互式3D世界的Genie 3,OpenAI继续强化 Sora的物理一致性;英伟达、华为、百度等也正从机器人与自动驾驶场景切入,让AI从看懂迈向参与。

10月30日,智源研究院发布悟界·Emu3.5多模态世界大模型。智源研究院院长王仲远在接受经济观察报等媒体采访时表示,随着互联网文本数据被充分利用,大语言模型的增长进入相对缓慢阶段,行业正在寻找新的突破口,而多模态与世界模型正是被寄予厚望的方向。

王仲远认为,Emu3.5很可能开启第三个规模定律范式(Scaling)。在语言预训练和推理优化之后,Emu3.5进一步证明,多模态模型同样具备可规模化成长的潜力。“它的最大贡献,是用自回归架构统一了图像、文本与视频的生成和理解。它能够预测下一个状态(Next-State),这一点非常接近人类大脑对世界进行理解的方式”。

与主流的Diffusion Transformer(DiT)架构不同,智源从“第一性原理”出发,构建原生多模态大模型。在Emu架构下,模型能在同一系统中完成感知、理解、推理与生成,形成一个可持续进化的世界模型。

智源研究院多模态大模型负责人王鑫龙介绍,Emu3.5基于超过10万亿token的多模态数据训练,其中视频数据累计时长达790年,参数规模为340亿。智源团队提出的“离散扩散自适应(DiDA)”推理方法,使图像生成速度提升近20倍,同时保持高质量输出。模型在三个维度上实现突破:一是从意图到规划,能够理解更高层级人类意图,例如,如何制作一艘宇宙飞船,并生成连贯的多步骤行动路径;二是动态世界模拟,能在统一框架内预测物理动态、时空演化与因果关系;三是泛化交互能力,为AI与人类及物理环境之间的协作提供认知基础。

针对外界将世界模型等同于视频生成的看法,王仲远不认同。他认为,世界模型的核心并非视频生成,而是对因果与物理规律的理解。比如机器人要抓起一杯靠近桌边的咖啡,它必须预测哪种动作会让杯子掉下去,哪种才安全——这才是真正的理解。

他认为,人类学习世界时不会区分语言或动作,Emu3.5也不限定用途。它既可支撑具身智能,也能生成多模态训练数据。在他看来,这不仅是一次架构创新,也展示了中国科研团队的原创路线,在世界模型这一尚未收敛的领域中,尝试提出自己的答案。

2024年10月,智源研究院发布了全球首个原生多模态世界模型悟界·Emu3。该模型仅基于“下一个token预测”机制。Emu3.5则在此基础上进一步完善,使AI具备更强的物理直觉与跨场景规划能力。

王仲远认为,未来的AI,不只是理解指令,而要理解世界本身,并在其中行动。

(作者 周悦)

免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。

周悦

TMT编辑,关注科技、大健康交叉领域,擅长行业研究,深度报道。“新闻是历史的初稿”。
欢迎联系:zhouyue@eeo.com.cn。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
佩顿:若詹姆斯离开湖人他会去勇士,但珍妮-巴斯不太可能放人

佩顿:若詹姆斯离开湖人他会去勇士,但珍妮-巴斯不太可能放人

懂球帝
2026-05-12 21:20:44
顾客万元苹果手机遗落卫生间 被海底捞保洁藏匿邮寄 当事人报警希望追责 警方不予立案 律师:侵占罪是自诉案件 警方无权立案侦查

顾客万元苹果手机遗落卫生间 被海底捞保洁藏匿邮寄 当事人报警希望追责 警方不予立案 律师:侵占罪是自诉案件 警方无权立案侦查

闪电新闻
2026-05-12 19:52:27
情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

新欧洲
2026-04-21 19:37:05
尼日尔撕毁4亿美元合同,并驱逐中方高管,我方暗藏后手漂亮反击

尼日尔撕毁4亿美元合同,并驱逐中方高管,我方暗藏后手漂亮反击

诡谲怪谈
2025-04-30 22:17:42
查扣电动车全面叫停,工信部定调:民生刚需优先,百姓要啥造啥

查扣电动车全面叫停,工信部定调:民生刚需优先,百姓要啥造啥

坠入二次元的海洋
2026-05-12 06:15:38
56岁张嘉益现状,住西安大别墅,二婚娶女演员,如今新剧获赞

56岁张嘉益现状,住西安大别墅,二婚娶女演员,如今新剧获赞

标体
2026-05-12 19:18:39
49岁蒋友柏罕晒房子!外形大变,家里规矩多,网友:好严格的人类

49岁蒋友柏罕晒房子!外形大变,家里规矩多,网友:好严格的人类

艺能八卦局
2026-05-12 06:10:27
九寨沟实行“双向检票”?工作人员:出园检票并非新政策,一直严禁沟内住宿

九寨沟实行“双向检票”?工作人员:出园检票并非新政策,一直严禁沟内住宿

上游新闻
2026-05-11 15:40:24
林浩:汶川地震9岁小英雄,被姚明抱上奥运,发誓考清华,现状如何

林浩:汶川地震9岁小英雄,被姚明抱上奥运,发誓考清华,现状如何

阿伧说事
2026-05-12 12:24:10
王海:举报拍黄瓜错在哪?别在道德绑架职业打假人

王海:举报拍黄瓜错在哪?别在道德绑架职业打假人

映射生活的身影
2026-05-12 14:45:05
啧啧啧,现在的电风扇把空调都卷死了!

啧啧啧,现在的电风扇把空调都卷死了!

徐静波静说日本
2026-05-12 07:29:24
1952年许世友返乡,不顾老母亲下跪劝阻,掏出枪对准三叔:毙了你

1952年许世友返乡,不顾老母亲下跪劝阻,掏出枪对准三叔:毙了你

云端小院
2026-05-12 06:41:03
这一次,被韩媒愤怒批评的张本智和,终究是为父母的荒唐买了单

这一次,被韩媒愤怒批评的张本智和,终究是为父母的荒唐买了单

圆梦的小老头
2026-04-23 12:00:21
上海一医院300斤“重磅”医生火出圈!“过劳肥算工伤”具象化了!

上海一医院300斤“重磅”医生火出圈!“过劳肥算工伤”具象化了!

新民晚报
2026-05-12 18:07:01
携程再次卷入“大数据杀熟”争议:钻石会员订房比普通会员贵一倍

携程再次卷入“大数据杀熟”争议:钻石会员订房比普通会员贵一倍

识礁Farsight
2026-05-12 21:44:56
动车卧铺加装窗帘走红被赞私密性大大提升 12306工作人员:未接到相关通知

动车卧铺加装窗帘走红被赞私密性大大提升 12306工作人员:未接到相关通知

闪电新闻
2026-05-12 16:38:38
血赚!曼联力压切尔西捡漏顶级中卫,3650 万水货离队倒计时

血赚!曼联力压切尔西捡漏顶级中卫,3650 万水货离队倒计时

澜归序
2026-05-13 04:38:16
切尔西·汉德勒自曝2010年爱泼斯坦晚宴细节:8人小聚,她当面调侃伍迪·艾伦

切尔西·汉德勒自曝2010年爱泼斯坦晚宴细节:8人小聚,她当面调侃伍迪·艾伦

影视情报室
2026-05-12 06:05:35
小宝与王某雷,谁探访花的数量更多?

小宝与王某雷,谁探访花的数量更多?

挪威森林
2026-01-31 12:15:26
李楠当助教忙坏!频繁与杰曼赵睿沟通,大喊指挥,还能吸取建议!

李楠当助教忙坏!频繁与杰曼赵睿沟通,大喊指挥,还能吸取建议!

篮球资讯达人
2026-05-13 02:13:12
2026-05-13 08:04:49
经济观察报 incentive-icons
经济观察报
经济观察报是专注于财经新闻与经济分析的全国性综合财经类媒体。聚焦商道、商技和商机。
114592文章数 1606835关注度
往期回顾 全部

科技要闻

谷歌剧透安卓重大升级 Gemini深度集成底层

头条要闻

凯文·沃什出任美联储主席 其岳父是特朗普总统的老友

头条要闻

凯文·沃什出任美联储主席 其岳父是特朗普总统的老友

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

健康
教育
家居
房产
手机

干细胞能让人“返老还童”吗

教育要闻

600分以下想要本科就业,如何报志愿

家居要闻

极简主义下的居住场域与空间

房产要闻

穗八条引爆楼市!万博宝藏红盘,五一劲销出圈

手机要闻

谷歌安卓17新增系统验证功能:Pixel手机首发,识别恶意仿冒系统

无障碍浏览 进入关怀版