网易首页 > 网易科技 > 网易科技 > 正文

生数科技朱军:通用世界模型是连接数字世界与物理世界的桥梁

0
分享至

(原标题:生数科技朱军:通用世界模型是连接数字世界与物理世界的桥梁)

3月19日,在中信证券举办的2026年春季资本市场论坛活动中,生数科技创始人、清华大学人工智能研究院副院长、ACM/IEEE/AAAI会士朱军教授发表题为《通用世界模型:连接数字世界与物理世界的桥梁》的主题演讲,系统阐述了生成式人工智能从“内容生成”迈向“物理世界”的关键技术路径。

他指出,随着统一模型架构逐步成型、数据范式持续完善,世界模型正迎来关键发展拐点,通用世界模型正在成为通向AGI(通用人工智能)的核心技术方向。

围绕这一方向,生数科技率先布局通用世界模型。于2025年7月和12月,公司联合清华大学相继发布了首个基于视频大模型的具身基础模型Vidar和统一架构的通用基座世界模型Motus。相较国际领先的 VLA 模型 Pi0.5实现约40%的成功率提升,并率先发现了通用世界模型在多种具身任务上的泛化能力。

会上,朱军系统介绍了生数科技的通用世界模型战略布局。以基座世界模型(Foundation World Model)为核心底层,向上延伸出覆盖数字空间与物理空间的双轨技术体系。

基座世界模型基于全球首创的U-ViT架构,积累视觉、听觉、触觉等多模态信息,构建对世界的统一认知与建模能力,为上层应用提供统一的智能底座。

在数字空间,生数科技基于世界生成模型(WGM)打造视频大模型产品 Vidu。Vidu生成模型聚焦单时点模拟世界,赋能AI在数字世界的生产力。流式生成模型,聚焦多时点模拟世界,实现实时陪伴和交互。Vidu显著提升了数字内容的生产效率,最终实现数字世界的AGI。

在物理空间,生数科技基于世界行动模型(WAM)构建统一世界模型产品Motus。Motus作为真实世界具身智能的“大脑”,致力于解决传统具身智能链路割裂、数据稀缺、泛化能力弱等核心痛点,可实现真实世界下的零样本泛化与跨本体适配,推动机器人从“模块化执行”向“统一智能体”跃迁,最终实现物理世界的AGI。

这一布局贯通了从“理解世界”到“生成世界”再到“行动于世界”的完整路径,使通用世界模型真正成为连接数字与物理世界的桥梁。

生成式AI迈入新阶段:从“生成内容”到“理解世界”

生成式人工智能正在进入新的发展阶段,其核心目标不再局限于内容生成,而是刻画并理解物理世界的复杂分布。

“生成能力本身正成为理解世界的重要基础,如果不能生成,就无法真正理解。”朱军指出。

从概率图模型到深度学习,再到大规模预训练、Transformer与扩散模型的兴起,技术路径不断演进,持续逼近通用人工智能的能力边界。朱军表示,生成式AI的演进,本质上是对世界建模能力的不断增强。

视频:连接数字与物理世界的关键载体

在这一过程中,AI的发展重心正从语言进一步延展至视频。

“相比语言,视频天然包含更丰富的时空信息与物理规律,是连接数字世界与物理世界的关键载体。”朱军指出,“视频不仅是内容形式,更是世界运行规律的记录方式。”

同时,视觉在人的认知体系中占据主导地位,机器要真正理解世界,也必须以视觉为核心进行学习。但仅依赖大语言模型仍难以构建完整的智能闭环。真正的智能系统需要具备从经验中学习、对未来进行预测并执行行动的能力,这一过程依赖与物理世界的持续交互。

数据破局:以视频为核心构建数据金字塔

在数据层面,具身智能长期面临“数据墙”:真机数据稀缺、成本高、难以复用。

针对这一问题,以视频为核心的数据路径正在成为行业共识。通过构建覆盖互联网视频、人类操作视频、仿真数据与机器人数据的多层数据体系,可以系统性挖掘视频中蕴含的物理交互信息。

“视频是目前规模最大、信息最丰富的数据形态,充分利用视频为主的可扩展、异构数据,是构建通用世界模型最可行的路径”朱军表示。

通过引入“隐动作(Latent Action)”等方法,模型可以将视频中的运动信息映射到动作空间,在缺乏大量真实机器人数据的情况下,依然具备有效的行动能力。

世界模型:从“模块拼接”走向“统一架构”

在上述背景下,通用世界模型正被视为实现通用人工智能的重要路径。

其核心目标是构建统一的智能系统,使AI能够完成从“观察世界”到“预测世界”,再到“在世界中行动”的完整闭环。然而,当前行业技术路径仍较为割裂:VLA模型侧重行为模仿,传统世界模型侧重未来预测,逆动力学模型聚焦动作生成,各自仅覆盖部分能力链路。

“世界模型不应是模块拼接,而需要像人一样,统一架构实现多种认知能力。”朱军表示。通用世界模型就是要在同一模型中融合感知、推理、预测与行动能力,构建类似人类“大脑”的整体智能结构。

统一世界模型Motus:开启具身智能多任务泛化与规模化演进新范式

基于上述数据与架构路径,生数科技联合清华大学开源的统一世界模型 Motus,实现了多模态能力的系统性整合。

在模型架构上,Motus基于 UniDiffuser 统一建模框架,通过跨模态先验融合(Cross-modal Priors Fusion),将视觉语言知识(VLM)、视频动态知识(Video Generation Model)与动作技能知识(Action Expert)整合进同一模型,实现语言、视频与动作的统一表达与生成,构建真正意义上的统一世界模型。

在数据利用与规模扩展方面,Motus展现出显著优势。在数据规模扩展实验(Data Scaling)中,相较国际领先的VLA模型 Pi0.5,Motus能够从更广泛的异构数据中学习,并有效融合预训练基座模型中的多模态先验能力。在50个任务的平均成功率上,Motus实现了35.1%的绝对提升,同时在相同性能水平下展现出13.55倍的数据效率。

在任务规模扩展实验(Task Number Scaling)中,随着任务数量增加,Motus的平均成功率持续提升,而对比模型Pi0.5则随任务复杂度提升出现性能下降。最终,Motus实现了37%的绝对成功率优势,体现出更强的多任务泛化能力。

更值得注意的是,Motus率先揭示了具身智能Scaling的新维度——多任务泛化能力曲线。这一曲线为具身基座模型提供了关键的“北极星指标”,其演进路径与语言模型的发展高度一致,也呼应了 GPT-2所提出的“Language Models are Unsupervised Multitask Learners”的核心思想,被喻为具身智能的“GPT2”时刻

在长程、多步骤的复杂真机任务中,Motus 进一步呈现出接近人类水平的决策逻辑与执行稳定性,需要强调的是,这些都不是简单的单步指令,而是典型的长程、多步骤任务,并且由模型端到端完成,而非依赖传统的“快慢双系统”拆分。

拐点已近:通用世界模型能力将持续跃迁

正如图灵奖获得者Richard Sutton 在《苦涩的教训》中所指出的,“利用计算能力的通用方法最终是最有效的,而且优势巨大”。这一判断正在AI发展路径中不断得到验证。

朱军表示,以视频为核心的可扩展异构数据体系,是构建通用世界模型最可行的路径,并逐步形成行业共识。随着统一模型架构、数据范式与训练体系的持续成熟,通用世界模型的技术路径日益清晰,行业正进入由规模驱动的能力跃迁阶段。

在这一趋势下,从视频生成走向世界模型,正成为AI从“理解世界”迈向“改变世界”的关键路径。随着相关技术不断演进,通用世界模型将加速走向物理世界,成为连接数字世界与物理世界的桥梁。

相关推荐
热点推荐
大选关键时刻,欧尔班的天塌了:匈军军官批评他,还揭他儿子的短

大选关键时刻,欧尔班的天塌了:匈军军官批评他,还揭他儿子的短

期盼美好明天
2026-04-05 03:19:52
四川即将迎来医疗报销新规,4月2日起看病轻松省钱!

四川即将迎来医疗报销新规,4月2日起看病轻松省钱!

天气观察站
2026-04-05 20:04:25
52岁艾滋女子自述:我隐瞒丈夫3年了,内心痛苦但害怕被抛弃

52岁艾滋女子自述:我隐瞒丈夫3年了,内心痛苦但害怕被抛弃

千秋文化
2026-03-29 20:52:42
你说这事邪不邪门?
世界杯、世锦赛都能横扫的猛将

你说这事邪不邪门? 世界杯、世锦赛都能横扫的猛将

小光侃娱乐
2026-02-18 21:05:03
新华社消息|特朗普称被击落战机飞行员全部获救 伊朗称击落一架美军搜救飞机

新华社消息|特朗普称被击落战机飞行员全部获救 伊朗称击落一架美军搜救飞机

新华社
2026-04-05 15:01:41
黄磊二女儿罕露面,12岁穿露腰装太成熟,眉眼比多多更像孙莉

黄磊二女儿罕露面,12岁穿露腰装太成熟,眉眼比多多更像孙莉

洲洲影视娱评
2026-04-04 16:19:13
五次交手三胜两负,赵心童决赛不败金身难保,10%言论成X因素!

五次交手三胜两负,赵心童决赛不败金身难保,10%言论成X因素!

夜深聊球
2026-04-05 18:12:55
亲人去世后,微信与支付宝余额、游戏账号、自媒体账号能继承吗

亲人去世后,微信与支付宝余额、游戏账号、自媒体账号能继承吗

澎湃新闻
2026-04-05 16:54:05
桥本赛后痛哭流涕!首次参赛止步8强 日媒:屈服世二后女队全出局

桥本赛后痛哭流涕!首次参赛止步8强 日媒:屈服世二后女队全出局

颜小白的篮球梦
2026-04-05 08:00:42
“鸟面妈妈”王小妞:不听劝阻生二胎,儿子遗传其外貌,现如何

“鸟面妈妈”王小妞:不听劝阻生二胎,儿子遗传其外貌,现如何

观察者海风
2026-03-24 23:04:30
爽飞!谢苗动作新片《火遮眼》豆瓣开分8.8:动作盛宴

爽飞!谢苗动作新片《火遮眼》豆瓣开分8.8:动作盛宴

小椰的奶奶
2026-04-05 18:47:57
国企严查令下发!6类历史遗留问题专项倒查,人人有责,绝不姑息

国企严查令下发!6类历史遗留问题专项倒查,人人有责,绝不姑息

吃货的分享
2026-04-05 20:15:05
海港跟队:奥斯卡将个人职业生涯巅峰期全部留给了海港

海港跟队:奥斯卡将个人职业生涯巅峰期全部留给了海港

懂球帝
2026-04-05 11:05:08
“科大男生9秒视频”火了,生猛操作令人叹为观止:不愧是高才生

“科大男生9秒视频”火了,生猛操作令人叹为观止:不愧是高才生

妍妍教育日记
2026-03-20 21:33:36
霍思燕素颜翻车?一家四口飞泰国参赛,12岁嗯哼逆袭少年感十足

霍思燕素颜翻车?一家四口飞泰国参赛,12岁嗯哼逆袭少年感十足

小椰的奶奶
2026-04-05 13:16:26
史上最愚蠢营救行动,造成大量人员伤亡,事后拒不道歉……

史上最愚蠢营救行动,造成大量人员伤亡,事后拒不道歉……

极品小牛肉
2024-08-24 19:35:51
伊朗大获全胜,这次彻底瞒不住!战斗现场惊现美军特战直升机残骸

伊朗大获全胜,这次彻底瞒不住!战斗现场惊现美军特战直升机残骸

甜柠聊史
2026-04-05 22:07:58
日媒:一伊朗籍男子在日本被殴打致死,警方展开调查

日媒:一伊朗籍男子在日本被殴打致死,警方展开调查

澎湃新闻
2026-04-05 13:11:12
2架美国“黑鹰”被伊朗山民击中!秘密武器遭曝光,伊朗:新防空系统将陆续亮相!特朗普40年前就说要“抢伊朗石油”、夺哈尔克岛

2架美国“黑鹰”被伊朗山民击中!秘密武器遭曝光,伊朗:新防空系统将陆续亮相!特朗普40年前就说要“抢伊朗石油”、夺哈尔克岛

每日经济新闻
2026-04-05 01:14:41
吴邦国委员长之父吴忠性简介:解放前拒绝去台湾,被誉为测绘将军

吴邦国委员长之父吴忠性简介:解放前拒绝去台湾,被誉为测绘将军

兴趣知识
2026-03-24 16:24:08
2026-04-05 23:08:49

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

4比3击败松岛辉空 王楚钦夺得生涯首个世界杯单打冠军

头条要闻

4比3击败松岛辉空 王楚钦夺得生涯首个世界杯单打冠军

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

房产
教育
本地
公开课
军事航空

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

教育要闻

公办名额断崖式下跌!河北单招2026年最大变局,这三类考生务必注意

本地新闻

跟着歌声游安徽,听古村回响

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美飞行员获救细节:美伊发生激烈交火 至少4死1伤

无障碍浏览 进入关怀版
×