网易首页 > 网易号 > 正文 申请入驻

号称能造虚拟世界的AI:换个角度就穿帮,一用就撞墙

0
分享至



现在“世界模型”这词儿太火了,动不动就号称能生成整个虚拟世界。

可你仔细一看——画面是高清了,车也跑得挺溜,但换个角度就穿模,规划器一进去就撞墙。



看起来像世界,用起来像纸糊的,咱们到底该拿什么尺子量它?

最近,一个叫WorldLens的新评测框架横空出世,直接把“世界模型”的底裤都快扒下来了。



周叔一直关注自动驾驶和AIGC的进展,这几年生成式模型确实突飞猛进。

从单视角行车记录仪视频,到可控、多视角、长时序的4D场景,技术演进肉眼可见。

但问题也来了——当一个模型自称“世界模型”,我们真该只看它画得多像吗?



他们指出,传统指标如LPIPS、FVD只能衡量“像不像视频”,却完全忽略了几何一致性、物理合理性、行为可执行性这些决定模型能否落地的核心属性。

于是,WorldBench团队搞出了WorldLens。



这是目前业内首个覆盖五大维度的全谱系评测体系:生成、重建、指令跟随、下游任务、人类偏好。

它不追求一个总分,而是像体检一样,逐项排查模型在真实应用中的“健康状况”。



比如在“重建”环节,WorldLens会把生成视频反向重建为4D高斯场,再从新视角渲染。

结果发现,很多模型在原视角看着没问题,一换角度就冒出大量“floaters”(悬浮几何碎片)。

纹理再真,结构一塌糊涂,根本撑不起一个“世界”。





咱们再聊聊最扎心的部分:开环看着行,闭环立马崩。

WorldLens专门设计了“指令跟随”测试:把生成的世界喂给一个预训练的自动驾驶规划器,看它能不能安全跑完路线。



结果令人警醒——几乎所有模型在开环(即不反馈控制)下表现尚可,但一旦进入闭环(规划影响车辆状态),碰撞、越界、路线中断频发。

误差在时序中不断累积,微小的几何偏差最终酿成“事故”。

更值得警惕的是下游任务表现。

有些模型生成的画面堪称电影级,但拿来训练BEV分割或3D检测模型时,性能反而暴跌30%–50%。



原因很简单:合成数据分布与真实世界错位,几何噪声大,时序不稳。

“好看”不等于“有用”,甚至可能毒化训练。

而最妙的是第五维度——人类偏好。



基于此,他们训练出WorldLens-Agent,一个能模拟人类判断的自动评估器。

这意味着,主观感受也能被量化、被学习、被规模化应用。



截至目前,WorldLens已评测包括MagicDrive-V2、DiST-4D、DriveDreamer-2、Panacea等十余个主流开源模型。



结果很一致:没有一个模型能在五个维度上全面领先。

有的强在纹理生成,弱在几何;有的重建稳定,但行为不合理;还有的开环流畅,闭环失控。

几何与时序稳定性,成了横跨所有任务的“共同瓶颈”。



这也解释了为何某些“高清模型”在仿真中频频翻车——世界不是靠像素堆出来的,而是靠结构撑起来的。

值得一提的是,WorldLens的代码、数据集和Leaderboard均已开源。

团队明确表示:欢迎全球研究者提交模型,共建公平、透明的评估生态。





当AI从“生成内容”迈向“构建世界”,评估标准必须同步升级。

WorldLens的意义,不仅在于暴露现有模型的缺陷,更在于为行业树立了一套“世界属性”的度量衡。

未来的竞争,不再是“谁的画面更美”,而是“谁的世界更真、更稳、更可用”。

只有经得起几何、物理、行为与人类判断四重拷问的模型,才配称一声“世界模型”。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
三士兵杀害多名战友后叛逃金门马祖,中央严令空军:坚决截杀!

三士兵杀害多名战友后叛逃金门马祖,中央严令空军:坚决截杀!

阿胡
2024-03-06 13:44:40
惊人的婚外情12大定律 ,没人能逃得过 ,男女必知!

惊人的婚外情12大定律 ,没人能逃得过 ,男女必知!

风起见你
2026-01-06 05:46:02
中俄情侣的生理差异:婚前未了解或引发婚后矛盾

中俄情侣的生理差异:婚前未了解或引发婚后矛盾

特约前排观众
2025-12-16 00:10:07
再抠门,也不要在网上买这6样东西,会致癌,看完真会后怕的!

再抠门,也不要在网上买这6样东西,会致癌,看完真会后怕的!

室内设计师有料儿
2026-01-05 15:51:29
老了才明白:父母一旦超过73!立刻停止3种行为,否则晚景会凄凉

老了才明白:父母一旦超过73!立刻停止3种行为,否则晚景会凄凉

阿凯销售场
2026-01-06 03:54:13
国乒首个离队教练曝光!林诗栋恩师退休,石头能否适应新教练存疑

国乒首个离队教练曝光!林诗栋恩师退休,石头能否适应新教练存疑

三十年莱斯特城球迷
2026-01-05 22:39:43
女性的私处哪种形态更好?女性阴部的形状类型有哪些?不妨来了解

女性的私处哪种形态更好?女性阴部的形状类型有哪些?不妨来了解

医者荣耀
2025-12-25 12:05:06
最近,美国连续扣押多艘中国商船,中国是如何反击的?

最近,美国连续扣押多艘中国商船,中国是如何反击的?

阿胡
2025-12-23 17:56:32
纪实:湖南漂亮18岁女大学生和父亲西藏自驾游,回来后母亲崩溃了

纪实:湖南漂亮18岁女大学生和父亲西藏自驾游,回来后母亲崩溃了

红豆讲堂
2024-10-09 11:15:47
逆天言论!韩国瑜:台湾是全球华人中唯一能做到“100%民主”地区

逆天言论!韩国瑜:台湾是全球华人中唯一能做到“100%民主”地区

南权先生
2026-01-04 16:26:57
闫学晶回应质疑:你们能和我比吗?都是酸黄瓜,欠揍的话不要讲

闫学晶回应质疑:你们能和我比吗?都是酸黄瓜,欠揍的话不要讲

阿纂看事
2026-01-03 16:07:39
广东3消息!徐杰带伤空砍22分,胡明轩头号罪人,麦考尔提前复出

广东3消息!徐杰带伤空砍22分,胡明轩头号罪人,麦考尔提前复出

多特体育说
2026-01-05 22:58:05
29岁袁心玥近况,上任新岗位,年薪不菲,退役后越来越美了

29岁袁心玥近况,上任新岗位,年薪不菲,退役后越来越美了

大西体育
2026-01-05 14:33:37
果不其然!韩国第一夫人抵达北京造型没有换装,蹲着接鲜花好开心

果不其然!韩国第一夫人抵达北京造型没有换装,蹲着接鲜花好开心

锋哥与八卦哥
2026-01-05 14:40:04
苦酒:一杯液态的沉默

苦酒:一杯液态的沉默

疾跑的小蜗牛
2026-01-05 23:01:07
价格大跳水!暴跌76%!深圳人可以捡漏了......

价格大跳水!暴跌76%!深圳人可以捡漏了......

深圳晚报
2026-01-05 15:00:04
我奶奶打了我妈一巴掌,我爸默不作声,随即拉住我妈:咱们搬出去

我奶奶打了我妈一巴掌,我爸默不作声,随即拉住我妈:咱们搬出去

五元讲堂
2026-01-05 07:55:03
成都一在建工地塔吊坍塌致5死,12名公职人员被追责问责

成都一在建工地塔吊坍塌致5死,12名公职人员被追责问责

界面新闻
2026-01-05 17:09:16
刚刚!天津版“唐山宴”紧急通告:暂停试营业!大伙儿别跑空!

刚刚!天津版“唐山宴”紧急通告:暂停试营业!大伙儿别跑空!

天津生活通
2026-01-05 19:24:11
委副总统已代理总统职权,特朗普称要“管理”委内瑞拉,多国要求美释放马杜罗夫妇

委副总统已代理总统职权,特朗普称要“管理”委内瑞拉,多国要求美释放马杜罗夫妇

环球网资讯
2026-01-05 07:13:30
2026-01-06 06:39:00
软妹酸奶
软妹酸奶
软妹酸奶
156文章数 131关注度
往期回顾 全部

科技要闻

4100家科技企业集结赌城,CES揭开AI新战场

头条要闻

马杜罗庭审陈词:我是一个正派的人 是我们国家总统

头条要闻

马杜罗庭审陈词:我是一个正派的人 是我们国家总统

体育要闻

50年最差曼联主帅!盘点阿莫林尴尬纪录

娱乐要闻

《探索新境2》王一博挑战酋长岩

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

海狮06EV冬季续航挑战 "电"这事比亚迪绝对玩明白了

态度原创

家居
健康
旅游
教育
军事航空

家居要闻

白色大理石 奢华现代

这些新疗法,让化疗不再那么痛苦

旅游要闻

198.33万人次市民游客元旦假期畅游浦东,文旅市场迎来开门红

教育要闻

河北科大录取通知书没收到?3招快速查询!

军事要闻

马杜罗预计5日在纽约"首次出庭"

无障碍浏览 进入关怀版