5月26日,小米汽车正式抛出王炸——Xiaomi Auto World Model全新框架!一举打破自动驾驶世界模型行业僵局,直接登顶Waymo、nuScenes两大权威基准全面SOTA(最优),把智驾从“看见场景”推进到“能推演、会进化”的高阶时代!
![]()
一、行业百年痛点,小米一招破局
此前全球智驾世界模型,一直困在重建(WorldRec)、生成(WorldGen)二选一的死胡同:
- ✅重建路线:3D场景精准还原、高保真,但只能复刻已见画面,没有想象力
- ✅生成路线:能预测未来、脑补未知视角,但无3D结构,长视频必漂移失真
小米直接掀翻传统拆分路线,全球首次实现三维重建+视频生成深度耦合一体化架构,提出颠覆性范式:重建锚定几何、生成填补想象!
- 重建(WorldRec):稀疏3D锚点打牢物理地基,锁定场景几何,10秒视频10秒重建,提速1440倍
- 生成(WorldGen):4步去噪、单帧0.19秒极速生成,最长支持1分钟视频,脑补暴雨、落石、逆行等高危长尾场景
- 双向闭环:重建稳生成、生成扩重建,彻底根治长时序漂移,实现高稳定、高一致、高真实
![]()
二、硬刚全球基准,全维度碾压SOTA
成绩不掺水,数据说话!Xiaomi Auto World Model在两大顶流测试集全面登顶:
- ✅Waymo:重建精度PSNR=28.48,超行业最佳2.1dB,SSIM领先0.04
- ✅nuScenes:生成质量FVD=64.97,快同类自回归5.6倍,零样本泛化第一
- ✅核心指标:跨帧一致、时序稳定、细节逼真,全维度吊打英伟达、特斯拉方案
![]()
三、三大场景落地,智驾直接“开天眼”
不是实验室炫技!这套世界模型已全面落地小米汽车核心业务:
1. 合成数据:交付超10万条高质量数据,训练智驾感知模型,补齐罕见危险场景短板
2. 仿真测试:模拟极端天气、突发路况,事故复现、极限场景验证,让SU7/YU7智驾越练越强
3. 智能座舱:环境理解、意图预判升级,座舱更懂人、交互更自然
![]()
四、小米智驾跃迁:从感知→认知→进化
世界模型=自动驾驶的脑内模拟器!小米把智驾从“被动感知”拉到主动推演、场景进化新高度:
- 能预判:提前预测车辆、行人、障碍物下一步动作
- 会脑补:看不到的盲区、未发生的危险,AI自动推演
- 可进化:海量虚拟场景训练,越用越聪明、越开越安全
从SU7到YU7,小米智驾完成三代跃迁,XLA认知大模型+世界模型双剑合璧,中国智驾正式站上世界之巅!
![]()
五、行业震动:小米重新定义世界模型
英伟达Physical AI、LeCun世界模型、李飞飞空间智能……全球巨头扎堆押注,小米直接给出最优解!
打破重建/生成对立,一体化耦合成为新赛道;从“看风景”到“懂世界”,认知推演成智驾分水岭。
小米汽车,不止造车,重构自动驾驶底层逻辑,中国AI+汽车,硬实力领跑全球!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.