车子像老司机一样,提前预判鬼探头的轨迹,丝滑避开了违停车的“开门杀”:
![]()
甚至看懂了对向交警那个不太标准的手势……
这一切对环境、目标行为的预判、推演,并不是在研发端的超级计算机上,就实时发生在你的智能汽车车载“大脑”中:
实时、在线、不卡顿。
那……得需要多大算力才能这么“秀”?说出来你可能不信:500多TOPS,就够了。
![]()
这是刚刚在北京车展上亮出量产方案的——轻舟智航,一家被被称为 “自动驾驶赛道上DeepSeek”的公司。
他们干了一件事:把“世界模型”装上量产车,而且只用500+TOPS。
![]()
别的厂商还在卷“千TOPS算力能不能跑满”,他们已经开始回答一个更本质的问题——
怎么用让AI模型,从模仿人类行为,到真正懂物理世界的规律法则。
轻舟智航的新世界模型
![]()
“物理AI,轻舟已至”,翻译一下就是:轻舟不光是做自动驾驶的,现在要干更“终局”的事儿——让AI真正理解物理世界。
而且,他们真拿出了东西。
“轻舟乘风MAX”方案,算力拉到500+TOPS,将实现车位到车位,全场景智能辅助驾驶的体验上来说,是今年“正正好”的配置。
![]()
因为过去几年的工程技术实践,已经给自动驾驶的能力—算力—成本描绘出了基本的对应框架。
比如百十来TOPS,只能“勉强”跑一个大幅蒸馏简化的端到端模型,也叫全场景,但体验下限很难保证;而1000TOPS左右的方案,对L2+需求来说过于冗余,成本太高,而对L4来说又明显不足。
轻舟给出的Demo视频,展示了几个硬核能力。
比如能看懂交警手势、潮汐车道:不是傻傻跟着车道线走,而是真能理解“警察叔叔让我先走”或者“这会儿这条道是反的”。
![]()
鬼探头、违停借道、窄路会车……这些老司机都头疼的场景,系统能“丝滑”处理,不是急刹到点头那种:
![]()
全黑、强光下也“稳如老狗”:晚上没路灯,或者出隧道瞬间被阳光晃瞎眼,它依然能稳稳开:
![]()
主动安全AEB,轻舟也卷上限:130公里时速极限刹停,但更加强调描述AEB本质的安全参数——误触发率:50万公里<1次,
行业平均水平是10-15万公里可能会给你来一脚“幽灵刹车”。
全场景车位到车位方案,一抓一大把,但很多方案有“断点”——比如一到无保护路口就怂了,一碰到施工就退出,雨天夜里直接摆烂。
轻舟乘风MAX的“进展”,核心就四个字:全场景覆盖。
不是90%场景能用,而是99%以上的场景都能用,而且用起来很“顺”,从敢用到愿意用。
就比如AEB一记莫名其妙的急刹,第一个后果就是后车真的会撞上来,更隐蔽的危险,其实藏在用户心里。
几次莫名其妙的急刹之后,会形成“系统不可信”的潜意识,不敢真正把控制权交给AI司机,而你越不相信它,就越不敢放手,自动驾驶公司越没法搜集足够多的数据去优化它……
不让用户在未知、无准备情况下接管兜底,随时绷紧神经,这才是轻舟新方案最大的价值。
怎么做到的?——物理AI统一架构,相当于给AI建了个“虚拟驾校训练营”。
核心是世界模型+强化学习,别被术语吓到,给你拆解一下。
传统自动驾驶技术体系,有点像一个死记硬背交规的新手司机——看到红灯就停,看到行人就等,但遇到没见过的复杂情况,比如多车多目标博弈的复杂场景,很有可能就懵了。
所以诞生了端到端,直接让AI司机学习人类成熟驾驶行为,理论无限趋近人类司机。可能更丝滑了,但数据的核心问题依然无解——处理极端场景的人类驾驶数据,太稀缺了。
![]()
所以世界模型成了现在最被认可的技术范式,相当于给AI装了个“世界模拟器”:AI能在脑子里想象出各种物理场景,比如车会怎么动、人会怎么走、雨天的刹车距离多长……就像你在玩一个极度逼真的赛车游戏,而且这个游戏里的物理规律和现实一模一样。
强化学习呢?就是让AI在这个“游戏”里无限试错。现实路测成本高、风险大,一天也跑不了几个极端场景。但在世界模型里,AI可以反复练习“鬼探头”“高速爆胎”“前车急刹”……练到AI算法有了“肌肉记忆”。
![]()
轻舟则把这个架构分成了云端和车端两部分:云端负责“做梦”——生成各种极端场景、训练AI;车端负责“实战”——用训练好的小模型实时决策。
而这样的技术范式转变,其实也彻底改变了智能辅助驾驶的竞争要素:关键不是车端跑什么模型,而是在云端的世界模型够不够强。
这套打法,不是PPT,是真的在跑,据透露已经进入量产阶段
轻舟智航怎么做世界模型?能算物理AI吗?
轻舟的世界模型不是单打独斗,而是“师徒搭档”。
云端世界模型相当于一个超级教练,它手里有一个“世界仿真引擎”和一个“安全强化学习模块”。
教练见过所有奇葩路况——从北京的早晚高峰到重庆的魔幻立交,从北欧的黑冰路面到东南亚的暴雨。它能生成这些场景,然后让AI在虚拟环境里反复练习。
核心技术两个,首先是高可控视频生成,是物理规则对齐的,比如一个车转弯,它的轨迹、速度、惯性都要符合现实。而且是从多视角BEV(鸟瞰视角)生成。
![]()
零样本生成引擎最神奇,用自然语言指令:“傍晚、小雨、一辆外卖电动车从公交站后面窜出来”,系统就能零样本生成对应的训练场景。
尤其是四大类——高可控交通流(比如突然加塞的车流)、障碍物难例(一个倒地的锥桶还是塑料袋?)、高危罕见场景(高速连环追尾)、恶劣天气(团雾、积水、炫光),不需要去路上真实采集,这种场景,研发路测数周也未必碰上一次,这意味着长尾场景的采集成本大幅下降。
解决了一个根本问题:
数字世界的AI(比如ChatGPT)可以无限重试、左右手互搏,迭代速度飞快。但类似自动驾驶这样真实物理世界中的AI,不可能在现实中复现各种good/bad case去学习。
在世界模型里做“驾驶训练”,把物理世界的规律搬进虚拟空间,让AI在里面穷举所有可能——从最常规到最离谱的,然后通过强化学习找到最优解。等到现实世界,它已经是个“老司机”了,不需要再从零试错。
![]()
车端世界行为模型是上场运动员。它不背厚厚的规则书,而是用一个小而美的“在线世界模型”实时理解周围环境的变化趋势——比如那辆并排的车是不是要别过来?那个小孩会不会突然冲上马路等等,然后实时修正行车轨迹。
今年1月轻舟官宣了VLA(视觉-语言-动作)模型,容易让外界有误解轻舟转换了技术路线,但CEO于骞向我们做了澄清:
主干一直都是世界模型,但有些场景需要推理,比如交警打了一个不标准的手势,或者施工牌上写着“借道逆行”,这时候光靠直觉不行,得动用语言理解,VLA干的就是Chain-of-Thought推理。
![]()
两者配合,世界模型常规和实施路径输出,VLA负责超出驾驶任务之外,但又会影响驾驶决策的“常识”对齐。
面对今年业内争议不断的VLA、世界模型路线问题,轻舟的立场是:第一性原理出发,从技术规律和用户价值证明,两者根本不矛盾,甚至缺一不可。
这个第一性原理,是轻舟智航首次提出的“物理AI第一性原理”:
百万辆L2+量产交付后,轻舟提出物理AI第一性原理
所有跟物理世界发生深度交互、处理复杂多任务的AI,都是物理AI。
和现在的大语言模型有本质不同。打个比方,你扔出一个玻璃杯,ChatGPT、DeepSeek、豆包等等语言模型知道“杯子会碎”,但它并不真正理解重力、硬度、动量这些物理量是如何在时空中相互作用的。
但物理AI不一样,模型建立了对三维空间、物理规律、物体持久性、因果关系的认知,尤其是万事万物的因果关系理解。
![]()
而从这个第一性原理出发,轻舟认为,自动驾驶公司不可能永远停留在“自动驾驶”层面。
因为自动驾驶从来就不是纯粹的软件问题,也不是纯粹的感知问题。它是一个典型的物理AI问题。
其实做自动驾驶的公司,从一开始就是在做物理AI,只是过去大家习惯用“L2”、“L4”这些标签来定义自己。
![]()
而如果一家自动驾驶公司只满足于做L2辅助驾驶、只满足于主机厂给的那份需求清单,那其实是在主动缩小自己的问题边界,用的技术体系是最初阶的——依赖路测、调参,迭代慢、成本高,长尾场景永远覆盖不完,只能模仿人类,永远无法超越人类。
自动驾驶真正进入落地实战阶段,无法真正产生用户价值。
而从技术出发,不想躺平的公司,一定会投入世界模型和强化学习。而一旦你投入了这些技术,你就不再是一家单纯的“自动驾驶公司”,你本质上已经是一家物理AI公司。
也只有将物理AI做好了,才能做出真正达到甚至超过人类水平的无人驾驶。
![]()
所以VLA和世界模型,在轻舟这里不是前后迭代关系,也不是双线“赛马”,而是在轻舟物理AI第一性原理下,自然而然的融合。
物理AI是一个更高维度的技术平台。一旦在这个平台上取得突破,它可以向下覆盖自动驾驶、机器人等多个应用场景。
轻舟的“不躺平”,表面看是智能汽车的产品力竞争客观需求,不做不行。
但从技术本质,以及轻舟长期的技术探索、布局来看,与其说“转型”,不如说自然而然的“能力溢出”更准确。
当然在上帝视角来看,这是AI浪潮趋势在一家自动驾驶公司身上最具象的体现。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.