![]()
撰文 | 青竹 编辑|周长贤
物理AI成了智驾圈最新最统一的「信仰」。
截至目前,野心勃勃、有名有姓的几家,都跟物理AI绑定。差异只在细节和话术。
特斯拉的World Model探索,华为WEWA2.0赋能乾崑ADS 5.0,小鹏第二代VLA已加入X-World,Momenta的世界模型三层次,卓驭的物理基座大模型……都在以不同节奏向这一方向收敛。
范式名称各异,话术各有侧重,但底层逻辑一致:让AI真正理解物理世界和规律,而非仅靠数据拟合。
“范式都差不多,差别无非是谁真的在做,谁做得好。”一位智驾负责人表示,未来可能交替领先,但也不过2-3个月身位的差别,可是跑下去,总会有人掉队。
作为风格务实的智驾方案商,同样是世界模型+强化学习,轻舟智航有些独特的思考,值得大家共读。
例如:
物理AI不能简单复制LLMs的成功范式。单纯堆资源解决不了。
物理AI还需要2-3个大技术突破,世界模型或是其一。
自动驾驶数据的匀质性,被大多数讨论忽略。
世界模型在车端和云端同时存在,不是简单的蒸馏关系。
语言不会被抛弃,将来需要更高层级的语言长/深度思考。
L4运营的关键指标:一个人能看多少车。
![]()
2026北京车展上,轻舟物理AI模型发布之后,轻舟智航联合创始人、董事长兼CEO于骞和轻舟智航CTO李栋接受了群访,以下为QA精编:
问题:物理AI的发展程度?
于骞:物理AI的大范围普及,我觉得可能还有两到三个比较大的技术突破要完成,现在还做不到。不是单纯靠技术突破,也不是单纯靠堆资源就能解决。
自动驾驶是物理AI最大规模、最快能够落地的场景。首先数据不成问题,工程化、产品的形态已经比较完整,已经有很多基础。
问题:两到三个技术突破是?
于骞:其一很有可能就是世界模型。世界模型加强化学习就可以使物理AI应用非常大地提升。
问题:世界模型范式有何不同?
于骞:大语言模型有很多的数据,几乎涵盖人类知识的总结,输入以后预测下一个Token,是整个最底层的问题表述,当然也有加强化学习。
但物理世界模型,首先要求对物理世界有很强的感知,要理解世界,同时还要能够理解世界未来怎么变化,然后指导行动,几件事在一起,不是单点。
不是单纯堆资源就能垄断。
问题:数据处理有何不同?
李栋:语言模型的数据比较匀质,基本上所有的文字都可以转化成Token。
视觉模型最新的探索,包含机器人的本体数据。像自动驾驶,有非常多本体驾驶数据,非常友好。
但在更广的领域,本体数据非常稀缺,而且差异化非常大,不同的机器人数据不一样,自由度不一样。
还有视频类的数据,类似YouTube,要用起来都非常挑战,也是现在比较前沿的研究。
问题:智能驾驶有数据优势?
李栋:自动驾驶有天然优势,数据是比较匀质的,量非常大。训练世界模型,一方面能补充稀缺数据,另一方面,对世界的判断和理解能力,有通用性。未来去操作有更多自由度的机器人,做特定或通用的事情,有非常广阔的空间。
问题:智能驾驶的世界模型处于什么阶段?
李栋:在自动驾驶领域,处于应用阶段,已经做Demo接近量产。包括车上的世界模型,还有云端世界模型,都已经用于生产各种数据做模型训练。
但在一些高自由度、高复杂度的环境,世界模型还在偏研究阶段,很难直接生成比较复杂操作,简单动作可以,特定动作可以,泛化的动作比较难。
问题:智驾物理AI阶段,VLA的作用是?
于骞:VLA可以更好地应用于端侧,能更好用到语言和人类的经验,但并不根本,和世界模型并不矛盾。
问题:VLA能力未来会被抛弃吗?
李栋:即使模型特别厉害,总得和它交流,交流就涉及到语言。
而且语言模型有个特点,随着思考加深,能得到更好的通用能力,所以有额外算力的话,语言可以让整个模型的效果更好。
在应用中,即使在物理世界,语言虽不是最核心的模块,但不能抛弃。语言的思考能力比较独特,会给整个系统加分,在一些特殊场景需要这种思考能力。
将来,如果模型对物理世界特别理解,知道物体材质、运动规律、物理体验之后,可能会发现需要更高层级的语言长/深度思考,更多的需求会出来。
问题:大家的世界模型一样吗?
于骞:世界模型,其实有很多不同的理解,会有很多种流派,包括杨立昆和李飞飞都在不断探索。在学术领域还没有收敛,更别提在技术、工程落地方面,但是发展很快,我们要以开放的态度看待。
我们是比较务实的一家公司,不是什么新就用什么,我们非常非常克制。
问题:世界模型可以带智能驾驶走向终局吗?
于骞:我觉得应该是的,是很重要的技术方向,需要有很大很大突破。但是不是唯一的路,不是做完就完了,还有很多其他的工作要做。
问题:乘风Max这款产品引入了世界模型加强化学习,主要在云端?
于骞:当然车端布置,因为我们不可能在云端跑这种模型,所有安全性的东西必须在车端。
我们的世界模型,把端侧、云端一起考虑。并不是简单的蒸馏关系,模型学到的是物理世界大的分布。我们希望端侧学到的是整体分布本身,而不是某个局部。
问题:L2、L3和L4的关系?
于骞:L3肯定有价值,但如果使用范围非常小,只能在北京四环某一段路上开,那价值不够。目前边界/限制范围太多了。
不管是L2、L4,底层技术高度一致,都是要把车开得更好,只是产品形态不同,L4有L4的产品逻辑,L2有L2的产品逻辑,并不是说靠堆人来解决的。
李栋:底层技术能力越强,扩展新应用边际成本越低。就什么车都能开,什么场景都能解决,我们也在Robovan上看到这一点。
L4减去L2,就是安全运营,我们关注模型到底能支撑什么运营成本?成本边际效益是不是足够低?
问题:L4商业化的关键点?
李栋:模型的能力增强,L4的应用范围、运营效率就会越来越高。,比如说一个人可以看1,000辆车,L4就能非常好运营,这个指标非常关键。
今年我们会达到千台到万台车,达到大几千台车这样的运营水平,因为如果水平太差的话,没法运营起来。
问题:L4车型有什么区别?
于骞:我们的Robotaxi车从外观上看,根本看不出来这是Robotaxi,就像普通车一样。
底层的核心能力都是一样的,算法同源,只是产品形态不一样。算力更大,实际上是更强大脑,范式是一样,只是模型能力大一些。
L4要加各种各样的安全冗余、硬件冗余、传感器冗余,硬件一定是能量产的,如果不能量产,我们肯定不要。
问题:关于标配和国产化?
于骞:今年一两百TOPS算力算主流了,明年相信500TOPS算力开始标配。未来几年所有的车都会智能化,包括油车。
我们不断革自己的命,500+TOPS算力方案,目标是奔着一两千TOPS算力的体验,就是越级的体验,这就是差异化,是给客户、消费者带来的真实价值。
(以上文字经过不改语意的精编)
—THE END—
出行百人会 | AutocarMax
追踪出行与智能产业链进化,关注新产品、新科技、商业逻辑与人物,影响有影响力的人。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.