![]()
![]()
“自动驾驶卖的不是软件,是时间。用世界模型“合成钻石”,在冰山之下重构竞争规则。”
作者|王蕊
编辑|西子
“过去大家觉得数据是钻石,但是现在可以人工合成钻石了,有一些长尾效应的数据可能比较值钱,但是不需要那么多了,数据已经没有那么值钱了。”
这是文远知行创始人兼 CEO 韩旭,在 2025 智驾天梯榜年度论坛上抛出的炸场观点!
对当下各技术路线、甚至“技术名词”之间的博弈,韩旭也给出了自己的回应。
一段式端到端与两段式、VLA 与世界模型的路线论战从未停歇,谁的技术更先进?韩旭直言,他早已厌烦这种技术名词本身的迷信和博弈。
在他看来,这类争论更像评书里“罗成的枪、李元霸的锤谁更厉害”,热闹,没有标准,也无法回答。
![]()
韩旭认为,自动驾驶真正成熟的时间窗口,大致会在 2032—2033 年,届时系统能力有望整体超越人类驾驶。
但要抵达这一阶段,行业必须完成关键跨越——从依赖相关性解释的 “蒙昧时代”,迈入以因果性为核心的 “开明时代”。系统为什么能通过复杂场景?换一个场景还能不能持续稳定运行?这些直击本质的问题,才是技术实力的真正试金石。
在台州和温州两站智驾大赛中,星途星纪元上搭载的博世文远方案,连续夺冠并实现零接管。
![]()
韩旭系统性拆解了背后的核心逻辑:一方面通过 GENESIS 世界模型,生成高逼真虚拟数据,实现 “以一当万”,彻底打破对海量实车路测的依赖;另一方面将 L4 运营阶段积累的安全体系与工程经验下沉,全面赋能 L2++ 量产车型。
从攻克 QNX 实时操作系统的工程化难关,到反对 “路线即真理” 的技术迷信;从 “如今可人工合成钻石” 的全新数据观念,到点透自动驾驶 “卖的不是软件,而是时间” 的商业本质,韩旭始终在试图把行业从概念的喧嚣中拉回现实。
以下内容根据韩旭在会上的发言整理:
别迷信于名词
文无第一,武无第二。
为什么起这个 Title?因为我已经厌烦透了人们天天问我说,韩总,或者 Tony,听说你们是一段式端到端,但是某某使用了世界模型技术比你更厉害,你怎么回答?
他说他的技术比你更先进,所以我的回答就是这句话。
一段式端到端还是两段式,VLA 还是世界模型,到底谁更厉害,谁开得更好?
![]()
我从来都不迷信一段式端到端这个词,一段式端到端我不觉得是用了就好,应该是文远知行厉害才可以用出来一段式端到端。那么多人都想做一段式端到端,为什么别人没train(训练)出来?
这里面有很多的坑,因为我自己搞技术的我知道,大家都是一段式端到端,到最后的时候这个车的模型那么小,你怎么把一个很大的模型塞进去?过去老说我要做float(32位)、double(64位),最后4个bit,怎么把这个网络弄出来?里面有很多的细节,这些细节其实才是成败的决定。
重要的是把问题解决,这就是第一性原理。实际上马斯克不怎么强调一段式端到端,他是强调用AI做这些事,我们其实很多时候都是真抓实干做这件事情。
我觉得现在这个行业有点像评书。你说 VLA 很好,我说世界模型好;你说基于规则的 optimization(优化)方法可以保证你不违章,我说我丝滑。这真的就像说评书一样,到底是罗成的枪厉害,还是李元霸的锤厉害,还是宇文成都的镗厉害?谁厉害?
如果你搞清楚了相关性与因果性的区别,你就分出了科学与迷信的差别。我们希望智驾从蒙昧走向开明时代,它不是去争名词,不是去争路线,而是把因果性找到,而去除掉相关性。
![]()
现在很多讨论,本质上还是在相关性里打转。你看到了某一个方法在某些场景下效果好,就觉得它一定更先进;你看到某个系统在视频里跑得很丝滑,就觉得它一定是更正确的方向。但这些都只是相关性。
真正重要的是因果性。你这个系统为什么能过?这个场景它为什么能过?换一个场景它还能不能过?哪些东西是决定性的,哪些只是表象?如果你没有把这些因果关系搞清楚,其实你只是从一个名词迷信,换成了另一个名词迷信。
拿一个差的操作系统堆上一段式端到端也不行,有很多事情,你看到的1/10、冰山一角,后面巨大的冰山在做工作。
一段式还是两段式?如果你真的做得对,拿两段式端到端再加上 language model,一样可以做得好,关键是看你的水平。
infrastructure(基础设施),你说我也用世界模型,但你产生出来的数据如果很差的话也没用。如果你产生的数据模型,比如你想的小龙女是李若彤的小龙女,最后出来的数据是岳云鹏扮演的小龙女,大家都可以产生一个小龙女,你要是产生的小龙女是岳云鹏那样的,那有还不如没有。
别迷信于名词。
数据已经没那么值钱了
最近两站智驾大赛,大家可以去看结果,文远知行和博世是怎么拿的第一?这里面有一个重要的事情,曾经有很多车厂说过,我有几十万辆、上百万辆车在外面跑,数据碾压你,文远没有数据,博世有一些数据可能也不一定给你用,而且很多数据你都是从车上来的。
很简单,就是一句话,我们不能在低维跟你拼数据,我们就要在高维上产生数据,以假乱真。
所以文远知行做了一个真正的世界模型,非常逼真的,我们叫 GENESIS,让文远知行的数据以一当万。这就是我们做的硬碰硬的、拿第一的工具,我们有一套以一当万的数据产生系统。
![]()
大家知道广州不下雪的,这是我们虚拟的下雪的场景。特斯拉的高光,摄像头最怕高光,我们虚拟出来高光曝光的场景,夜晚下雪,我不告诉你,你看不出来是真的还是假的,我们就用这样的数据来训。我想虚拟什么场景虚拟什么场景,我省很多钱,也不用产那么多车、产生那么多流量,虚拟就好了,你出 VLA、WA 等等我都可以在云端做,这是非常非常有价值的。

从车厂拿数据对我们比较难,有时候车厂会给一些数据,但是车型不多,数据也不多,很多主流车厂会说你们技术再好又怎么样,你没有数据,数据在我手里,我不能把灵魂给你,数据在我手里。
但是我今天想说的一点是,数据这事过去就是说你觉得你有几颗钻石,你有钻石矿,现在我们想说的是,现在我可以人工合成钻了,那个钻石已经没有那么值钱了,这是我今天第一炸裂要告诉大家的,钻石没那么值钱了,合成数据很重要,为什么 AI Model 是热点,我要帮大家看这个事,现在数据驱动,有一些长尾效应的数据可能比较值钱,但是不需要那么多了,数据已经没有那么值钱了。
![]()
把 L4 的极致安全,下移到 L2++
所有的这种 corner case 我想告诉大家是极难捕捉的,我们可以生成很多,但是它是可以救人命的。我是真正把 L4 级别无人驾驶的运营放到 L2++ 上。我们也希望把这样的能力做到奇瑞的星途新纪元上,也希望把它做到广汽埃安上,现在我们两个很好的客户,希望两家的车大卖。
三年以前大家说城区 NOA 都是发烧友做的,只有极少的人用,高于 70 TOPS 的算力是不需要的,而那个时候文远知行坚持接着做高算力,把 L4 下移到 L2、L3,我们跟博世合作努力了三年,才有今天的成绩。我不是非常激进地吹,但是我认为2032 到 2033 年的时候,自动驾驶的发展应该比人开得好了,这是我的判断。

我们大约两三年之前做量产,我们完全没有量产经验的,非常感谢博世,博世属于老大哥带小弟弟,或者说老将带新兵的这么一个组合,我们合作两年里有很多坎坷。第一,我们解决了工程化能力的事情,这件事不是那么简单的,尤其是对于 L4,所谓 L4 天天讲,我们都是 AI 出身、大模型,一开始都是硅谷出来的,是硅谷范儿。
我记得我在博世的苏州厂里驻了两周,我当时跟博世说,大家都 Linux,你能不能别折腾我们了,QNX 所有的算子都要重写,内存也不够。博世说不行,这是我们德国安全的标准,你就必须这么干,真的是没办法。
不丢包、不延时,它是第一个实时操作系统,抢占多任务的意思是说,我给你发一个任务过去,正常 Linux 回你的时候,它不一定回你,他忙就不回你了,但是 QNX 是到时间必须回,这个就难。
刚才大宇总说冰山下面的东西,我回应一下,冰山下面的东西就是,你买一支笔我也买一支笔,但是我这个笔在任何时候、写到笔干的那一刻都不断墨,这件事就很难。博世特别善于做这个事,所以为什么大家都愿意用博世的东西,可能价格高一点,但是人家的质量在这儿。
![]()
怎么评价人形机器人,就怎么评价自动驾驶
All in all,大家还是要看一些技术细节。
商业上的价值产生的原因就是以要让消费者愿意买单,就是你产生价值,什么价值?就是你帮别人解决问题。我们以自动驾驶为例,为什么它的价值这么高?价值高的原因是它节省的是人类的时间。
如果L3普及或者L4普及,其实你付出的是钱,你买的不是自动驾驶的软件,而买的是时间,因为软件替你开车,这是最核心的价值,这也是为什么自动驾驶的价值这么高。
分析师常常会说自动驾驶这个东西看不懂,其实你怎么评价人形机器人就怎么评价自动驾驶。
为什么人形机器人有价值?它帮你干活,不管是在家里帮你干活还是在工厂里干活,自动驾驶就是帮你开车的机器人,就是这么简单的一件事情。
![]()
其实L4价值拐点现在已经出现了,我举几个数字,最简单的一点,其实已经出现了。
如果你看资本市场的话,美国有一家做L4的公司叫Aurora,这家公司的运营数量你可以去查,没有过百辆级,没有太多的运营。还有一家做高阶辅助自动驾驶的公司叫Mobileye,在这之前,我三四年前去CES,Mobileye百万辆的出货量,毫无置疑的第一。
但是今天你去看两家公司的市值都在百亿美元左右,一个出货量百万级的L2++、L3公司和一个不足几十辆L4的公司市值是一样的,价值拐点不就已经出现了吗?
最真诚的智能汽车报道
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.