网易首页 > 网易号 > 正文 申请入驻

理想要和特斯拉掰手腕

0
分享至

作者 | 柴旭晨

编辑 | 周智宇

在外界印象中,理想的智驾一直是追赶者的状态,但在ALL IN端到端后,理想竟然自信地说已经超过特斯拉了。

日前,理想汽车智驾团队详细发布了“端到端+VLM”方案,不同于国内同行的“分段式端到端”,理想的方案是被称为“One Model”的一张大网。

这是目前自动驾驶架构演进的最终形态,该阶段不再有感知、决策规划等模块的明确划分,从原始信号输入到最终规划轨迹的输出,采用一个深度学习模型,完整无损地应用于自动驾驶。

在理想智驾研发副总裁郎咸朋看来,死磕“最终版”的端到端,正是理想得以弯道超车的秘密。

“过去的智驾方案,不管是轻图还是无图,底层技术架构都是有人为设计成分的,如果想将一年四季各种情况都跑一遍,没有一两年时间是不可能实现。所以我们迭代了端到端+VLM技术架构”,郎咸朋认为,该架构是AI自己生长的,“真正变成车自己在开”。

不仅如此,理想开始打造“世界模型”来加速智驾AI的训练,“世界模型可以生成、模拟场景,这是几千万个场景测试”,理想智驾高级算法专家詹锟表示,这是实现智驾快速迭代最重要、且最必要的保证,并且“世界模型”还成为碾压端到端的存在。

“它可以根据当前的环境预测未来,能推理出未来的场景。比如球滚到路中间,端到端只会刹车,世界模型会想后面是不是还有小孩冲出来?它对世界有更宏观综合的判断”。詹锟表示,理想在上车端到端的同时,就已经预研下一代技术了。

因此郎咸朋凡尔赛地表示,“我们跟特斯拉没有太大差别,甚至更领先一点”。

敢于与特斯拉FSD这个全球智驾标杆掰手腕,不仅在于理想双系统架构的超前,更在于理想在新势力当中领先的销量和财力。郎咸朋说真正做到端到端要看两个能力,“有没有足够多的数据和充足的算力,因为它是AI训练”。

他表示,为了训练好自家智驾系统,理想对数据质量要求极高,只精选3%“老司机”数据喂给AI,而在80万车主基数下数据量已经足够庞大;为了消化这些数据,理想到今年底要将算力提升至8亿EFLOPS,“这是一年20亿人民币的花销”。

在郎咸朋眼中,高阶智驾是巨头才能玩得起的游戏,“未来到L4阶段,数据和算力的增长都呈指数级,每年至少需要10亿美金,一家企业的盈利和利润不能支撑投入的话就很困难”。

靠着端到端的初步上车,理想已经获得了销量的快速转化。接下来它还要持续发力这个“头号工程”,这或许将是带领它未来比肩比亚迪、特斯拉的关键一环。

以下是华尔街见闻与理想智驾研发副总裁郎咸朋、智驾高级算法专家詹锟的对话实录(经编辑):

问:什么才是真正的端到端?

詹锟:端到端是一种研发的范式,从最开始的输入端到最后的输出端,中间没有其他过程,用一个模型完整实现。现在理想汽车是一体化OneModel端到端,通过直接传感器输入,模型推理完毕后直接给到轨迹规划用来控车,这就是一体化端到端。

市面上还有一种端到端,是在中间分两个模型,模型中间以一个信号做桥接,但我们认为这不是真正的端到端,如果中间加了人为的信息消化过程,可能效率不是那么高或能力上限受到约束。

郎咸朋:真正做端到端要看两个能力:有没有足够多的数据和充足的算力。否则我觉得很难做出真正的端到端来,因为它是AI训练。

问:现在很多品牌提出自己是引领者,理想汽车也在说已经跻身智能驾驶第一梯队,怎样评价自家端到端的技术水平?

郎咸朋:普通消费者不关注技术而是体验,我们也不和谁比。

以前我们为做城市NOA考虑过用高精地图,但后续因为体验因素决定转做无图,但那时的无图还是感知、规划、分模块的方案,里面有大量的人工规则和实车测试。

先不说预算投入,时间上就非常困难,如果想将一年四季的各种情况都跑一遍,没有一两年时间是不可能实现的。所以我们又迭代到端到端+VLM技术架构,这是AI方案是自己长出来的。

之前辅助驾驶是系统辅助人来开,主体是人,但是到现在端到端+VLM阶段后,我们认为是变成车自己在开。训练出完整模型之后,模型自己有能力开好这个车,我监督这个车哪里不行或者有提示需要接管,但是主体一定是车,人作为一种监督的辅助角色。

问:端到端的研发周期大概多久?

郎咸朋:理想认真做端到端+VLM是从去年开始的,我们在研发阶段是一个非常小而精的团队,做无图的时候已经在预研端到端,现在做端到端实际已经预研下一代技术了。当判断条件已经成熟和初步验证成功,会转到量产阶段。

问:端到端最早是特斯拉提出来的,我们是不是受到特斯拉的启发?我们怎么确定流程一定能跑通?

詹锟:端到端不是特斯拉第一个提出来的,2016年英伟达就有一个模型提到了这个技术,但效果一般只解决了特别简单的场景,以当时算力和模型规模,大家认为这条路是行不通的。到2023年,特斯拉在新transformer架构上增加了超大算力做出来之后,在往更有成长的方向上推进。

问:理想目前感受自己和特斯拉智驾的差距有多大?

郎咸朋:去年那会大概差半年,今年可能还会再小一点。从技术架构上,我们跟特斯拉没有太大差别甚至更领先一点,因为我们有VLM,特斯拉只有端到端。在中国的训练算力和训练数据上,至少从现在看我们是领先于它,因为特斯拉在中国还需要算力部署。

另外我们也用上了世界模型,可以生成、模拟场景,这是几千万个场景测试,是实现智驾快速迭代最重要、且最必要的保证。这种方式进行模型迭代比原来整车或者路试的方式要可靠得多,而且一年四季各种场景全都可以涵盖。

詹锟:世界模型可以根据当前的环境去预测未来,能够推理出未来的场景。比如,球滚到路中间,端到端只会刹车,但世界模型会想是不是还会有小孩冲出来?它对世界有更宏观综合的判断。其实VLM在我们系统上就是起到这个效果,当然我们现在模型规模还很小,能力是有限的。

问:前不久有人提出“500亿做不好智驾”的观点,理想对此有什么看法?

郎咸朋:关于500亿,需要判断是一次性投资还是长期投资,就像今天提到的我们每年都会有10亿美金投资在智驾研发中,如果连续10年的话是超过500亿。

端到端+VLM的技术架构是一个分水岭,从这一代开始才是真正用AI的方式做。

之前我们还是在用传统方式做智驾,所有产品的最终效果,都是有“设计”在里面,没有设计到的场景可能就无法实现。不仅无法实现纯粹的数据去驱动,人工工作量也大。

一体化的端到端模型,虽然在模型的结构、模型的训练方式上有难度,但最大的好处是,我们给出数据训练模型,模型输出结果,这样自然而然的AI训练过程。

从我们自己的端到端模型来看,只需要告诉它要做和“老司机”一样的驾驶体验,输入所有理想车主中“老司机”的驾驶数据,它就给你结果。我们数据筛选是非常严格的,在当时80万车主中,只有3%才是真正的老司机数据。

在有了这个前提之后,接下来做研发的核心竞争,看是否有更多更好的数据和与之配套的算力去训练模型。而算力和数据的获取,需要看花多少钱、投入多少资源去做。而这其中有些东西是用钱买不到的,比如训练数据、训练里程,各家车企有自己的资源,相互之间并不会互通共享。

另一个需要投资的是算力,我们现在5.39亿EFLOPS的算力,到今年年底预计提升至8亿EFLOPS,这是一年20亿人民币的花销。

未来进入到L4阶段,每年数据和算力都呈指数级增长,这也就意味着每年至少需要10亿美金。5年之后,它需要持续迭代,在这样的量级下,一家企业的盈利和利润不能支撑投入的话,是很困难的。

所以,现在并不需要关注投入多少亿做自动驾驶,而是从本质上出发,是否有充分的算力和数据支持,再看看需要投入多少钱。

问:过去几年智驾的技术经历了几次大迭代,类似巨变还会发生吗?

郎咸朋:端到端+VLM双系统是模拟人类思考认知的架构,因为我们做AI最终希望可以实现拟人或者类人。目前的AI框架是非常合理的,很多企业也开始尝试跟进。

双系统理论,不仅可以用在自动驾驶上,也是未来AI甚至智能机器人的范式。自动驾驶可以说是一个轮式智能机器人,只是工作范围是道路。所以,我觉得是有一定的长期行为力,但技术发展是无穷无尽的,我们会保持对先进技术的敏捷感知,如果有新的技术我们也会追踪。

问:端到端量产交付之后能给销量带来多大增量?

郎咸朋:无图NOA全量推送之后,近两个月我们试驾翻了一倍。30万以上的车型AD Max占比达到70%,原先AD Pro会多一些,L9 AD Max甚至占比90%以上。

问:理想汽车对高阶智驾有没有收费的计划?有什么好的商业模式?

郎咸朋:标配和免费都是理想从第一天开始进入智能驾驶就制定的策略,“有监督的自动驾驶”对所有AD Max的车主都是不收费的,它还能为自动驾驶提供更多的车辆训练里程。因此交付量比较好且企业经营稳健,也有足够的资源投入智驾研发。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
老哈梅国葬,100国代表参加,中方宣布出席规格,特朗普把话挑明

老哈梅国葬,100国代表参加,中方宣布出席规格,特朗普把话挑明

墨子翟的日记y
2026-07-03 17:20:45
对等报复升级!泽连斯基公开放话:不彻底毁掉这座城市,普京绝不会停止战争

对等报复升级!泽连斯基公开放话:不彻底毁掉这座城市,普京绝不会停止战争

林子说事
2026-07-03 19:07:29
美国球迷疯了!球不看了,全场几万人掏出望远镜对准阿根廷看台

美国球迷疯了!球不看了,全场几万人掏出望远镜对准阿根廷看台

霁寒飘雪
2026-07-03 11:38:17
若无意外,2026年下半年中国或迎来4大降价潮,应早做准备

若无意外,2026年下半年中国或迎来4大降价潮,应早做准备

混沌录
2026-07-02 19:52:26
60年代,冯巩在幼儿园的照片,人家这长相,小时候都不怕丢

60年代,冯巩在幼儿园的照片,人家这长相,小时候都不怕丢

喜文多见01
2026-05-10 07:00:29
2死1重伤!是什么让老实人变成杀人凶手?抚顺修车摊血案始末

2死1重伤!是什么让老实人变成杀人凶手?抚顺修车摊血案始末

易玄
2026-07-01 17:04:21
皇马前锋罗德里戈3000万欧元转会英超,曼联心仪皇马中场楚梅阿尼

皇马前锋罗德里戈3000万欧元转会英超,曼联心仪皇马中场楚梅阿尼

福酱的小时光
2026-07-03 06:43:36
突然确诊“懒癌”,杭州女子不敢相信:我每年都做检查的!医生叹息,这种癌伪装能力太强,出现症状千万小心

突然确诊“懒癌”,杭州女子不敢相信:我每年都做检查的!医生叹息,这种癌伪装能力太强,出现症状千万小心

环球网资讯
2026-07-03 18:33:33
刚结婚4天,她就发了一句意味深长的话…

刚结婚4天,她就发了一句意味深长的话…

奋斗在韩国
2026-07-03 14:46:18
萧旭岑:只要民众党主席还是黄国昌,2028年一定“蓝白合”

萧旭岑:只要民众党主席还是黄国昌,2028年一定“蓝白合”

海峡导报社
2026-07-03 20:03:12
深度解析:克罗地亚第103分钟格绝平进球被VAR取消的完整判罚依据

深度解析:克罗地亚第103分钟格绝平进球被VAR取消的完整判罚依据

夜白侃球
2026-07-03 11:16:26
从KK园到三佛塔,东南亚的电诈为什么打不绝?

从KK园到三佛塔,东南亚的电诈为什么打不绝?

看看新闻Knews
2026-07-02 17:03:08
WTT美国大满贯:4强赛诞生!韩国一姐惨败 蒯曼强势剃头,下轮难了

WTT美国大满贯:4强赛诞生!韩国一姐惨败 蒯曼强势剃头,下轮难了

十级搞笑选手
2026-07-03 13:03:21
80年代的完美答案:五款公认近乎完美的经典车

80年代的完美答案:五款公认近乎完美的经典车

Ping值焦虑
2026-07-02 00:16:01
大闹车站女子彻底“社死”,“底裤”被扒正脸流出,结局大快人心

大闹车站女子彻底“社死”,“底裤”被扒正脸流出,结局大快人心

好贤观史记
2026-07-03 14:16:05
演员黄政民戒酒后状态回春,网友:“完全是美少年”

演员黄政民戒酒后状态回春,网友:“完全是美少年”

韩小娱
2026-07-03 11:08:21
韩国议员:洪明甫与孙兴慜存在矛盾,洪明甫曾质疑孙兴慜越界

韩国议员:洪明甫与孙兴慜存在矛盾,洪明甫曾质疑孙兴慜越界

懂球帝
2026-07-03 15:58:08
西安赛格回应“商户负责人坠亡”:5月25日其有轻生举动被及时救回,违约金1154.6万元有书面确认,悲剧发生前一天双方仍在洽谈

西安赛格回应“商户负责人坠亡”:5月25日其有轻生举动被及时救回,违约金1154.6万元有书面确认,悲剧发生前一天双方仍在洽谈

每日经济新闻
2026-07-02 21:21:08
韩红要崩溃了!央视重温播放《天路》,是原唱巴桑版本,评论炸锅

韩红要崩溃了!央视重温播放《天路》,是原唱巴桑版本,评论炸锅

火山詩话
2026-07-03 08:34:47
意媒:C罗将告别葡萄牙队,无缘2028年欧洲杯

意媒:C罗将告别葡萄牙队,无缘2028年欧洲杯

懂球帝
2026-07-03 20:25:10
2026-07-03 21:36:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
148619文章数 2654079关注度
往期回顾 全部

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

头条要闻

60岁老人猥亵8岁女童仅获刑一年三个月 法院决定再审

头条要闻

60岁老人猥亵8岁女童仅获刑一年三个月 法院决定再审

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

"千亿"众邦银行被接管:系严重信用风险

科技要闻

万亿富豪马斯克 舍不得特斯拉员工敞开用AI

态度原创

房产
教育
数码
手机
艺术

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

教育要闻

用话术让孩子进步只是第一步

数码要闻

ATX 3.1+氮化镓技术加持,技嘉冰猎鹰白金850W电源测评

手机要闻

索尼一家独大成为历史:iPhone 18系列首次引入三星传感器

艺术要闻

溥仪卖给日本的王羲之真迹!足有5000多字

无障碍浏览 进入关怀版