网易首页 > 网易号 > 正文 申请入驻

对话商汤绝影王晓刚:关于DeepSeek、端到端瓶颈、以及FSD

0
分享至

去年,Scaling law和端到端自动驾驶,都遇到了瓶颈。

随着互联网的数据价值被榨干,自动驾驶模型千万级clips的「数据黑洞」难以被填补。

此时,DeepSeek出现了。它采用的强化学习,带来了长思维链的涌现,大幅降低数据需求。随之,商汤绝影也推出了R-UniAD,同样应用了强化学习,以此突破数据瓶颈,并有望优于人类驾驶水平。

昨日(2月25日),商汤绝影CEO、商汤科技联合创始人、首席科学家——王晓刚,对RoboX进一步解释了R-UniAD诞生的背景和思路,以及该公司下一步的规划。

什么是R-UniAD?

“从中国的实际情况来看,我们很难像特斯拉那样,拥有700万台量产车的数据回流,而且高质量数据占比极少...目前端到端只是模仿学习,难以突破人类上限。”

王晓刚介绍称,DeepSeek通过强化学习的框架,可以生成多条的思维链,让模型产生更多的解法,突破了人类知识库的限制,也产生了更多的数据,以此大幅降低数据门槛。

在这一启发下,商汤绝影在UniAD的基础上,推出了强化学习的新范式——Reinforced-UniAD(R- UniAD)。

其具体训练方法如下:

1、基于冷启动数据,让端到端自动驾驶大模型达到基础水平,通过模仿学习进行云端训练;

2、再基于强化学习,让该模型与世界模型协同交互,持续提升其性能;

3、从云端大模型通过高效蒸馏的方式,实现端到端小模型的车端部署。

王晓刚表示,在初始阶段,通过千台规模量产车形成的数据,即可让端到端模型达到较好的水准,之后就不再需要这些「冷启动数据」了。

“端到端的模型可以预测很多种轨迹,世界模型也可以模拟仿真出各种周边环境的这样的变化。同时,仿真器可通过Reward的方式,为这些轨迹和环境变化打分,找到最佳的驾驶行为。”

DeepSeek带来的「利好」

在王晓刚看来,DeepSeek的长思维链、慢推理方式,能够产生更高层次的认知,达到情感上的支持。这对于绝影的「New Member」产品来说,是很大的利好。

王晓刚认为,商汤绝影去年推出的「A New Member For U」产品,同样是端云协同的方案。从前,此类方案落地时,对端侧芯片有一定要求。而DeepSeek的MoE(混合专家模型)的架构,使其能部署在低成本芯片上,该方式也有利于「A New Member For U」的推广。

“以蒸馏手段,可以通过强大的云端模型,产生高性能的端侧模型,这是给端侧模型的一个机会。同时,MoE只需要激活部分参数,使用部分算力,肯定要比传统模型更加节省算力。”

不过他也表示,目前各车企接入的DeepSeek应用,还是比较简单的。而且,DeepSeek能支撑的访问量是有限的,延时也较长,现在还不能算是好的体验。

“如果只是进行DeepSeek原始模型的接入,这在汽车产品上的体验还是有差距的。这对于商汤绝影来说,也是一个利好。”

王晓刚用「做几何题」来描述自动驾驶仿真:在解题过程中,每解一步都需要加一些辅助线,几何图像本身也在演变,这就类似于自动驾驶的世界模型仿真——不但要预测物体轨迹,还要让环境里的视频图像得到演进,能够预见出来,这是DeepSeek所欠缺的。

“DeepSeek一直致力于语言模型,对于图像、视频的精准生成还是比较欠缺的,但这正是我们的强项。”

视频生成的严格标准

“「开悟」世界模型的视频生成,其实和Sora等标准还是有区别的。我们需要更加精准的可控性,要符合物理规律,还有交通法则。我们生成的视频输入,实际上是物体的运动轨迹和3D的框,由这些输入精准地控制视频的生成。”

为了准确模拟各种极端场景,「开悟」必须做到结合11个摄像头输入的时空一致性。同时,绝影本身也储备了大量真值数据测试集,可以通过视频反向提取其中的物体位置,进行轨迹验证,保障视频的真实和有效性。

“其实从去年开始,就已经有20%的生成视频,应用在了模型训练中。希望将来这一数字能超过50%,乃至80%。”

通俗一点来比喻的话,「强化学习」就是针对一个复杂场景,通过模拟仿真反复测试,并给出多条不同的驾驶行为和路径。

接下来,就像DeepSeek一样,可以针对一个问题找到10条乃至100条的思维链,去解决问题。

“我们之前所说的高质量数据,指的是人类的高质量驾驶行为。而如今高质量数据的生成,不一定再需要人类的驾驶行为,而是将图片或者视频片段作为一个场景起点,接下来由世界模型通过强化学习去生成即可。”王晓刚说道。

R-UniAD的3大挑战

为实现云端大模型和世界模型的在线交互,绝影克服了3个关键难题:

1、模拟仿真能力:必须精准、可控。

2、预测能力:对于周围环境视频的生成,除了准确,还要有多样性。“如果生成的东西都是单一的,就没法模拟出不同的场景和驾驶行为。”

3、Reward:也就是评价出哪些视频和轨迹的序列,它是一个好的驾驶行为,那么有的产生了碰撞,那么有的给人家不舒适的这样的一些这样的一些感觉。

R- UniAD的重要一环,在于世界模型的环境生成,以及对其的精准控制,达成这一能力,才能体现强化学习的效果。

王晓刚指出,未来的发展,一定是基础设施和云端研发占的比重越来越高,而端侧则变得更加简单:各种数据蒸馏、工程优化,能够使得越来越多的功能被部署在更加便宜的低算力芯片上,但这一前提都依赖于强悍的云端模型。

被高估的激光雷达鲁棒性

近期,「纯视觉」风头渐弱,多家车企都表示,会在高阶智驾上继续使用激光雷达。

但王晓刚认为,激光雷达有着自己的天花板,其本身具有的信息量是偏少的,达不到非常鲁棒的状态。只不过,当下由于没有海量数据支撑,智驾的视觉能力偏弱,因此还需要用激光雷达作为辅助。

从成本层面考虑,「全民智驾」的趋势下,智驾需要下探到10万元级别以下,硬件成本也需要进一步降低。

“视觉能力的上限更高。在硬件固定的前提下,通过大数据去更新的模型,会不断提升软件的性能。”他说道。

先布局中低算力平台

从去年开始,商汤已开始在智驾市场中布局:“从市场份额上考虑,要先下探到价格较低的中低算力车型,所以我们去年主要布局了地平线J6E、J6M等平台的方案,也与广汽、奇瑞还有东风形成了战略合作。”

王晓刚透露称,到今年3月,商汤绝影和车企合作开发的基于J6M的自动驾驶产品,就能实现量产,4月还会在上海车展发布。

除了智驾产品本身,绝影还在大模型、数据基础设施等方面,协同车企进行规划和布局,包括建设数据的生产管线,共建研发体系等等。

需要注意的是,即便有了强化学习的世界模型,要想覆盖更多的复杂场景,真值数据还是非常重要的,而这些数据还是在车企,这也是绝影与车企形成深度合作的意义之一。

特斯拉FSD的挑战

访问当天,正值特斯拉FSD突然在华推送,王晓刚对此也发表了自己的看法。

他认为,特斯拉FSD在中国的应用,还是会受到数据的限制。首先,中国的交通场景与美国存在很大差异;其次,特斯拉在在中国采集的数据也会受到管控,无法跨境。

“如果是做端到端的话,FSD会面临这些自动驾驶场景数据方面的问题。它也不太可能用它在美国所拥有的数据在本地训练,因为数据不能够跨境,也没有强大的基础设施。所以绝影R-UniAD的新型技术路线,即便对于特斯拉的FSD,也有着现实意义。”

同时他表示,特斯拉FSD目前还是模仿学习的范式,而R-UniAD技术路线训练出来的端到端智驾模型,很有希望超越人类驾驶表现,实现弯道超车。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刚攻下红军城,普京政府通告全球,中俄不必缔结同盟,赢家不是俄

刚攻下红军城,普京政府通告全球,中俄不必缔结同盟,赢家不是俄

娱乐叭叭君
2025-11-14 18:17:08
严控融雪剂,北京要求党政机关、企事业单位等带头实行“包段扫雪”

严控融雪剂,北京要求党政机关、企事业单位等带头实行“包段扫雪”

奇思妙想生活家
2025-11-14 00:46:21
全球首发!新机官宣:12月5日,正式发布上市!

全球首发!新机官宣:12月5日,正式发布上市!

科技堡垒
2025-11-14 09:48:38
51岁女演员朱晏大方承认整容:做了眼皮修复,希望可以回到年轻美貌的状态

51岁女演员朱晏大方承认整容:做了眼皮修复,希望可以回到年轻美貌的状态

东方不败然多多
2025-11-14 15:45:59
人民币结算遭“封杀”!美元收割3万亿,中国380亿损失咋翻盘?

人民币结算遭“封杀”!美元收割3万亿,中国380亿损失咋翻盘?

阿伧说事
2025-11-14 10:17:18
女生穿成这样去健身房,真的合适吗??

女生穿成这样去健身房,真的合适吗??

健身厨屋
2025-10-20 12:22:34
全运会女排小组赛:江苏队3-0战胜河南队,收获五连胜

全运会女排小组赛:江苏队3-0战胜河南队,收获五连胜

懂球帝
2025-11-14 20:30:18
巨星互换!皇马冬窗再现大手笔,巴西天才离队,1.5亿中场将至

巨星互换!皇马冬窗再现大手笔,巴西天才离队,1.5亿中场将至

祥谈体育
2025-11-14 16:19:30
男子哈工大毕业被裁后续:创业3月才开单,到手5万,计划老家买房

男子哈工大毕业被裁后续:创业3月才开单,到手5万,计划老家买房

八斗小先生
2025-11-14 15:51:02
3300亿瓦特!超上海纽约东京迪拜电量总和!美国核聚变又有突破?

3300亿瓦特!超上海纽约东京迪拜电量总和!美国核聚变又有突破?

徐德文科学频道
2025-11-13 21:41:00
太子集团陈志首次回应指千亿比特币与诈骗无关,向美法院申请解冻

太子集团陈志首次回应指千亿比特币与诈骗无关,向美法院申请解冻

环球趣闻分享
2025-11-14 13:10:08
中国“摸着石头过河”数十年,“石头”终于快被摸完了

中国“摸着石头过河”数十年,“石头”终于快被摸完了

朔方瞭望
2025-11-08 11:29:44
上海“剩女”破90万,她们到底是什么人?看完你就懂了!

上海“剩女”破90万,她们到底是什么人?看完你就懂了!

椰青美食分享
2025-11-14 09:15:24
张小斐瘦得胸都没有了,居然还有小肚子,可见减肥真的太难了!

张小斐瘦得胸都没有了,居然还有小肚子,可见减肥真的太难了!

小椰的奶奶
2025-11-13 13:26:39
从家暴到杀妻:将失去意识的妻子扔下土崖,陕西一男子涉嫌故意杀人被公诉

从家暴到杀妻:将失去意识的妻子扔下土崖,陕西一男子涉嫌故意杀人被公诉

极目新闻
2025-11-14 19:59:26
坎通纳:现在的防守球员背着手像企鹅一样,我一个赛季能进60球

坎通纳:现在的防守球员背着手像企鹅一样,我一个赛季能进60球

懂球帝
2025-11-14 19:29:07
大反转,狗咬人事件凶器上只有死者DNA,重伤者疑被自己人所伤!

大反转,狗咬人事件凶器上只有死者DNA,重伤者疑被自己人所伤!

阿纂看事
2025-11-14 11:09:56
德财长访华或要黄,德国国会邀沈伯洋作证,要给两岸中国人断官司

德财长访华或要黄,德国国会邀沈伯洋作证,要给两岸中国人断官司

阿校谈史
2025-11-13 17:33:11
下一站德乙!王钰栋即将加盟沙尔克04队!已签约欧洲经纪公司!

下一站德乙!王钰栋即将加盟沙尔克04队!已签约欧洲经纪公司!

海浪星体育
2025-11-14 14:39:37
2025年全球游客访问量最高的国家/地区

2025年全球游客访问量最高的国家/地区

常涤非观点
2025-11-13 09:11:17
2025-11-14 21:08:49
RoboX
RoboX
关注智能汽车、机器人在内的具身智能前沿科技
194文章数 2关注度
往期回顾 全部

科技要闻

京东“失去的五年”后,找到新增长了吗?

头条要闻

男子将昏迷妻子扔下土崖致死 女方13天前起诉离婚被驳

头条要闻

男子将昏迷妻子扔下土崖致死 女方13天前起诉离婚被驳

体育要闻

40岁C罗肘击染红 离场时怒骂对手主帅

娱乐要闻

王家卫让古二替秦雯写剧情主线?

财经要闻

财政部:加强逆周期和跨周期调节

汽车要闻

小鹏X9超级增程动态评测全网首发 高速实测车内65分贝

态度原创

数码
旅游
家居
本地
公开课

数码要闻

当贝X7 Max:3000流明+4K变焦,家庭影院与游戏主场的新选择

旅游要闻

从安吉到加纳利:联合国榜单背后的“乡村价值”再发现

家居要闻

现代简逸 寻找生活的光

本地新闻

云游安徽 | 江声浩荡阅千年,文脉相承看芜湖

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版