网易首页 > 网易号 > 正文 申请入驻

闪电快讯|借鉴DeepSeek训练模式,商汤绝影推出全新智驾解决方案

0
分享至

记者|董温淑

编辑|高宇雷

2月22日下午,商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚于上海发布了行业首个“与世界模型协同交互的端到端自动驾驶路线R-UniAD”,并预告将于4月上海车展发布R-UniAD端到端自动驾驶方案,并完成实车部署。

R-UniAD可通过构建世界模型生成在线交互的仿真环境,用以进行端到端模型的强化学习训练。王晓刚称,R-UniAD与春节开始持续受到市场关注的DeepSeek技术创新思路同归一源:从模仿学习向强化学习升级演进,从而实现端到端自动驾驶超越人类的驾驶表现。

强化学习是除了监督学习和非监督学习之外的第三种基本的机器学习方法。在现行大模型的训练过程中,三种方法在不同阶段均有使用。强化学习指智能体(Agent)通过与环境(Environment)的交互学习最佳策略、不断提升智能程度。

不同的是,相较于OpenAI所研发的GPT系列大模型等竞品普遍采用基于人类反馈(有监督)的强化学习(RLHF,)模式进行训练,爆火的DeepSeek R1大模型采用的是一种更为简单的强化学习模式,即仅专注于特定任务的指标优化模型效果,而减少人类监督占比,因此资源需求更低。

王晓刚称,基于强化学习的大模型技术路线可以迁移到端到端自动驾驶算法的训练与研发之中。

(商汤绝影R-UniAD多阶段强化学习端到端自动驾驶技术路,图源/商汤科技)

商汤绝影的R-UniAD是「多阶段强化学习」端到端自动驾驶技术路线,具体分为三个阶段,首先是依靠冷启动数据通过模仿学习进行云端的端到端自动驾驶大模型训练;然后基于强化学习,让云端的端到端大模型与世界模型协同交互,持续提升端到端模型的性能;最后云端大模型通过高效蒸馏的方式,实现高性能端到端自动驾驶小模型的车端部署。

从数据规模来看,多阶段强化学习的训练方法能大幅降低端到端自动驾驶数据规模门槛。R-UniAD就是通过高质量数据进行冷启动,用模仿学习的方式训练出一个端到端基础模型,再通过强化学习方法进行训练。据测算,小样本多阶段学习的技术路线能让端到端自动驾驶的数据需求降低一个数量级,让车企合作伙伴有望换道超车特斯拉FSD(Full Self-Driving,全自动驾驶)。

从性能上限来看,纯强化学习训练有望在提升端到端智驾模型性能的同时,充分探索多元场景和驾驶风格。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国首创!打一针降血脂基因治疗获突破

中国首创!打一针降血脂基因治疗获突破

医学界
2026-03-26 19:17:50
张少康辞去广东省人民政府副省长职务

张少康辞去广东省人民政府副省长职务

新快报新闻
2026-03-26 11:50:03
河南郑州,10岁男孩在上课时与同桌发生矛盾。老师竟然让两...

河南郑州,10岁男孩在上课时与同桌发生矛盾。老师竟然让两...

网络易不易
2026-03-26 14:05:04
中国最“尴尬”的5个地级市:它们根本不该在本省,应该“改嫁”

中国最“尴尬”的5个地级市:它们根本不该在本省,应该“改嫁”

好笑娱乐君每一天
2026-03-26 01:22:35
张雪峰离世的警示:人一定要学会避谶

张雪峰离世的警示:人一定要学会避谶

代伟看世界
2026-03-26 15:21:09
裁员裁到大动脉是啥体验?网友:我现在感觉我也是别人的大动脉

裁员裁到大动脉是啥体验?网友:我现在感觉我也是别人的大动脉

解读热点事件
2026-03-27 00:05:10
林青霞亲口爆料:当年我全裸给他看,他却吓得扭头就跑!

林青霞亲口爆料:当年我全裸给他看,他却吓得扭头就跑!

达文西看世界
2026-03-04 15:07:30
日媒:政府出手后,日本汽油价已降至7.71元/升

日媒:政府出手后,日本汽油价已降至7.71元/升

随波荡漾的漂流瓶
2026-03-25 15:39:49
张雪峰猝死全过程曝光!知情人发声,本来可以活,3次机会没抓住

张雪峰猝死全过程曝光!知情人发声,本来可以活,3次机会没抓住

智慧生活笔记
2026-03-25 18:23:01
看了新加坡媒体的披露,我才知道,中国已经没必要向世界证明什么

看了新加坡媒体的披露,我才知道,中国已经没必要向世界证明什么

触摸史迹
2026-03-21 02:58:06
觉得五常权力大,新加坡呼吁约束一票否决权,却不认同美国是霸权

觉得五常权力大,新加坡呼吁约束一票否决权,却不认同美国是霸权

近史阁
2026-03-27 03:28:33
意大利附加赛大决战先发:中场实力相对稳妥,锋线颓势令人忧

意大利附加赛大决战先发:中场实力相对稳妥,锋线颓势令人忧

里芃芃体育
2026-03-26 16:00:06
大快人心!国家出手擒下3名华人首富,他们干的事,根本不能饶恕

大快人心!国家出手擒下3名华人首富,他们干的事,根本不能饶恕

墨印斋
2026-03-24 21:34:56
无需大量运动!《柳叶刀》:每天多动5分钟、少坐半小时,足以显著降低死亡风险

无需大量运动!《柳叶刀》:每天多动5分钟、少坐半小时,足以显著降低死亡风险

生物世界
2026-03-25 16:05:30
朝鲜通告全球,确定“头号敌国”,李在明做选择,有中国在乱不了

朝鲜通告全球,确定“头号敌国”,李在明做选择,有中国在乱不了

说历史的老牢
2026-03-26 05:05:53
财政部答中经报记者问:居民参保长护险获财政补助

财政部答中经报记者问:居民参保长护险获财政补助

中国经营报
2026-03-26 19:43:15
伊朗获得强援,又一中东国家下场,还是美国亲自送上门的帮手

伊朗获得强援,又一中东国家下场,还是美国亲自送上门的帮手

徐云流浪中国
2026-03-26 14:45:25
1210km续航!长安官宣:新车正式上市

1210km续航!长安官宣:新车正式上市

T科技衍生
2026-03-27 00:31:33
AI短剧冲击横店:有演员一个月只接到一部戏,有导演转型做AI剧,“都在寻找出路”

AI短剧冲击横店:有演员一个月只接到一部戏,有导演转型做AI剧,“都在寻找出路”

环球网资讯
2026-03-26 19:40:07
巴蒂:我们那个年代前锋比现在更强,如今看比赛到处都是空间

巴蒂:我们那个年代前锋比现在更强,如今看比赛到处都是空间

懂球帝
2026-03-26 10:52:23
2026-03-27 06:43:00
电厂 incentive-icons
电厂
探索科技公司的未知,为你充电
2047文章数 1056关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:对伊朗能源设施空袭再推迟10天

头条要闻

特朗普:对伊朗能源设施空袭再推迟10天

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
艺术
游戏
健康
公开课

400万人爱过的女孩,被黄谣网暴180天后

艺术要闻

最美花卉图谱!记住后保你啥花都认识!

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版