网易首页 > 网易号 > 正文 申请入驻

闪电快讯|借鉴DeepSeek训练模式,商汤绝影推出全新智驾解决方案

0
分享至

记者|董温淑

编辑|高宇雷

2月22日下午,商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚于上海发布了行业首个“与世界模型协同交互的端到端自动驾驶路线R-UniAD”,并预告将于4月上海车展发布R-UniAD端到端自动驾驶方案,并完成实车部署。

R-UniAD可通过构建世界模型生成在线交互的仿真环境,用以进行端到端模型的强化学习训练。王晓刚称,R-UniAD与春节开始持续受到市场关注的DeepSeek技术创新思路同归一源:从模仿学习向强化学习升级演进,从而实现端到端自动驾驶超越人类的驾驶表现。

强化学习是除了监督学习和非监督学习之外的第三种基本的机器学习方法。在现行大模型的训练过程中,三种方法在不同阶段均有使用。强化学习指智能体(Agent)通过与环境(Environment)的交互学习最佳策略、不断提升智能程度。

不同的是,相较于OpenAI所研发的GPT系列大模型等竞品普遍采用基于人类反馈(有监督)的强化学习(RLHF,)模式进行训练,爆火的DeepSeek R1大模型采用的是一种更为简单的强化学习模式,即仅专注于特定任务的指标优化模型效果,而减少人类监督占比,因此资源需求更低。

王晓刚称,基于强化学习的大模型技术路线可以迁移到端到端自动驾驶算法的训练与研发之中。

(商汤绝影R-UniAD多阶段强化学习端到端自动驾驶技术路,图源/商汤科技)

商汤绝影的R-UniAD是「多阶段强化学习」端到端自动驾驶技术路线,具体分为三个阶段,首先是依靠冷启动数据通过模仿学习进行云端的端到端自动驾驶大模型训练;然后基于强化学习,让云端的端到端大模型与世界模型协同交互,持续提升端到端模型的性能;最后云端大模型通过高效蒸馏的方式,实现高性能端到端自动驾驶小模型的车端部署。

从数据规模来看,多阶段强化学习的训练方法能大幅降低端到端自动驾驶数据规模门槛。R-UniAD就是通过高质量数据进行冷启动,用模仿学习的方式训练出一个端到端基础模型,再通过强化学习方法进行训练。据测算,小样本多阶段学习的技术路线能让端到端自动驾驶的数据需求降低一个数量级,让车企合作伙伴有望换道超车特斯拉FSD(Full Self-Driving,全自动驾驶)。

从性能上限来看,纯强化学习训练有望在提升端到端智驾模型性能的同时,充分探索多元场景和驾驶风格。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖北省武汉市东西湖区委原书记彭涛被“双开”

湖北省武汉市东西湖区委原书记彭涛被“双开”

界面新闻
2026-06-22 15:00:27
上海交大发现:体内有恶性肿瘤的人,身体或会有6个表现

上海交大发现:体内有恶性肿瘤的人,身体或会有6个表现

芹姐说生活
2026-06-21 22:25:32
法国巨头联合创始人坠机身亡

法国巨头联合创始人坠机身亡

第一财经资讯
2026-06-22 12:59:57
周星驰新电影《功夫女足》将于7月上映

周星驰新电影《功夫女足》将于7月上映

界面新闻
2026-06-22 11:48:41
王毅会见伊朗最高国家安全委员会副秘书内扎米普尔

王毅会见伊朗最高国家安全委员会副秘书内扎米普尔

界面新闻
2026-06-22 17:34:23
深蓝新材料创始股东朱建琴去世,享年57岁

深蓝新材料创始股东朱建琴去世,享年57岁

界面新闻
2026-06-22 15:06:34
寿宁抬棺事件通报为何引起争议?又凸显了什么?| 何兰生

寿宁抬棺事件通报为何引起争议?又凸显了什么?| 何兰生

农见度
2026-06-22 10:04:37
王毅刚走,蒙古恳求中国,"借道"把稀土运给日本!成全蒙日合作?

王毅刚走,蒙古恳求中国,"借道"把稀土运给日本!成全蒙日合作?

阿器谈史
2026-06-22 00:18:40
赚麻了!51岁贝克汉姆成世界杯最大赢家,一届赛事狂赚1.7亿

赚麻了!51岁贝克汉姆成世界杯最大赢家,一届赛事狂赚1.7亿

王大发不懂球
2026-06-21 20:30:05
其实现在已经是裁员潮了

其实现在已经是裁员潮了

曹多鱼的财经世界
2026-06-22 12:40:51
乌克兰猛烈袭击克里米亚

乌克兰猛烈袭击克里米亚

名人苟或
2026-06-22 15:09:44
英国首相斯塔默宣布辞职!上任不到两年,英国10年内将迎来第7位首相

英国首相斯塔默宣布辞职!上任不到两年,英国10年内将迎来第7位首相

极目新闻
2026-06-22 17:14:12
人民日报怒批机关事业单位的三大怪状,引基层人员共鸣!

人民日报怒批机关事业单位的三大怪状,引基层人员共鸣!

职场资深秘书
2026-06-22 14:38:13
涨粉1400多万却接“失业通知书”,佛得角门将收不续约通知,奶奶曾变卖首饰养大他

涨粉1400多万却接“失业通知书”,佛得角门将收不续约通知,奶奶曾变卖首饰养大他

红星新闻
2026-06-21 23:13:52
日方逮捕一与电诈集团有关男子,外交部:望周边国家与中方一道加大执法合作力度

日方逮捕一与电诈集团有关男子,外交部:望周边国家与中方一道加大执法合作力度

澎湃新闻
2026-06-22 15:32:26
A股收评:历史第二成交天量!创业板指、科创50指数续创历史新高,小金属、培育钻石、大金融板块爆发

A股收评:历史第二成交天量!创业板指、科创50指数续创历史新高,小金属、培育钻石、大金融板块爆发

格隆汇
2026-06-22 15:09:26
新闻背景|10年间,英国6位首相辞职

新闻背景|10年间,英国6位首相辞职

新华社
2026-06-22 17:41:08
台湾方面不接受“一国两制”,王毅回应:往后台湾只有一个称呼

台湾方面不接受“一国两制”,王毅回应:往后台湾只有一个称呼

人生录
2026-06-22 15:37:48
东南亚人口拐卖最新套路:20万一个人,落地就被卖进园区!

东南亚人口拐卖最新套路:20万一个人,落地就被卖进园区!

命运自认幽默
2026-06-22 01:28:36
世界杯官方发土味喜报祝贺中国裁判,网友:官方太会整活了

世界杯官方发土味喜报祝贺中国裁判,网友:官方太会整活了

大象新闻
2026-06-21 22:25:38
2026-06-22 18:23:00
电厂 incentive-icons
电厂
探索科技公司的未知,为你充电
2190文章数 1060关注度
往期回顾 全部

科技要闻

智谱盘中狂飙超40%,市值破万亿港元

头条要闻

离异男爽快加价20万买房 过户后卖家傻眼:房子被抵押

头条要闻

离异男爽快加价20万买房 过户后卖家傻眼:房子被抵押

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

陪睡陪玩是皮毛,向佐揭内娱暗规则

财经要闻

多部门核查"婴幼儿纸尿裤甲酰胺问题"

汽车要闻

电动MINIJCW缎光特别版藏锋上市尽显低调赛道本色

态度原创

家居
本地
亲子
房产
旅游

家居要闻

绿意盎然 自然之境

本地新闻

龙腾资江 韵动邵阳

亲子要闻

送给新手妈妈的三个建议,既真诚又实用,新手爸妈都该看一看

房产要闻

一年时间,36个盘“消失”!海口楼市,罕见“大收缩”!

旅游要闻

711万游客赴约!上海端午以传统新意撬动百亿文旅消费

无障碍浏览 进入关怀版