网易首页 > 网易号 > 正文 申请入驻

闪电快讯|借鉴DeepSeek训练模式,商汤绝影推出全新智驾解决方案

0
分享至

记者|董温淑

编辑|高宇雷

2月22日下午,商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚于上海发布了行业首个“与世界模型协同交互的端到端自动驾驶路线R-UniAD”,并预告将于4月上海车展发布R-UniAD端到端自动驾驶方案,并完成实车部署。

R-UniAD可通过构建世界模型生成在线交互的仿真环境,用以进行端到端模型的强化学习训练。王晓刚称,R-UniAD与春节开始持续受到市场关注的DeepSeek技术创新思路同归一源:从模仿学习向强化学习升级演进,从而实现端到端自动驾驶超越人类的驾驶表现。

强化学习是除了监督学习和非监督学习之外的第三种基本的机器学习方法。在现行大模型的训练过程中,三种方法在不同阶段均有使用。强化学习指智能体(Agent)通过与环境(Environment)的交互学习最佳策略、不断提升智能程度。

不同的是,相较于OpenAI所研发的GPT系列大模型等竞品普遍采用基于人类反馈(有监督)的强化学习(RLHF,)模式进行训练,爆火的DeepSeek R1大模型采用的是一种更为简单的强化学习模式,即仅专注于特定任务的指标优化模型效果,而减少人类监督占比,因此资源需求更低。

王晓刚称,基于强化学习的大模型技术路线可以迁移到端到端自动驾驶算法的训练与研发之中。

(商汤绝影R-UniAD多阶段强化学习端到端自动驾驶技术路,图源/商汤科技)

商汤绝影的R-UniAD是「多阶段强化学习」端到端自动驾驶技术路线,具体分为三个阶段,首先是依靠冷启动数据通过模仿学习进行云端的端到端自动驾驶大模型训练;然后基于强化学习,让云端的端到端大模型与世界模型协同交互,持续提升端到端模型的性能;最后云端大模型通过高效蒸馏的方式,实现高性能端到端自动驾驶小模型的车端部署。

从数据规模来看,多阶段强化学习的训练方法能大幅降低端到端自动驾驶数据规模门槛。R-UniAD就是通过高质量数据进行冷启动,用模仿学习的方式训练出一个端到端基础模型,再通过强化学习方法进行训练。据测算,小样本多阶段学习的技术路线能让端到端自动驾驶的数据需求降低一个数量级,让车企合作伙伴有望换道超车特斯拉FSD(Full Self-Driving,全自动驾驶)。

从性能上限来看,纯强化学习训练有望在提升端到端智驾模型性能的同时,充分探索多元场景和驾驶风格。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一夜间,3家A股公司终止上市,2家被立案调查

一夜间,3家A股公司终止上市,2家被立案调查

钱眼
2026-05-30 19:27:53
26岁接班内德维德,27岁却沦为尤文鸡肋,快马一招鲜却没能吃遍天

26岁接班内德维德,27岁却沦为尤文鸡肋,快马一招鲜却没能吃遍天

足篮大世界
2026-05-30 16:39:50
一顿饭就要花掉40万,四年敛财40亿,杭州土皇帝虞关荣有多嚣张

一顿饭就要花掉40万,四年敛财40亿,杭州土皇帝虞关荣有多嚣张

莫地方
2026-05-21 01:45:03
黄河每天将鱼冲入大海,淡水鱼在海里没法存活,这些鱼去哪里了?

黄河每天将鱼冲入大海,淡水鱼在海里没法存活,这些鱼去哪里了?

向航说
2026-05-24 00:30:03
恭喜曼联!葡萄牙铁腰铁心加盟红魔,卡里克2000万挖昔日爱徒

恭喜曼联!葡萄牙铁腰铁心加盟红魔,卡里克2000万挖昔日爱徒

体坛鉴春秋
2026-05-30 14:41:26
会谈失败,日本很寒心

会谈失败,日本很寒心

回京历史梦
2026-05-30 18:44:20
丁向群任国家金融监督管理总局党委书记

丁向群任国家金融监督管理总局党委书记

澎湃新闻
2026-05-29 19:26:32
南斯拉夫慢慢解体三十年后,六个国家如今都过得怎么样?

南斯拉夫慢慢解体三十年后,六个国家如今都过得怎么样?

爱竞彩的小周
2026-05-30 18:08:27
骑士总经理离职!甘西将出任76人篮球运营总裁:接替莫雷职位

骑士总经理离职!甘西将出任76人篮球运营总裁:接替莫雷职位

罗说NBA
2026-05-30 06:34:16
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
这一次,为什么没有人再质疑余承东?

这一次,为什么没有人再质疑余承东?

汽车有文化
2026-05-29 14:22:57
美国宣布没收伊朗10亿美元加密货币资产 贝森特:切断伊朗航空公司获取降落点、加油和售票的渠道

美国宣布没收伊朗10亿美元加密货币资产 贝森特:切断伊朗航空公司获取降落点、加油和售票的渠道

每日经济新闻
2026-05-30 15:52:23
梅根状态太绝!发量骨相全在线,小麦色抗老气场拉满

梅根状态太绝!发量骨相全在线,小麦色抗老气场拉满

述家娱记
2026-05-29 11:23:47
跨区收麦师傅一句话火了:河南老乡递来的东西,牛奶能收,麦芽果汁千万别碰!

跨区收麦师傅一句话火了:河南老乡递来的东西,牛奶能收,麦芽果汁千万别碰!

爱下厨的阿椅
2026-05-30 19:26:28
投资3000亿元,把渤海水引入新疆,打造18亿亩良田靠谱吗?

投资3000亿元,把渤海水引入新疆,打造18亿亩良田靠谱吗?

健身狂人
2026-05-30 00:50:51
女演员颜值有多重要?看刘浩存和杨紫就知道了,没对比就没伤害

女演员颜值有多重要?看刘浩存和杨紫就知道了,没对比就没伤害

草莓信箱
2026-05-20 02:30:26
党毅飞绝境翻盘,将不可能变成现实,逆转屠龙大胜韩第一人申真谞

党毅飞绝境翻盘,将不可能变成现实,逆转屠龙大胜韩第一人申真谞

L76号
2026-05-30 09:05:34
看见女邻居出轨,她上门找我求保密,我说:可以,但有一个条件

看见女邻居出轨,她上门找我求保密,我说:可以,但有一个条件

千秋文化
2026-05-10 19:41:24
意大利被警告勿聘请瓜迪奥拉和法布雷加斯,临时主帅痛批‘骗子’

意大利被警告勿聘请瓜迪奥拉和法布雷加斯,临时主帅痛批‘骗子’

绿茵情报局
2026-05-29 22:20:42
本田全新倒三轮渲染图曝光,家用代步新选择

本田全新倒三轮渲染图曝光,家用代步新选择

味健的汽车
2026-05-28 06:35:15
2026-05-30 22:04:49
电厂 incentive-icons
电厂
探索科技公司的未知,为你充电
2162文章数 1060关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

美防长香会谈中美关系 解放军专家学者代表团团长回应

头条要闻

美防长香会谈中美关系 解放军专家学者代表团团长回应

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

房产
游戏
本地
手机
公开课

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

欧冠之夜将至!PlayStation邀你一起见证新王诞生

本地新闻

用剪纸的方式,打开江苏扬州

手机要闻

Mate影像机皇来了!华为Mate 90系列支持增距镜:打鸟无敌

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版