网易首页 > 网易号 > 正文 申请入驻

94%任务完成率,商汤Sage让车载智能体跑出云端实力

0
分享至



当全球科技巨头仍在云端大模型赛道“重金押注、堆叠算力”时,中国AI企业商汤绝影悄然在另一个战场投下了一枚“深水炸弹”。

近日,该公司发布端侧多模态智能体基座大模型Sage,以“小身材、大能量”的姿态,在一项名为PinchBench的国际权威智能体评测中,以94%的最佳任务完成率,击败了包括Claude、GPT-5.4、Google Gemini在内的众多云端“巨无霸”模型。



以小博大的效率革命

长久以来,汽车座舱的智能化面临一个“两难困境”:依赖云端,则存在延迟、成本高昂及网络稳定性问题;而受限于芯片算力,部署在车端本地(端侧)的模型,又大多只能进行简单的指令响应,难以胜任复杂的、多步骤的“智能体”任务。

Sage的出现,似乎正在打破这个僵局。这辆“小车”,凭什么跑赢了“超算”?

根据商汤绝影公布的资料,Sage模型的总参数规模为320亿,但在处理具体任务时,实际被激活参与运算的参数仅30亿。

打个比方,这就像一座拥有庞大图书馆(总参数)的智库,在面对任何具体问题时,都能瞬间找到最相关的几本书(激活参数)来高效解答,而非盲目地翻遍整个书库。

正是这种“精打细算”的效率,让Sage得以在资源有限的车载芯片(如英伟达Orin X)上流畅运行。相比之下,某些云端大模型要达到同样效果,其激活运算量是Sage的14倍甚至更多,好比用大型工业机械与一台高精度机床比赛加工精密零件,后者在特定场景下反而能凭借“巧劲”胜出。

PinchBench测试恰是检验这种“巧劲”的绝佳舞台。这个被业内称为“龙虾之父”推荐的评测,不考死记硬背,专测“真本事”。

它的任务库覆盖写作、编程、文件处理、日程规划等真实工作流,重点考察模型调用工具、分步骤推理、并最终完成复杂任务的能力。Sage在此拔得头筹,意味着其在“办事”的实战能力上,已不输甚至超越了那些需要庞大云端服务器支持的对手。

从“能听会说”到“说到做到”

端侧模型仅仅“瘦身”是不够的,要真正“聪明”起来,还需解决学习成本和执行准确性的难题。

为此,商汤为Sage配备了两项核心技术——“高效学习法”(SCOUT)和“实时纠错本”(ERL)。

训练AI完成一个复杂任务(比如规划一条整合了充电、餐饮、避开拥堵的跨城路线),如果让大模型自己反复试错,耗时长且计算成本(GPU小时)极高。

SCOUT(分级协同学习框架)便是用来解决“学费”太贵的问题。它的思路是“让侦察兵先探路”:先派一个轻量级的小模型快速尝试各种解决方案,把其中可行的路径筛选出来,再由大模型专注学习这些“高分经验”。这种方法被称可将复杂任务的学习成本降低约60%。

ERL(可擦除强化学习) 则致力于解决“一步错,步步错”的执行难题。

假如用户指示“帮我订一家明天适合家庭聚餐、有儿童娱乐区、且在我回家顺路上的餐厅”,需要模型连续完成多个推理步骤,一旦中间某步理解偏差(如忽略了“顺路”),结果就会谬以千里。

ERL技术赋予模型“边想边改”的能力,能够自动识别并擦除推理链条中的错误步骤,重新生成正确逻辑。这项技术让Sage在复杂任务上的完成率提升了20%。

正是这两项技术的结合,推动Sage从一个“语言模型”进化为了能独立闭环完成任务的“智能体基座”。

重新定义端侧AI的想象力

有行业专家认为,Sage的亮相,为智能汽车产业带来了多重变量的思考。

首先,是“舱驾一体”落地路径的清晰化。高级别自动驾驶与智能座舱的融合(舱驾一体)是行业共识,但融合的底层核心之一,是一个强大、高效且能本地实时处理多模态信息(语音、视觉、传感器数据)的“大脑”。

Sage证明了在现有主流车规级芯片上,部署能处理复杂规划、具备强推理能力的AI大脑是可行的,这为舱驾一体的量产方案扫清了一个关键的技术障碍。

其次,是端侧AI价值主张的强化。在隐私敏感、网络环境复杂(如隧道、山区)、以及需要瞬时响应的车载场景下,本地化能力无可替代。Sage的表现意味着端侧模型不再是简化版的云端附属,而能独立提供高质量、高可靠的服务,这或将引发车企在智能化方案上新的权衡。

因此,商汤绝影通过Sage模型,演示了一条绕过纯算力“军备竞赛”、通过架构与算法创新实现“降维打击”的路径。这不仅是技术的进步,更是工程化思维与商业洞察的胜利。当“小车”开始跑赢“超算”,整个智能汽车产业链的玩家,或许都需要重新审视手中的技术地图与竞争策略。

采写:南都·湾财社记者 胡雯雯

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普儿媳抖家族猛料:伊万卡爱提建议,公公喜欢半夜打电话

特朗普儿媳抖家族猛料:伊万卡爱提建议,公公喜欢半夜打电话

像梦一场a
2026-04-23 22:48:46
当年刘恺威杨幂两个确实是生理性喜欢

当年刘恺威杨幂两个确实是生理性喜欢

科学发掘
2026-04-24 06:45:03
2.0L!雷克萨斯确认:新车降价7万元

2.0L!雷克萨斯确认:新车降价7万元

手机评测室
2026-04-23 11:51:45
美以失算!伊朗强硬派全面掌权,温和派靠边站,美伊谈判又熄火

美以失算!伊朗强硬派全面掌权,温和派靠边站,美伊谈判又熄火

国是直通车
2026-04-22 20:39:30
5月1日起高速收费大变!跑多少付多少,8-9座车直接省一半

5月1日起高速收费大变!跑多少付多少,8-9座车直接省一半

洞见小能手
2026-04-23 00:20:03
5月1日新规落地!烟酒礼品全面管控,公职人员迎来全面约束

5月1日新规落地!烟酒礼品全面管控,公职人员迎来全面约束

罐头告诉猫迷
2026-04-24 03:40:10
随着曼城英超登顶,巴萨领先皇马9分,五大联赛最终冠军基本如下

随着曼城英超登顶,巴萨领先皇马9分,五大联赛最终冠军基本如下

球场没跑道
2026-04-23 07:38:18
拉夫罗夫:莫斯科将把全部历史上的俄罗斯土地归还其合法家园

拉夫罗夫:莫斯科将把全部历史上的俄罗斯土地归还其合法家园

冷峻视角下的世界
2026-04-24 01:14:37
在秘鲁全面爆发政治危机之际,洛克希德·马丁赢得F-16战斗机订单

在秘鲁全面爆发政治危机之际,洛克希德·马丁赢得F-16战斗机订单

零度Military
2026-04-24 07:22:14
砸6700亿建雄安,面积抵3个纽约,如今究竟咋样了?

砸6700亿建雄安,面积抵3个纽约,如今究竟咋样了?

娱乐圈的笔娱君
2026-03-26 12:15:32
多库:想有“吃饼式”进球;40米内胡桑诺夫比我速度快

多库:想有“吃饼式”进球;40米内胡桑诺夫比我速度快

懂球帝
2026-04-24 07:08:07
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
中纪委2026严查新方向,这6类岗位首当其冲

中纪委2026严查新方向,这6类岗位首当其冲

细说职场
2026-04-23 09:15:43
比哲凯赖什还水?阿森纳砸了3.2亿,却养出一个“新卡尔斯特伦”

比哲凯赖什还水?阿森纳砸了3.2亿,却养出一个“新卡尔斯特伦”

澜归序
2026-04-24 03:48:51
许家印认罪后,恒大前美女高管曝惊人内幕,众多大佬集体落幕

许家印认罪后,恒大前美女高管曝惊人内幕,众多大佬集体落幕

云舟史策
2026-04-24 07:21:19
德天空:桑乔收到了多份报价;他明确表示想再次加盟多特

德天空:桑乔收到了多份报价;他明确表示想再次加盟多特

懂球帝
2026-04-24 05:54:06
信阳毛尖“毁”在谁手里?

信阳毛尖“毁”在谁手里?

华商天下
2026-04-22 16:55:15
事实证明,已经“消失”7年的周立波,早已走上一条不归路

事实证明,已经“消失”7年的周立波,早已走上一条不归路

素衣读史
2026-04-16 19:41:20
失踪足足5天后,美军终于承认:价值16亿的最强无人机在中东没了

失踪足足5天后,美军终于承认:价值16亿的最强无人机在中东没了

起喜电影
2026-04-23 14:23:40
至今,还有13个国家和中国没有建交,他们都是谁?

至今,还有13个国家和中国没有建交,他们都是谁?

深度报
2026-04-22 22:30:57
2026-04-24 07:56:49
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
607915文章数 3588211关注度
往期回顾 全部

汽车要闻

预售30.29万起 岚图泰山X8配896线激光雷达

头条要闻

特朗普发文后 伊朗最高领袖、总统、议长、外长齐发声

头条要闻

特朗普发文后 伊朗最高领袖、总统、议长、外长齐发声

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

普华永道赔偿10亿 恒大股东见到"回头钱"

科技要闻

马斯克喊出"史上最大产品",但量产难预测

态度原创

家居
本地
旅游
手机
公开课

家居要闻

浪漫协奏 法式风格

本地新闻

SAGA GIRLS 2026女团选秀

旅游要闻

走进榉溪村

手机要闻

vivo X500 Pro Max被曝光:2nm工艺+5GHz,2K直屏九月发!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版