![]()
作者丨青风
编辑丨六子
“过去一年鼓吹大模型吹了很多,但实际上没有解决任何问题。”
“今天手机端交互效率能做到85分到90分,座舱车机交互却长期停在四五十分。”
腾讯智慧出行副总裁钟学丹和火山引擎副总裁杨立伟,在最近举行的北京车展上发表了类似的观点。如果说上一届车展的关键词是“大模型上车”,那么本届车展潮流的主角,则变成了AI Agent(智能体)。
从地平线的“KaKaClaw咖咖虾”,到斑马智能的AutoClaw;从中科创达的AquaClaw,到火山引擎的“汽车大脑”——往届占据展板最醒目位置的续航里程、激光雷达、百公里加速等参数,如今已被Agent、龙虾、智能体、舱驾融合等字样全面取代。
过去的智能座舱追求“让车听懂人话”,现在则是“让车把事办完”。这场从被动响应,到主动代理的范式转换,远比换一块更大的屏幕、加一颗更强的芯片来得深远。
01
「从功能供应商,到系统定义者」
过去十多年,互联网公司进入汽车产业,大多只能提供地图、音乐、语音引擎等某一项能力。但智能体上车,正在打破这一格局——科技公司有望从边缘的功能供应商,向更核心的系统定义者跃迁。
火山引擎的核心打法,就是做一个“统一的汽车大脑”。不同于行业普遍采用的“大模型+传统语音架构”的拼接方案,火山引擎基于Agentic AI架构重构了整个座舱系统。
“能提供情绪价值很好,但首先要把事办好,把基础、高频的功能做到足够丝滑。”杨立伟在车展上表示,过去两年大模型上车走了弯路,很多车企把精力放在了让车机讲笑话、背古诗上,却忽略了用户最核心的需求。
火山引擎的数据印证了这一点:在日均3000万次交互中,车控占比53%、导航占比29%、媒体占比10%,闲聊类需求不足5%。
![]()
*图源2026年北京车展现场
为此,火山引擎推出了两种合作模式:轻量化的“AI座舱套件”供车企灵活选配,而投入资源最多的是完整产品形态的“豆包座舱助手”——它能与手机端豆包无缝打通,用户在手机上训练的所有偏好,上车就能直接继承。
如果说火山引擎是“大脑派”的代表,那么地平线就是“整车派”的旗手。4月22日,地平线抢先发布了中国首个整车智能体操作系统“KaKaClaw咖咖虾”,以及中国首款舱驾融合整车智能体芯片“星空6P”。
“星空6P”采用5nm车规级工艺,BPU算力达650 TOPS,通过统一内存架构与统一底软,实现了“一芯双用”。据地平线透露,这组方案能让整车空间占用缩小50%、单车综合成本降低1500至4000元、研发周期从18个月缩短至8个月。目前该方案已获得大众、奇瑞、比亚迪等十余家车企的意向量产合作。
商汤绝影走的则是纯端侧部署的路线。其首发的Sage Box千机智盒,内置了7B参数的Sage端侧大模型,不需要连接云端就能完成所有智能体功能。端侧部署不仅带来了0.5秒级的响应速度,更重要的是,它能更好地解决云端成本问题。
商汤绝影负责人王晓刚算了一笔账:一辆采用云端方案的车,每天的Token费用约30元,万车规模下一年就是1.095亿元。而端侧方案一次性投入硬件成本后,后续几乎没有运营费用。
腾讯的优势从来都不是模型,而是生态。本届车展,腾讯发布了“出行全场景智能体开放平台”,一口气推出了7个场景化智能体;此外,斑马智能(据天眼查,原斑马智行)与阿里千问联合推出了AutoClaw方案,主打多智能体协同;中科创达发布了基于OpenClaw架构的滴水AIOS 2.1;面壁智能则依靠轻量化的MiniCPM模型,在中低端车型市场快速落地。
02
「从“陪聊”,到“办事”」
当所有厂商都在喊“智能体”的时候,一个核心的问题随之浮现:智能体到底和传统的语音助手有什么区别?为什么偏偏是2026年,智能体突然成了行业共识?
过去两年,超过10家车企密集接入大模型,但用户体验并没有本质提升。你说“打开空调24度”,它能听懂;但你说“我有点冷”,它可能只会机械地问你“要不要打开空调”;你说“导航去公司”,它能执行;但你说“先去接我老婆,再去公司,顺便买杯咖啡”,它就彻底懵了。
传统车载大模型本质上是用一个更聪明的引擎替换旧的语音引擎:用户问,它答,对话更自然了,知识更丰富了,但底层逻辑仍是回合制问答。而Agent是由目标驱动的:用户说出需求,它能理解意图、拆解任务、调用工具、执行闭环。
“KaKaClaw不只是长了一张嘴跟你对话,还长出了两个钳子帮你完成任务。”地平线创始人余凯这句话,概括了智能体与传统语音助手的本质区别。
他表示,用户不需要告诉车“先开导航、再开空调、最后放音乐”,只需要说“我要舒服地回家”,系统就会自动拆解目标、调度资源。它会结合当前的温度、车速、你的历史偏好、后排有没有人在睡觉,自动做出一套组合决策——可能是开一条缝的车窗,加上调低两度空调,再打开座椅通风。
![]()
*图源地平线发布会
除此之外,智能体还完成了一个关键升级:从功能孤岛,变成了系统中枢,它能跨域调度众多车载功能和外部服务,不用再让用户在十几个App之间来回切换。
而车内智能体之所以在2026年成为业内共识,源于几个因素的交汇。
首先,大模型在意图理解、任务规划和多模态感知方面的能力,已能够支撑复杂的车载场景;5nm车规芯片的发布使得端侧高算力具备了部署条件。
特别是近期爆火的开源AI智能体框架OpenClaw(龙虾),以其独特的任务拆解和工具调用能力,为整个行业提供了一个可参考的技术底座。OpenClaw能够读取本地文件、操作浏览器、运行脚本、调用API,甚至拆解复杂任务并自主完成多步骤流程。这一技术特征决定了它不仅仅是“会思考的大脑”,而是具备操作能力的“数字执行体”。
其次,座舱竞争成为行业最大公约数。当新能源汽车渗透率逼近50%,三电技术的差异化红利逐渐消退,2026年辅助驾驶技术路线也已趋于收敛、同类配置的驾驶体验逐渐趋同,座舱体验就成为了车企打造差异化竞争力的核心战场。
智能座舱宣传了很多年,但随着AI技术的快速迭代,消费者当前对“智能”的认知和要求越来越高,人们已不再满足于能聊天的车机,而是期待一个能办事的智能助手。
03
「智能体上车的“最后一公里”」
智能体的出现,不仅将彻底重构人车关系,更给了互联网公司一个千载难逢的机会——第一次,他们有机会从汽车产业的边缘,走到舞台的中央。
比如,当用户习惯了豆包座舱助手,它就会像Windows之于PC、iOS之于手机一样,成为一个不可替代的入口。这也是为什么火山引擎愿意“现阶段不追求利润”,投入上百人团队去做标杆项目。
据行业研究报告数据,2025年全球汽车AI市场的规模已达188.3亿美元,预计到2030年将增长至384.5亿美元。另有数据显示,全球汽车AI智能体市场从2025年的15.12亿美元有望以42%的年复合增长率扩大至2032年的130.9亿美元。
然而机遇有多大,挑战就有多刺手。当目光从展台炫酷的演示移向真实的商业落地,三道难以逾越的坎横在所有玩家面前。
第一道坎是从能说到能干的工程鸿沟。打通底层车控接口的开放与安全架构,是Agent量产必须跨越的“最后一公里”。杨立伟将其工程难度概括为“只能硬啃”——他们用了三年时间,才把大模型可调用的车控接口从100多个扩展到1000多个,并让模型能感知环境状态、积累用户偏好,最终获得能主动识别、规划和处理任务的能力。
第二道坎是仍在迷雾中的商业模式。算力和Token的持续消耗意味着真金白银的成本。杨立伟在车展上明确表态“不追求现阶段有多少利润”,但当模式走向规模化,商业化是绕不开的重要一环。斑马智能提出的“订阅分润”路径提供了一种选择,但用户的长期付费意愿尚未经市场验证。
![]()
*图源北京车展斑马智能展区
第三道坎是隐私与安全的紧箍咒。Agent之所以“懂你”,需要有记忆能力,能获取并记住用户的个人偏好和行为数据。但如果一位朋友上了车,车机AI会不会当众提醒你上一次的就医记录?
此外,当Agent的能力从聊天,延伸至控车,任何一个“幻觉”导致的错误操作都可能是无法承受的生命代价。Agent的能力越强,安全边界的划定就必须越清晰。
火山引擎与荣威共同建立的彩色、灰色、黑色三级权限体系提供了一个参考:空调、座椅等舒适功能AI可直接调控,行驶中座椅调节等功能AI仅能提建议,刹车、转向等核心驾驶功能则是绝对禁区。
更大的挑战,是车企与科技公司之间的控制权之争。一辆车有几千个底层接口,这些接口是车企的命门。如果把它们全部开放给AI厂商,就等于把自己的产品定义权交了出去。这也是为什么很多车企嘴上喊着拥抱AI,实际上只愿意开放最表层的接口。
但无论挑战多么艰巨,趋势已经不可逆转。2026-2027年,将是智能体上车的关键窗口期。汽车智能化的上半场,比的是谁的屏幕更大、芯片更强、激光雷达更多。而下半场,比的是谁的AI更能懂你、更能办事。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.