![]()
![]()
亿级Agent时代即将来到,扎进Agent 地基里,也许能站得更稳、走得更久
文|吴俊宇
编辑|谢丽容
2026年,Agent(智能体)落地已经是AI产业的重点。
5月13日,Create 2026百度AI开发者大会,百度创始人李彦宏提出,AI不仅仅是模型,它是系统,是新一代计算机。百度作为平台型公司,为支撑智能体应用爆发,构建起了“芯云模体”全栈能力。整个底层基础设施,必须为智能体这个全新的主体重新搭建,方便智能体来调用。
算力基建潮后,下一个浪潮是AI应用,面对未来亿级Agent运行需求,百度正在试图重构一套覆盖“芯片-AI云-模型-智能体”的新全栈AI。
在今天,百度现在更像一家AI Infra(AI基础设施)公司。过去,市场常常将AI Infra理解为芯片、服务器、数据中心等硬件。但模型和Agent正在让它的内涵逐渐扩展——其中不仅包括芯片和AI云,也包括基础模型、Agent平台等一系列软硬件基础设施。
百度这一系列做法都是为了解决这一系列问题——如何让Agent发挥更大的价值?如何衡量Token(词元)价值?如何降低每一个Token的成本?
据我们不完全统计,2025年12月1日-2026年4月24日,全球11家主流模型公司,144天内至少发布或迭代了53款模型,平均每2.7天就会有一款模型发布或迭代(详见)。
国际市场调研机构IDC 2026年预测,全球活跃Agent(智能体)数量将从2025年的2860万,增长至2030年的22.16亿。五年后,活跃Agent数量将是目前的近80倍。
国家数据局3月24日显示,截至今年3月,中国日均Token调用量已超过140万亿,相比2024年初的1000亿增长了1400倍。
模型性能不断提升,Agent不断普及,Token消耗量指数级增长。世界正在奔向“亿级Agent”的时代,这是个螺旋上升的过程。
![]()
芯片决定单位算力成本,AI云决定资源调度效率,模型决定Token生成效率,Agent则决定Token能否真正产生业务价值。
百度这套“AI新全栈”,不仅要让Agent更好地完成任务,并在真实业务中稳定运行、持续进化、可管可控;也要让Token效能做到更高,提供每瓦性能更强、性价比更高的AI算力,进而转化成更好的Agent效果。
一个关键信号是,2025年三季度开始,百度财报不再按照“广告+非广告”划分业务,而是按照“AI新业务+传统业务”划分业务。百度今天的自我定位已经不再是一家流量和广告驱动的互联网公司,它更像是一家AI Infra公司。
![]()
做好Agent基础设施
在今天,Token成了很多公司AI转型的“北极星指标”,也成了大部分云厂商的核心销售指标。但是一个现实问题是,Token目前并不能真正反映业务价值。
因此,李彦宏提出一个观点——AI时代的度量衡可能是“日活智能体数”(Daily Active Agents,简称DAA),与移动互联网最通用的度量衡“日活用户数”(DAU)相对应。
![]()
在他看来,目前较接近业界共识的度量衡是Token消耗,但Token不一定代表终局,它代表成本,并不代表收益。它衡量的是投入,而不是产出。当人类进入智能体时代,衡量一个平台和生态的繁荣,更应该关注DAA这个指标,关注有多少Agents在给人类干活,并交付结果。这比无谓的Token消耗,更接近价值,也更接近本质。
李彦宏提出“日活智能体数”这个指标,实际上在说清楚,究竟什么才是有效Token。因为,很多企业2026年在Agent落地过程中正在遇到一道门槛——Agent框架还不成熟,30%-60%的Token被浪费了(详见)。
事实上,技术发展早期,没有浪费,就没有进步。Token浪费是行业发展早期出现的正常现象。因为,Agent就像一匹尚未被完全驯服的“野马”。它在执行任务时四处飞奔,不一定会按照人的意志朝着最短路径行走。它可能消耗100万Token,却没有真正完成任务。这些Token最终只是无效计算。
因此,Agent工具目前更重要的优化方向是——调度能力、长程执行能力、多Agent协同能力、任务完成率。做好这些工作之后,才能产生更高的单位Token价值。
那么,如何让企业客户真正用好自己的Agent?百度主要做了两件事情。
一方面,推出一批自研Agent产品,作为真实场景中的“样板间”,用户和开发者可以直接拎包入住。另一方面,提供成熟的Agent Infra(Agent基础设施),让企业内的开发者、业务人员搭建自己的Agent。
百度的自研Agent产品包括百度搭子DuMate(面向企业和个人的通用智能体)、秒哒(生成式应用开发平台)、伐谋(企业级的算法自进化智能体)、一镜(全场景多智能体数字人平台)。这些自研的成熟Agent产品正在各行各业大量落地。
2026年,最热门的通用Agent工具包括Anthropic的Claude Code、OpenAI的Codex,以及OpenClaw“龙虾”。此次发布的百度搭子DuMate与之定位类似。它将百度AI搜索、秒哒、伐谋等核心产品能力集成内置技能,还具备长程任务执行与主动决策能力。
百度方面称,百度搭子DuMate在开源基准测试平台PinchBench的Agent基准评测中达到了SOTA(业界头部)水平。
百度相关技术人士在一场小规模沟通中对我们透露,根据他们的内部测试,百度搭子DuMate在执行任务时的时长更短、Token花费也更少。
百度几款此前已经发布的Agent工具也取得了不同程度的业务进展:秒哒累计服务的用户已经超过了1000万人;伐谋已经被运用在中信百信银行的金融风控场景,以及中国能源建设集团广东院的海上能源平台的管线设计规划场景;此前一镜用于罗永浩的电商直播带货中,目前已经被一批知名的教育、电商博主使用。
![]()
这些百度自研的Agent产品,可以提供成熟服务。但在企业真实业务实践中,还有大量开发者、业务人员自己搭建的Agent,这些Agent正在企业内部工作流中不断生长。因此,企业还需要一套能够驾驭Agent的基础设施。百度给出的解决方案是千帆平台。
百度智能云AI与大模型平台总经理忻舟在一场小规模沟通中对我们解释,当前大模型在企业中的落地速度,远慢于模型能力增长速度。原因在于,企业真正缺少的并不是模型,而是完整的Agent运行基础设施。这些能力,决定了Agent能否真正进入企业生产环境。
百度千帆平台2023年3月诞生至今正在逐渐进化。它从最初的MaaS(模型服务)平台,逐渐进化成了今天的“MaaS+Agent”平台,支撑着企业使用模型和Agent。
它有更好的Agent驾驭工程(Harness Engineering)。其中不仅提供了完整的Agent执行环境。其中包括沙箱系统、工具调度、长上下文管理、多Agent协同、Agent安全体系、可观测系统等,还包括丰富的skill(技能)插件生态。它还有一项重要的能力是,把不同复杂度的任务动态路由到不同模型,并且通过推理引擎降低整体Token成本。
也就是说,千帆平台可以让Agent跑得快、跑得省,根据百度方面披露的数据,在百度的Agent Infra上,Token消耗量可以节省23%,任务成功率超过95%。
![]()
降低每个Token的成本
除Agent Infra可以降低成本,芯片和算力硬件层面也可以降低每一个Token的成本。
2026年,降低Token总成本的需求正在变得更强烈。因为,Agent工具的Token消耗量远超过去的AI对话工具。因为,Agent执行的是一系列任务。任务过程中,模型会不断用代码规划任务、调用工具并记录执行状态,每个步骤都可能触发新的模型调用。
一次对话可能只消耗数千Token,但一次任务可能就会消耗数万,甚至数十万、数百万Token。这会导致Token成本指数级增长。
![]()
百度创始人李彦宏在阐述百度的“芯云模体”新全栈AI能力
百度的做法是,通过“芯片-AI云-模型-智能体”的全栈协同,从这四层入手降低每一个 Token的成本。在Create 2026百度AI开发者大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖提到了“新全栈”这个观点。
他认为,当高活跃、高价值、规模化的智能体应用开始进入到客户的业务场景,AI云服务也必须重新定义。百度智能云正在转型升级成面向大规模Agent应用的“新全栈”AI云。
什么是“新全栈”,沈抖也进行了一些解释。
在Agent Infra上,要把单位Token的智能水平做到更好,让智能体更好地完成任务,并在真实业务中稳定运行、持续进化、可管可控。
在AI Infra上,提供每瓦性能更强、性价比更高的AI算力,把Token效能做到更高。让每一次训练和推理,都转化成更好的智能体效果。
芯片决定单位算力成本,AI云决定资源调度效率,模型决定Token生成效率,而Agent则决定Token能否真正产生业务价值。在芯片和AI云这两层,百度都取得了业务进展。
百度昆仑芯P800经过了真实的大模型训练、推理的锤炼。它目前销量不错,且单卡Token吞吐效率在国产AI芯片之中位居前列。国际市场调研机构IDC和摩根士丹利在2026年的数据显示,昆仑芯P800目前在国产AI芯片市场出货量位居前三。
早在2025年4月,百度昆仑芯P800就已经点亮了三万卡集群。此后,昆仑芯P800在互联网、金融、制造、教育、能源等行业都实现了超万卡交付。百度方面披露,在招商银行,昆仑芯P800支撑了50%以上的AI应用的运行。
目前百度的文心5.1大模型就是在昆仑芯P800上训练出来的。一位了解昆仑芯P800的资深技术人士对我们表示,经过近三年持续迭代,在典型训练场景下,昆仑芯P800模型训练精度对齐问题已不是主要障碍,在训练中小参数模型时也有一定性价比。后续重点是性能和工程层面的持续优化。
一位地方国企智算技术人士2025年12月曾对我们表示,他测试了昆仑芯P800等国产AI芯片的推理性能。昆仑芯P800跑DeepSeek-R1和阿里千问等经过适配优化的模型,Token吞吐效率优于英伟达H20。不过,国产AI芯片适配新模型,通常要一两个月。
百度昆仑芯P800还在推出256卡/512卡超节点产品。256卡昆仑芯超节点,已经在今年4月点亮,将在6月上市。百度方面披露的数据显示,它和国产主流模型进行了深度适配,推理效率提升50%。
超节点,是中国市场在先进GPU(图形处理器)长期紧缺、单卡性能相对不足的背景下采取的解决方案。超节点会把成百上千枚AI芯片集成在一个算力机柜中,常见规格包括32卡、64卡、128卡、256卡、512卡乃至1024卡。
它的核心并非简单堆叠芯片数量,而是用更大的集群规模、更快的带宽网络、更高的调度系统,把芯片组织成一个高效运行的整体。这可以减少因通信、散热等造成的性能损耗,进而提升整体有效算力——最终降低单位Token成本。
但降低单位Token成本,并不仅仅取决于单颗芯片性能,它更是云和集群的系统工程。
Token吞吐的系统瓶颈,也受制于集群调度、网络带宽与数据中心的协同效率。为此,百度正在升级GW(吉瓦)级别AI算力集群的建设方案。1GW级别的AI数据中心,已经接近一座中型城市的持续电力负荷,可以容纳10万级别的AI芯片协同运行。
百度智能云还在采取更多精细化的资源调度,例如,潮汐调度可以在不同时间段动态分配芯片资源,实现“削峰填谷”;P/D分离则会将推理中的计算密集型任务、高带宽任务分别分配给更适合的芯片;KVCache则通过缓存上下文,减少重复计算。
这些系统工程优化,最终目的都是用更低的成本吐出更多Token。
![]()
百度的定位变了
2025年三季度开始,百度的财报披露口径进行了一次调整。
此前,百度习惯用在线营销、非在线营销(智能云、其他业务)口径来披露自己的收入。按“广告+非广告”划分业务,这意味着广告仍是核心坐标。
但在这之后,百度财报采用了百度核心AI新业务(智能云基础设施、AI应用、Robotaxi、AI原生营销服务)、传统业务及其他这个新口径。现在按“AI新业务+传统业务”组织收入,这意味着AI业务已经是百度新的经营中心。
百度的财报口径变化,其实是在向市场说清楚自我定位。这种变化是及时的,它发生在百度的传统互联网广告业务进入结构性调整阶段,云、芯片、AI应用等业务有了规模化收入且战略方向清晰之时。
它的好处是,百度开始真正以独立经营的视角看待云、芯片、AI应用这些业务。这有助于破釜沉舟,真正把云、芯片、AI应用这些新业务做好。
按照这次新口径的统计,百度核心AI新业务2025年营收400亿元,同比增长48%。它在百度一般性业务(百度集团剔除爱奇艺之后的业务板块)中占比39%。
百度核心AI新业务三个板块2025年取得了不错的增长。智能云基础设施营收198亿元,同比增长35%;AI应用营收102亿元,同比增长5%;AI原生营销服务98亿元,同比增长301%。
![]()
事实上,现在的百度,从业务和财务重点来看,已经不是一家以互联网广告驱动的互联网公司。百度更像是一家以云、芯、AI应用等业务为主的AI Infra公司。
近两年,如果从超级AI应用、用户流量、AI对话工具日活等维度来看,百度并不是当前最具爆发力的AI公司。
做一款亿级日活的AI对话工具,并不是它的必选项。这不仅是因为算力成本太高了,真正打赢这场仗的概率太低。更关键的是,这和它的战略主线是偏离的。
2021年之后的百度,真正押注的方向并不是高流量的入口,而是AI基础设施——其中包括云、芯片等。
从2021年-2025年,传统广告业务面临结构性调整,以广告为核心的互联网公司,核心业务逻辑是流量变现,短视频、直播的火爆让这些公司流量变现的空间受到挤压。这几年,百度一直在采取用传统广告业务的现金流,去系统性支撑智能云、芯片、自动驾驶等面向未来的业务。
也就是说,百度的资源配置优先级很早就已经转向智能云、芯片等AI Infra业务。百度过去20多年长期积累的大规模搜索与推荐能力,正在迁移到AI时代的推理基础设施中。这些领域,百度的资本支出、研发支出相对更容易形成壁垒。
所幸的是,百度的AI基础设施业务——智能云、芯片,乃至是一批Agent工具业务已经逐渐长大,其中的智能云甚至能够自我造血。
AI时代的公司,正在逐渐分层。一些公司专注做超级应用,一些公司专注做基础模型,一些公司专注做Agent,一些公司专注做AI Infra。不同层级的公司,它们的商业模式、增长节奏、资本开支结构与资本市场预期,也开始变得不同。
作为一家AI Infra公司,百度可能很难像基础模型公司、应用公司一样取得爆发式增长。但它会走得更久、更稳、更长周期。因为,这些基础设施层的业务,需要一点一滴的改造。它需要优先考虑强化自身技术壁垒,进而取得稳健的增长和利润。
在AI产业新的分层结构中,百度正越来越偏向AI Infra这一层。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.