![]()
新眸原创·作者 | 李小东
百度选在2026年Create大会开幕前四天,端出了文心大模型5.1。
这个时间点的选择不算意外。5月13日的开发者大会需要一张技术底牌,而距离上一个版本发布已过去近半年,市场上关于“百度大模型掉队”的声音正在变响。
这个时候推出的文心5.1,需要用数据来回击这些质疑,而它也的确拿出了几张够硬的牌:搜索榜国内第一,预训练成本仅为业界同规模模型的6%,Agent能力超越DeepSeek-V4-Pro。
但回看百度过去一年的AI轨迹,一个问题很难回避:技术上的领先,似乎并没完全转化为市场端的领先?文心5.1给出的答案,分量又有多重呢?
01
三组数据
和解一桩“旧案”
先看文心5.1到底亮出了什么。
根据LMArena大模型竞技场最新排名,文心5.1以1223分位列搜索榜国内第一、全球第四,是该榜单中唯一上榜的国产大模型。它的Preview版本早在4月30日就以1476分登顶文本榜国内第一,超越GPT-5.5和DeepSeek-V4-Pro,是前十五名中唯一入围的国产模型。
![]()
对于一家从2023年起就被反复质疑“大模型没声音了”的公司来说,这两项成绩是某种意义上的“解案”,至少从榜单维度看,百度的模型能力没有掉队。
不过值得讨论的,的确不是分数,而是分数背后的技术路径选择。
文心5.1的核心技术叫“多维弹性预训练”。这个提法最早在文心5.0发布时出现,它的逻辑是:在一次预训练过程中,通过动态采样机制同时优化大量不同深度、专家容量和稀疏度的子模型,最终构建一个覆盖不同参数规模和计算预算的子模型矩阵。
翻译成白话就是,一次训练,生成多种型号,不再需要为每种规模单独烧一次算力。按照研发人员的表述,这套框架分别沿弹性深度、弹性专家容量和弹性稀疏度三个维度做压缩与扩展,通过可变Top-k路由灵活调配激活专家数量,在推理开销和模型性能之间建立可控的调节空间。
落到具体数字上:文心5.1的总参数被压缩到文心5.0的约三分之一,激活参数压缩到约二分之一,预训练计算成本仅为同规模同类模型的6%。
6%这个数字很容易被误读。它不是说“用6%的钱做出了100%的性能”,而是说,在同等参数量级和性能水平下,训练阶段消耗的算力只用了行业惯常的6%。这是通过“模型压缩和弹性训练大幅降低冗余计算”来达成的,是一种预训练环节的效率提升。
在2026年全球数据中心能耗争议持续升级、国产芯片供给尚不宽裕的背景下,这个方向的选择,说服力不弱。
再看评测数据。在τ³-bench和SpreadsheetBench-Verified两项智能体评测任务中,文心5.1超越了DeepSeek-V4-Pro,官方给出的描述是“智能体能力已接近领先闭源模型的水平”。创意写作方面则与Gemini 3.1 Pro持平,在AIME26数学竞赛(使用工具)上拿到99.6分,仅次于Gemini 3.1 Pro。
![]()
这些数据大多是百度内部评测或较小的基准测试,并不是LMArena那种大规模盲测榜单,稳健性还需更多第三方验证,但整体方向是清晰的:这代模型的升级空间主要在Agent和深度搜索能力上,而非纯粹的语言表达。
目前,文心5.1已在千帆模型广场和文心一言官网上线,开发者可以通过千帆平台调用API。百度还宣布将文心5.1陆续接入ISEKAI ZERO、Mulan AI、谛听幻流、Storymaster等超过十个创意生产智能体平台。
这个动作的意图明显,不是只谈模型,而是谈模型落地。
放在整个行业,文心5.1在产品端的节奏不算慢。但真正让百度头疼的,一直都不是技术。
02
百度选了一条不同的路
如果单纯比打分,文心5.1并不弱势。但2026年的AI市场,尤其在中国,产品竞争,相比看分数,大家更在乎的是谁的用户多、场景多。
2026年春节,四家大厂在AI领域的总营销投入接近50亿元。百度抢先开局,拿出5亿现金红包,把入口全部放在百度App生态内。字节豆包投入15亿到20亿,腾讯元宝10亿,阿里千问出手最重,60亿。
根据QuestMobile的数据,春节前后字节豆包以8400万日活开局,除夕当天冲到1.45亿峰值;阿里千问活动次日日活达到7352万;腾讯元宝除夕4054万。而百度文心的用户增长曲线动静平平。
外界感知到的是,百度在C端用户的争夺中正在被甩开,虽然模型能力不断迭代,但公众感知严重滞后。这是中国AI产业一个特有的悖论,技术团队不断优化训练效率,但用户只关心“这玩意儿能不能帮我订机票”。两个坐标系互相不认识。
如果要说一个更大的行业叙事,2026年上半年的关键词,正在从“军备竞赛”切换到“商业化”。
前不久,字节豆包启动收费模式,最低档68元/月,最高5088元/年,评论区被“又笨又收费”的骂声淹没。但不要搞错,这是全行业的拐点。上个月,阿里云、腾讯云、百度智能云和智谱同步涨价,部分涨幅高达463%。
在C端用户还在习惯“免费AI”幻象的时候,大厂们已经开始算现实的成本:API调用量每涨一波,模型的推理成本就跟着翻番。
百度实际上比大多数同行更早感受到了这种压力的峰值。2025年Q3,百度核心在线营销收入153亿元,同比下降18%,和2023年Q2的峰值197亿元相比,跌去了超过五分之一。这个缩水不是周期性的,而是结构性的——用户不再愿意从一页链接里自己找答案,AI直接给答案才是新习惯。对用户体验来说是好事,但对搜索广告这个百度最大的利润支柱来说,基础开始松动。
李彦宏的选择是押注AI转型。到2025年Q4,百度AI新业务收入达到113亿元,占核心非在线营销收入的43%。AI云收入在Q3同比增长33%,AI原生营销服务收入同比激增262%。一减一增之间,百度的业务结构确实在变。
回到文心5.1,如果放在这个商业化视角下重新审视,它传递的信号不只是“比分高”,看点在于,“训练成本是行业6%”。在API价格集体走高的2026年,训练成本优势就是云服务的定价权和利润空间。
百度在AI云的竞争力,取决于能否把文心大模型的效率优势转化为持续性收入增长。这个命题,比在Benchmark榜单上拿一个第一要难得多。
03
文心5.1的价值
或许在百度App里
那么,文心5.1的真正价值在哪里?
如果只是将它当作一个API调用的标准模型,技术数据上它确实有说服力。但对于百度来说,需要思考的是,如何把它嵌入到百度App这个月活超2亿的超级入口中。
今年初,文心助手月活突破2亿,春节期间百度把红包入口全部导向了百度App。这个策略说明百度已经放弃了做独立AI App的打法,它要回到自己的主场,用AI重塑搜索。
在百度世界大会2025上,李彦宏透露,百度搜索首条结果的富媒体覆盖率已达70%。用户搜索一个问题,AI直接给出结构化的图文答案,而不再是一排蓝链接。这对用户是好事,对广告收入是坏事——因为点击行为会大幅减少,广告库存跟着缩水。
这是一个商业悖论:用户体验越好,变现越难。
文心5.1给出的答案,在它被着重强调的“搜索能力”里。它的“多源信息快速检索、整合与生成能力”,理论上可以用来给出更丰富、更个性化的答案。而这些高质量的信息整合结果,本身就可能成为新的广告呈现方式——不是链接广告,而是内容嵌入式的信息推荐。
在这个逻辑下,AI搜索不是吃掉广告收入,而是换一个方式重建广告收入。能不能走通,取决于百度在5月13日Create大会上公布的商业化路径,是否足够清晰。
同时不能忽视的是百度在算力侧的布局。旗下昆仑芯已向港交所提交上市申请,同时百度构建的三万卡智算集群为大模型训练提供基础支撑。在2026年国产芯片替代加速的语境下,“自研芯片+自研模型”这个组合的远期价值,可能比文心5.1本身更值得关注。
高盛在近期报告中指出,中国AI训练将越来越依赖高度优化的计算效率架构,而非单纯堆算力规模。百度目前的路径,通过软硬协同优化把训练成本压缩到极致,与这个产业方向高度对齐。
文心5.1是一张技术底牌,在搜索能力、训练效率和Agent能力三个维度上都给出了可以量化的提升。它最硬的数字在于那“6%”,在算力贵过黄金的时代,效率本身就是壁垒。
但2026年的中国AI竞争,早已过了“参数和跑分”定胜负的阶段。商业化的压力、用户规模的争夺、行业场景的渗透,构成了一套远比Benchmark更复杂的评判体系。5亿红包打不出水花的尴尬,大模型上车的错失,搜索广告失速带来的利润真空——这些不是文心5.1凭技术数据能解决的。
5月13日Create大会,李彦宏将登场。届时决定的可能不是“文心产品如何迭代”,而是百度在AI这条路上,到底准备怎么把钱挣回来。在大厂集体进入“算账生存”模式的2026年,这个答案,也许才是市场最想听到的。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.