百度AI最新进展，李彦宏打出一张效率牌|腾讯|翻译|千帆|文心|百度ai|知名企业

百度AI最新进展，李彦宏打出一张效率牌

2026-05-11 12:16:58　来源: 新眸深度

江苏举报

分享至

新眸原创·作者 | 李小东

百度选在2026年Create大会开幕前四天，端出了文心大模型5.1。

这个时间点的选择不算意外。5月13日的开发者大会需要一张技术底牌，而距离上一个版本发布已过去近半年，市场上关于“百度大模型掉队”的声音正在变响。

这个时候推出的文心5.1，需要用数据来回击这些质疑，而它也的确拿出了几张够硬的牌：搜索榜国内第一，预训练成本仅为业界同规模模型的6%，Agent能力超越DeepSeek-V4-Pro。

但回看百度过去一年的AI轨迹，一个问题很难回避：技术上的领先，似乎并没完全转化为市场端的领先？文心5.1给出的答案，分量又有多重呢？

三组数据

和解一桩“旧案”

先看文心5.1到底亮出了什么。

根据LMArena大模型竞技场最新排名，文心5.1以1223分位列搜索榜国内第一、全球第四，是该榜单中唯一上榜的国产大模型。它的Preview版本早在4月30日就以1476分登顶文本榜国内第一，超越GPT-5.5和DeepSeek-V4-Pro，是前十五名中唯一入围的国产模型。

对于一家从2023年起就被反复质疑“大模型没声音了”的公司来说，这两项成绩是某种意义上的“解案”，至少从榜单维度看，百度的模型能力没有掉队。

不过值得讨论的，的确不是分数，而是分数背后的技术路径选择。

文心5.1的核心技术叫“多维弹性预训练”。这个提法最早在文心5.0发布时出现，它的逻辑是：在一次预训练过程中，通过动态采样机制同时优化大量不同深度、专家容量和稀疏度的子模型，最终构建一个覆盖不同参数规模和计算预算的子模型矩阵。

翻译成白话就是，一次训练，生成多种型号，不再需要为每种规模单独烧一次算力。按照研发人员的表述，这套框架分别沿弹性深度、弹性专家容量和弹性稀疏度三个维度做压缩与扩展，通过可变Top-k路由灵活调配激活专家数量，在推理开销和模型性能之间建立可控的调节空间。

落到具体数字上：文心5.1的总参数被压缩到文心5.0的约三分之一，激活参数压缩到约二分之一，预训练计算成本仅为同规模同类模型的6%。

6%这个数字很容易被误读。它不是说“用6%的钱做出了100%的性能”，而是说，在同等参数量级和性能水平下，训练阶段消耗的算力只用了行业惯常的6%。这是通过“模型压缩和弹性训练大幅降低冗余计算”来达成的，是一种预训练环节的效率提升。

在2026年全球数据中心能耗争议持续升级、国产芯片供给尚不宽裕的背景下，这个方向的选择，说服力不弱。

再看评测数据。在τ³-bench和SpreadsheetBench-Verified两项智能体评测任务中，文心5.1超越了DeepSeek-V4-Pro，官方给出的描述是“智能体能力已接近领先闭源模型的水平”。创意写作方面则与Gemini 3.1 Pro持平，在AIME26数学竞赛（使用工具）上拿到99.6分，仅次于Gemini 3.1 Pro。

这些数据大多是百度内部评测或较小的基准测试，并不是LMArena那种大规模盲测榜单，稳健性还需更多第三方验证，但整体方向是清晰的：这代模型的升级空间主要在Agent和深度搜索能力上，而非纯粹的语言表达。

目前，文心5.1已在千帆模型广场和文心一言官网上线，开发者可以通过千帆平台调用API。百度还宣布将文心5.1陆续接入ISEKAI ZERO、Mulan AI、谛听幻流、Storymaster等超过十个创意生产智能体平台。

这个动作的意图明显，不是只谈模型，而是谈模型落地。

放在整个行业，文心5.1在产品端的节奏不算慢。但真正让百度头疼的，一直都不是技术。

百度选了一条不同的路

如果单纯比打分，文心5.1并不弱势。但2026年的AI市场，尤其在中国，产品竞争，相比看分数，大家更在乎的是谁的用户多、场景多。

2026年春节，四家大厂在AI领域的总营销投入接近50亿元。百度抢先开局，拿出5亿现金红包，把入口全部放在百度App生态内。字节豆包投入15亿到20亿，腾讯元宝10亿，阿里千问出手最重，60亿。

根据QuestMobile的数据，春节前后字节豆包以8400万日活开局，除夕当天冲到1.45亿峰值；阿里千问活动次日日活达到7352万；腾讯元宝除夕4054万。而百度文心的用户增长曲线动静平平。

外界感知到的是，百度在C端用户的争夺中正在被甩开，虽然模型能力不断迭代，但公众感知严重滞后。这是中国AI产业一个特有的悖论，技术团队不断优化训练效率，但用户只关心“这玩意儿能不能帮我订机票”。两个坐标系互相不认识。

如果要说一个更大的行业叙事，2026年上半年的关键词，正在从“军备竞赛”切换到“商业化”。

前不久，字节豆包启动收费模式，最低档68元/月，最高5088元/年，评论区被“又笨又收费”的骂声淹没。但不要搞错，这是全行业的拐点。上个月，阿里云、腾讯云、百度智能云和智谱同步涨价，部分涨幅高达463%。

在C端用户还在习惯“免费AI”幻象的时候，大厂们已经开始算现实的成本：API调用量每涨一波，模型的推理成本就跟着翻番。

百度实际上比大多数同行更早感受到了这种压力的峰值。2025年Q3，百度核心在线营销收入153亿元，同比下降18%，和2023年Q2的峰值197亿元相比，跌去了超过五分之一。这个缩水不是周期性的，而是结构性的——用户不再愿意从一页链接里自己找答案，AI直接给答案才是新习惯。对用户体验来说是好事，但对搜索广告这个百度最大的利润支柱来说，基础开始松动。

李彦宏的选择是押注AI转型。到2025年Q4，百度AI新业务收入达到113亿元，占核心非在线营销收入的43%。AI云收入在Q3同比增长33%，AI原生营销服务收入同比激增262%。一减一增之间，百度的业务结构确实在变。

回到文心5.1，如果放在这个商业化视角下重新审视，它传递的信号不只是“比分高”，看点在于，“训练成本是行业6%”。在API价格集体走高的2026年，训练成本优势就是云服务的定价权和利润空间。

百度在AI云的竞争力，取决于能否把文心大模型的效率优势转化为持续性收入增长。这个命题，比在Benchmark榜单上拿一个第一要难得多。

文心5.1的价值

或许在百度App里

那么，文心5.1的真正价值在哪里？

如果只是将它当作一个API调用的标准模型，技术数据上它确实有说服力。但对于百度来说，需要思考的是，如何把它嵌入到百度App这个月活超2亿的超级入口中。

今年初，文心助手月活突破2亿，春节期间百度把红包入口全部导向了百度App。这个策略说明百度已经放弃了做独立AI App的打法，它要回到自己的主场，用AI重塑搜索。

在百度世界大会2025上，李彦宏透露，百度搜索首条结果的富媒体覆盖率已达70%。用户搜索一个问题，AI直接给出结构化的图文答案，而不再是一排蓝链接。这对用户是好事，对广告收入是坏事——因为点击行为会大幅减少，广告库存跟着缩水。

这是一个商业悖论：用户体验越好，变现越难。

文心5.1给出的答案，在它被着重强调的“搜索能力”里。它的“多源信息快速检索、整合与生成能力”，理论上可以用来给出更丰富、更个性化的答案。而这些高质量的信息整合结果，本身就可能成为新的广告呈现方式——不是链接广告，而是内容嵌入式的信息推荐。

在这个逻辑下，AI搜索不是吃掉广告收入，而是换一个方式重建广告收入。能不能走通，取决于百度在5月13日Create大会上公布的商业化路径，是否足够清晰。

同时不能忽视的是百度在算力侧的布局。旗下昆仑芯已向港交所提交上市申请，同时百度构建的三万卡智算集群为大模型训练提供基础支撑。在2026年国产芯片替代加速的语境下，“自研芯片+自研模型”这个组合的远期价值，可能比文心5.1本身更值得关注。

高盛在近期报告中指出，中国AI训练将越来越依赖高度优化的计算效率架构，而非单纯堆算力规模。百度目前的路径，通过软硬协同优化把训练成本压缩到极致，与这个产业方向高度对齐。

文心5.1是一张技术底牌，在搜索能力、训练效率和Agent能力三个维度上都给出了可以量化的提升。它最硬的数字在于那“6%”，在算力贵过黄金的时代，效率本身就是壁垒。

但2026年的中国AI竞争，早已过了“参数和跑分”定胜负的阶段。商业化的压力、用户规模的争夺、行业场景的渗透，构成了一套远比Benchmark更复杂的评判体系。5亿红包打不出水花的尴尬，大模型上车的错失，搜索广告失速带来的利润真空——这些不是文心5.1凭技术数据能解决的。

5月13日Create大会，李彦宏将登场。届时决定的可能不是“文心产品如何迭代”，而是百度在AI这条路上，到底准备怎么把钱挣回来。在大厂集体进入“算账生存”模式的2026年，这个答案，也许才是市场最想听到的。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.