全球AI领域的军备竞赛,在2026年的第一个月再次被推向了新的高潮。
1月22日,百度正式发布并上线文心大模型5.0(ERNIE 5.0)。这就像是一个明确的信号:在全球大模型第一梯队的博弈中,中国科技巨头正试图通过技术路径的差异化,从“跟随者”转向“定义者”。
摆在桌面上的数据不仅惊人,而且充满“暴力美学”与精细工程的矛盾统一——2.4万亿参数,这通常意味着巨大的算力消耗;但百度同时交出了“低于3%的激活参数比”这一成绩单。
在与GPT-5-High和Gemini-2.5-Pro等国际顶尖选手的对垒中,文心5.0不仅在40余项权威基准评测中稳居前列,更关键的是,它彻底抛弃了业内惯用的“拼凑式”多模态方案,转而由统一的自回归架构接管一切。
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜在发布现场表示,此次迭代的核心逻辑,“拒绝‘拼接’,告别转译。”
原生全模态,拆掉感知的“巴别塔”
在过去很长一段时间里,全球多模态大模型的主流做法是“后期融合”——用一个视觉编码器看图,用一个音频模型听声,再通过一个大语言模型来统筹。这种做法就像是三个语言不通的人在开会,虽然能合作,但中间存在着巨大的转译损耗。
文心5.0走了一条更难的路。
“文心5.0的技术路线采用了统一的自回归架构进行原生全模态建模。”吴甜解释说,这意味着文本、图像、视频、音频等多源数据在同一个模型框架中进行联合训练。在文心5.0的神经元里,看到一张图片和读到一段文字,不再是两种割裂的信号,而是被统一架构充分融合并协同优化的信息流。
这种“原生”带来的能力跃升是肉眼可见的。在发布会现场的演示中,文心5.0展现了一种近乎直觉的理解力:仅仅输入一段博主复刻“活了么”App的教程视频,模型不仅“看懂”了视频,还自动拆解了步骤,理解了核心交互逻辑,并直接生成了可运行的前端代码。
这已不再是简单的“图生文”或“文生码”,这是对物理世界动态逻辑的深层理解与重构。
为了支撑这套庞大的原生系统,百度采用了超大规模混合专家结构(MoE)。2.4万亿的参数量虽大,但在实际推理中,通过超稀疏激活技术,每次任务仅调动不到3%的参数。这不仅解决了超大模型“算力黑洞”的难题,也让文心5.0在保持顶级智商的同时,具备了极高的推理效率。
应用为王,价值不在模型,而在场景
如果说参数和架构是技术的“里子”,那么应用落地就是商业的“面子”。
经历了过去几年AI行业的喧嚣,市场已经不再为单纯的跑分成绩买单。百度显然深谙此道,文心助手月活突破2亿的数据背后,是百度对“模型即应用”这一误区的修正。
![]()
“应用模型的价值不在模型里,而在应用里。”百度应用模型研发部负责人贾磊直接点破了当前AI行业的迷局。他强调,百度的目标是让模型在真实应用场景里“跑得稳、答得对、用得起”。
为了实现这一目标,百度构建了一套精密的分层模型体系:
矩阵模型:面向通用场景,如文心Lite、视频大模型、语音大模型,主打快速落地。
专精模型:面向垂直行业,如搜索闪电专精模型、电商蒸汽机模型。
现场演示的“创意写作”环节,展示了文心5.0对中国本土语境的极致掌控。模型被要求模拟《红楼梦》中王熙凤的口吻,撰写一份“大观园资产重组方案”。结果,生成的文本既保留了“凤辣子”精明干练、泼辣犀利的古典韵味,又天衣无缝地融合了现代商业逻辑。这种对文化细微差别的拿捏,正是国产大模型在本土商业场景中的核心护城河。
此外,贾磊分享的“三态Token联动架构”数字人技术,更是对直播电商行业的一次降维打击。通过突破传统的文本、语音、视频串联模式,百度实现了对数字人的流式控制。这意味着,未来的带货主播可能不再是真人,而是由声音Token实时驱动表情与口型、5分钟即可复刻超越真人的“超级个体”。2025年罗永浩数字人直播打破行业记录,正是这一技术商业潜力的冰山一角。
Agent Infra,构建AI时代的操作系统
但在百度的棋局中,单一的模型或应用并非终局。真正的野心,在于生态。
百度千帆平台产品负责人张婷在“文心Moment”大会上展示了百度的底牌——Agent Infra(智能体基础设施)。
![]()
全球AI行业正在从Chatbot(聊天机器人)向Agent(智能体)演进。Chatbot只能陪你聊天,而Agent能帮你做事。但开发Agent的门槛极高,需要复杂的工具链和稳定的运行环境。
百度利用其独有的“芯云模体”全栈自研架构,打通了从昆仑芯片、百度智能云到文心大模型、再到智能体应用的全链路。千帆平台集成了包括百度AI搜索在内的众多工具及MCP工具链,为企业提供了一个“全周期、稳定支持多场景业务”的Agent开发底座。
数据证明了这一策略的有效性:目前,千帆平台上已累计开发超130万个Agents,以“百度AI搜索”为代表的工具日均调用量突破千万次。当其他公司还在兜售API时,百度正在成为AI时代的“操作系统”提供商。
校准与对齐,给AI立“规矩”
值得注意的是,在追求技术极速狂奔的同时,百度并未忽视AI的安全与价值观对齐。吴甜介绍了“文心导师”计划的最新进展。目前,已有835位来自数理化生文史哲等学科及金融、医疗等行业的专家加入这一计划。他们的角色类似于AI的“人类老师”,在知识传授、鉴赏评价、专业校准方面对大模型进行指导。
这一举措至关重要。文心5.0不仅要“聪明”,还要“正确”。在逻辑严谨性、专业深度和价值观对齐上的精进,是文心5.0能够进入严肃商业和教育领域的通行证。
LMArena全球大模型竞技场的榜单是残酷且客观的。2025年11月Preview版本上线以来,文心5.0多次位居文本榜和视觉理解榜国内第一,跻身国际第一梯队。1月15日数据显示,其以1460分位列全球第八,超越了GPT-5.1-High等强劲对手。文心5.0的正式发布,标志着原生全模态技术路线的成熟。这不仅是百度的一场技术胜利,更体现了中国模型厂商在底层架构上的自主创新能力。
在这个被算力、数据和算法重塑的时代,百度正试图用2.4万亿参数的宏大叙事,讲述一个关于“连接”的故事:连接文本与视频,连接模型与场景,连接现在与未来。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.