网易首页 > 网易号 > 正文 申请入驻

文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

0
分享至


智东西
作者 王涵
编辑 漠影

智东西1月24日报道,在文心Moment大会上,文心大模型5.0正式版上线。

据称,该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。

40余项权威基准的综合评测中,文心5.0正式版的语言与多模态理解能力稳居国际第一梯队。音频和视觉生成能力与垂直领域专精模型相当,整体处于全球领先水平





目前,个人用户可在文心APP、文心一言官网体验,企业与开发者可通过百度千帆平台进行调用。

智东西第一时间体验了文心5.0。测评结果证明,该模型不仅能够处理不同文化语境下复杂情感、弦外之音、画面隐喻等任务,输出更符合语境、场景的回复,还能通过出色的规划反思和逻辑推理能力,生成兼具创意与逻辑的写作内容。可以说是大模型界的“最强文科生”

虽然已经有了预览版的铺垫,文心5.0正式版的上线还是让人眼前一亮。国产多模态大模型,真的已经进入“原生全模态”时间了。

一、稳居全球第一梯队,文心5.0开启原生全模态之路

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,与业界多数采用“后期融合”的多模态方案不同,文心5.0的技术路线采用统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一模型框架中进行联合训练,使得多模态特征在统一架构下充分融合并协同优化,实现原生的全模态统一理解与生成


▲百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜

文心5.0攻克了多模态理解与生成难以统一建模的难题,精细建模多模语义特征,实现了理解与生成相互增强,全面提升了全模态理解与生成能力。

文心5.0采用超大规模混合专家模型结构,依托飞桨深度学习框架进行超大规模MoE模型训练,总参数规模超过2.4万亿,这达到业界已公开参数的模型之最。具备超稀疏激活参数,激活参数比低于3%,在保持模型强大能力的同时降低了计算与推理成本。

同时,基于大规模工具环境,合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了模型的智能体和工具调用能力。

不管是从技术架构路线还是从大模型基建,文心5.0几乎是国内大模型顶配,让它在国际权威的大模型竞技场LMArena上实现了一次次问鼎。

在近三个月内,文心5.0系列模型五次登榜LMArena,在文本(Text Arena)、视觉理解(VisionArena)榜单,多次位列国内第一,是唯一进入全球第一梯队的中国大模型。

二、会写科幻小说、能分析相亲简历,文心5.0成“最强文科生”

在文心5.0 Preview发布之时,就有网友评价称其为“最强文科生”。今天,我们测测文心5.0正式版,看看这个称号是否名副其实。

第一题,我们看看文心5.0的知识储备和文采如何:

我们先让文心5.0写一篇刘慈欣短篇科幻小说《流浪地球》的续篇,要求遵循原文写作风格以及故事背景和人物设定,来考考它的知识储备量。

大约3分钟,该模型就完成了一篇超短篇的《流浪地球》续篇,取名为《流浪地球:静音纪元》。

整篇文章一看就是“读过”原小说的,原文的“大叛乱”和“太阳氦闪”等元素一个不落,还从“我”的第一视角讲述了资源即将耗尽、人类采取Plan B——火种计划的故事。整体上来说,文章通篇读下来很顺畅,文风也是刘慈欣的平实感,剧情衔接流畅。

除了小说,文心5.0的阅片量如何?我们抛给它这样一个问题:同为宫斗剧的《甄嬛传》《如懿传》《延禧攻略》在网络上常常被人拿来比较,如果甄嬛、如懿和魏璎珞身处在同一深宫内,谁能笑到最后呢?

文心5.0首先选择了一个这三个角色都共存的时代背景下,分析了三人各自的性格特点和经历,用两两对决的方法决出了最后的赢家为“魏璎珞”。分析过程讲的头头是道,一看就是资深剧迷。

接下来,我们来考考文心5.0的情商:

首先,我们上传了一张小红书帖子的截图,截图内容为求助该如何回复女友总是说“你不爱我了”。

从文心5.0的思考过程中可以看出,它判断了提问中女友的行为动机,还考虑了男生的心理,先设身处地地安慰了用户,再接着给出解决方案,这样会减少说教感。

从回答内容上看,文心5.0给出了四套方法论,每一套都确实可行,还说清了女友总说“你不爱我了”的弦外之音其实是“想你了”。就是在具体的措辞上稍微有点“油”,不走可爱风的直男朋友们尽量不要照搬。

接着,我们上传了一段“这个男孩能嫁吗?”的短视频,看看文心5.0能不能从相亲对象的简历中看出不对劲的地方。

原视频时长1分钟,视频主播中英文混杂并且语速很快,我不看字幕都很难跟下来。但文心5.0在一分钟内就完成了对视频内容的理解和分析,并且扒出了相亲对象简历中不合理且有所隐瞒的事项,措辞也是毫不留情。


三、原生全模态:剑指多模态大模型的未来

这样惊艳的体验效果是如何实现的?要回答这个问题还要从多模态大模型的类别说起。

当前市面上的多模态大模型主要分为拼接型和原生型两类。其中拼接型是行业主流形式,采用模块化架构,通过独立训练各模态模型再拼接实现融合,虽具备一定灵活性,却存在明显的信息损耗问题。

最早从GPT-4o时即提出“原生多模态”,后面Gemini 3的发布,让“原生多模态”真正被业界聚焦。而百度则在这一基础上更上一层楼,提出了“原生全模态”架构

原生全模态架构则从训练初期的底层逻辑出发,就将文本、图像、音频、视频等多模态数据深度融合,构建起统一语义空间,以此实现更高效的跨模态理解

同时,“原生全模态”方法还能有效避免灾难性遗忘,让模态数据在基础层面的融合更顺畅,也让跨模态任务的泛化能力大幅提升。

行业有观点认为,这本质上是技术路线之争:「原生架构」正在改写大模型厂商的游戏规则。若国内厂商未能在2025–2026年突破原生架构,可能在未来AI竞争中沦为功能跟随者。显然,百度文心5.0已带领百度在这一赛道率先突围,构建起一定的技术护城河。

如何才能抵达AGI?越来越多行业专家认为,AI能够真正感知世界、与物理世界互动,从物理世界中学习,这就是AGI。

让AI在物理世界中学习,就是要AI像人一样,在语言、图像、视频、音频等多模态数据中感知世界,将多模态数据相互对照,进而形成对世界的感知。

这样来看,原生全模态架构,或许将是AGI的地基和基石

结语:国产大模型进入“原生全模态”时间

文心5.0在知识问答、复杂场景理解、创意写作等多类任务中表现稳定,在遵循指令、理解语境、进行多轮思考方面的能力已较为成熟,展现出了超越工具的“灵性”与实用价值。

当前,谷歌已明确将“原生多模态”作为核心方向。文心5.0基于此完善的“原生全模态”,意味着国内在此技术路径上有了具备大规模参数和实际应用能力的对标产品。

国产大模型,进入“原生全模态”时间。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰亲手把自己送上了死路

张雪峰亲手把自己送上了死路

名人苟或
2026-03-25 06:02:57
中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

信网
2026-03-26 19:12:37
A股,尾盘传来一个“重磅信号”,周五,或将迎来大变盘!

A股,尾盘传来一个“重磅信号”,周五,或将迎来大变盘!

夜深爱杂谈
2026-03-26 20:09:32
特变电工:公司输变电产线基本处于满负荷生产状态,公司变压器、电线电缆、电抗器等输变电产品在手订单饱满

特变电工:公司输变电产线基本处于满负荷生产状态,公司变压器、电线电缆、电抗器等输变电产品在手订单饱满

每日经济新闻
2026-03-26 19:25:48
A股第二高价股源杰科技启动“A+H” 一年内股价涨超1000%

A股第二高价股源杰科技启动“A+H” 一年内股价涨超1000%

蓝鲸新闻
2026-03-26 16:18:08
痛心!张雪峰女儿哭成泪人!再多的财富也无法填补父爱的空缺

痛心!张雪峰女儿哭成泪人!再多的财富也无法填补父爱的空缺

魔都姐姐杂谈
2026-03-26 20:54:38
石油危机一旦爆发,房子、现金、股票、黄金谁最危险?

石油危机一旦爆发,房子、现金、股票、黄金谁最危险?

蜉蝣说
2026-03-26 16:52:10
我在立陶宛住了半年,回来后整个人对波罗的海三国的认知完全变了

我在立陶宛住了半年,回来后整个人对波罗的海三国的认知完全变了

阅尽天下大事
2026-03-26 13:16:28
学医后才知道,高血压最危险信号,不是头晕,而是频繁出现4症状

学医后才知道,高血压最危险信号,不是头晕,而是频繁出现4症状

医学科普汇
2026-03-26 19:55:03
稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

田先生篮球
2026-03-26 14:23:29
日本公布中国游客免税店2月份消费数据,真的是打脸了!

日本公布中国游客免税店2月份消费数据,真的是打脸了!

消失的电波
2026-03-26 15:20:44
正脸曝光!强闯我使馆的村田晃大3月15日刚晋升,所持刀具刃长约18厘米

正脸曝光!强闯我使馆的村田晃大3月15日刚晋升,所持刀具刃长约18厘米

中国网
2026-03-26 14:01:45
张雪峰的病,速效救心丸能救吗?

张雪峰的病,速效救心丸能救吗?

中国新闻周刊
2026-03-25 16:23:30
女子空置房2个月用水1961吨,费用近1.2万元,“水管封死水表仍走字”,水务公司拒回应

女子空置房2个月用水1961吨,费用近1.2万元,“水管封死水表仍走字”,水务公司拒回应

观威海
2026-03-26 10:39:05
20亿美元还不够!中企对巴拿马索赔涨价,巴政府内部已经乱套了

20亿美元还不够!中企对巴拿马索赔涨价,巴政府内部已经乱套了

悄悄史话
2026-03-26 14:09:05
还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

柚子说球
2026-03-26 13:07:05
山姆曲奇礼盒紧急下架!监管部门:已立案

山姆曲奇礼盒紧急下架!监管部门:已立案

中国品牌
2026-03-26 19:00:21
突然崩了!很多人以为手机坏了!官方紧急回应

突然崩了!很多人以为手机坏了!官方紧急回应

蓬勃新闻
2026-03-25 20:00:43
惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

火山詩话
2026-03-26 11:40:00
伊朗政府信息委员会主席:15点停战协议是特朗普的“又一个谎言”

伊朗政府信息委员会主席:15点停战协议是特朗普的“又一个谎言”

新京报
2026-03-25 21:29:45
2026-03-26 22:39:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11441文章数 117016关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
家居
时尚
亲子
军事航空

艺术要闻

哪一座桥不是风景?

家居要闻

傍海而居 静观蝴蝶海

这些才是适合春季的穿搭!不沉闷、不单调,大方靓丽又减龄

亲子要闻

你好,我是馒头,快开门!

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版