网易首页 > 网易号 > 正文 申请入驻

文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

0
分享至


智东西
作者 王涵
编辑 漠影

智东西1月24日报道,在文心Moment大会上,文心大模型5.0正式版上线。

据称,该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。

40余项权威基准的综合评测中,文心5.0正式版的语言与多模态理解能力稳居国际第一梯队。音频和视觉生成能力与垂直领域专精模型相当,整体处于全球领先水平





目前,个人用户可在文心APP、文心一言官网体验,企业与开发者可通过百度千帆平台进行调用。

智东西第一时间体验了文心5.0。测评结果证明,该模型不仅能够处理不同文化语境下复杂情感、弦外之音、画面隐喻等任务,输出更符合语境、场景的回复,还能通过出色的规划反思和逻辑推理能力,生成兼具创意与逻辑的写作内容。可以说是大模型界的“最强文科生”

虽然已经有了预览版的铺垫,文心5.0正式版的上线还是让人眼前一亮。国产多模态大模型,真的已经进入“原生全模态”时间了。

一、稳居全球第一梯队,文心5.0开启原生全模态之路

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,与业界多数采用“后期融合”的多模态方案不同,文心5.0的技术路线采用统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一模型框架中进行联合训练,使得多模态特征在统一架构下充分融合并协同优化,实现原生的全模态统一理解与生成


▲百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜

文心5.0攻克了多模态理解与生成难以统一建模的难题,精细建模多模语义特征,实现了理解与生成相互增强,全面提升了全模态理解与生成能力。

文心5.0采用超大规模混合专家模型结构,依托飞桨深度学习框架进行超大规模MoE模型训练,总参数规模超过2.4万亿,这达到业界已公开参数的模型之最。具备超稀疏激活参数,激活参数比低于3%,在保持模型强大能力的同时降低了计算与推理成本。

同时,基于大规模工具环境,合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了模型的智能体和工具调用能力。

不管是从技术架构路线还是从大模型基建,文心5.0几乎是国内大模型顶配,让它在国际权威的大模型竞技场LMArena上实现了一次次问鼎。

在近三个月内,文心5.0系列模型五次登榜LMArena,在文本(Text Arena)、视觉理解(VisionArena)榜单,多次位列国内第一,是唯一进入全球第一梯队的中国大模型。

二、会写科幻小说、能分析相亲简历,文心5.0成“最强文科生”

在文心5.0 Preview发布之时,就有网友评价称其为“最强文科生”。今天,我们测测文心5.0正式版,看看这个称号是否名副其实。

第一题,我们看看文心5.0的知识储备和文采如何:

我们先让文心5.0写一篇刘慈欣短篇科幻小说《流浪地球》的续篇,要求遵循原文写作风格以及故事背景和人物设定,来考考它的知识储备量。

大约3分钟,该模型就完成了一篇超短篇的《流浪地球》续篇,取名为《流浪地球:静音纪元》。

整篇文章一看就是“读过”原小说的,原文的“大叛乱”和“太阳氦闪”等元素一个不落,还从“我”的第一视角讲述了资源即将耗尽、人类采取Plan B——火种计划的故事。整体上来说,文章通篇读下来很顺畅,文风也是刘慈欣的平实感,剧情衔接流畅。

除了小说,文心5.0的阅片量如何?我们抛给它这样一个问题:同为宫斗剧的《甄嬛传》《如懿传》《延禧攻略》在网络上常常被人拿来比较,如果甄嬛、如懿和魏璎珞身处在同一深宫内,谁能笑到最后呢?

文心5.0首先选择了一个这三个角色都共存的时代背景下,分析了三人各自的性格特点和经历,用两两对决的方法决出了最后的赢家为“魏璎珞”。分析过程讲的头头是道,一看就是资深剧迷。

接下来,我们来考考文心5.0的情商:

首先,我们上传了一张小红书帖子的截图,截图内容为求助该如何回复女友总是说“你不爱我了”。

从文心5.0的思考过程中可以看出,它判断了提问中女友的行为动机,还考虑了男生的心理,先设身处地地安慰了用户,再接着给出解决方案,这样会减少说教感。

从回答内容上看,文心5.0给出了四套方法论,每一套都确实可行,还说清了女友总说“你不爱我了”的弦外之音其实是“想你了”。就是在具体的措辞上稍微有点“油”,不走可爱风的直男朋友们尽量不要照搬。

接着,我们上传了一段“这个男孩能嫁吗?”的短视频,看看文心5.0能不能从相亲对象的简历中看出不对劲的地方。

原视频时长1分钟,视频主播中英文混杂并且语速很快,我不看字幕都很难跟下来。但文心5.0在一分钟内就完成了对视频内容的理解和分析,并且扒出了相亲对象简历中不合理且有所隐瞒的事项,措辞也是毫不留情。


三、原生全模态:剑指多模态大模型的未来

这样惊艳的体验效果是如何实现的?要回答这个问题还要从多模态大模型的类别说起。

当前市面上的多模态大模型主要分为拼接型和原生型两类。其中拼接型是行业主流形式,采用模块化架构,通过独立训练各模态模型再拼接实现融合,虽具备一定灵活性,却存在明显的信息损耗问题。

最早从GPT-4o时即提出“原生多模态”,后面Gemini 3的发布,让“原生多模态”真正被业界聚焦。而百度则在这一基础上更上一层楼,提出了“原生全模态”架构

原生全模态架构则从训练初期的底层逻辑出发,就将文本、图像、音频、视频等多模态数据深度融合,构建起统一语义空间,以此实现更高效的跨模态理解

同时,“原生全模态”方法还能有效避免灾难性遗忘,让模态数据在基础层面的融合更顺畅,也让跨模态任务的泛化能力大幅提升。

行业有观点认为,这本质上是技术路线之争:「原生架构」正在改写大模型厂商的游戏规则。若国内厂商未能在2025–2026年突破原生架构,可能在未来AI竞争中沦为功能跟随者。显然,百度文心5.0已带领百度在这一赛道率先突围,构建起一定的技术护城河。

如何才能抵达AGI?越来越多行业专家认为,AI能够真正感知世界、与物理世界互动,从物理世界中学习,这就是AGI。

让AI在物理世界中学习,就是要AI像人一样,在语言、图像、视频、音频等多模态数据中感知世界,将多模态数据相互对照,进而形成对世界的感知。

这样来看,原生全模态架构,或许将是AGI的地基和基石

结语:国产大模型进入“原生全模态”时间

文心5.0在知识问答、复杂场景理解、创意写作等多类任务中表现稳定,在遵循指令、理解语境、进行多轮思考方面的能力已较为成熟,展现出了超越工具的“灵性”与实用价值。

当前,谷歌已明确将“原生多模态”作为核心方向。文心5.0基于此完善的“原生全模态”,意味着国内在此技术路径上有了具备大规模参数和实际应用能力的对标产品。

国产大模型,进入“原生全模态”时间。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
当失业人群不再涌入咖啡馆和书店

当失业人群不再涌入咖啡馆和书店

沉思的野兽
2026-01-23 15:25:02
多部门出手,嫣然传来好消息!医院新地址已定,但面临一个大难题

多部门出手,嫣然传来好消息!医院新地址已定,但面临一个大难题

阿纂看事
2026-01-23 14:26:43
“都吃成碳水脸了!”三男孩宝妈,做了一桌子素菜却嫌孩子吃的多

“都吃成碳水脸了!”三男孩宝妈,做了一桌子素菜却嫌孩子吃的多

林林先生
2026-01-23 18:29:23
77年来首次,北约历史性一幕发生,德国总理决定:马上带人去中国

77年来首次,北约历史性一幕发生,德国总理决定:马上带人去中国

沈言论
2026-01-24 13:35:03
前途无量,中国19岁小将3-1胜淘汰林诗栋的达科,连续两站进决赛

前途无量,中国19岁小将3-1胜淘汰林诗栋的达科,连续两站进决赛

真理是我亲戚
2026-01-23 22:48:03
WTT男单决赛对阵确定,19岁小将晋级,卫冕冠军1-3出局

WTT男单决赛对阵确定,19岁小将晋级,卫冕冠军1-3出局

港湾无船
2026-01-24 12:44:37
A股:大家要做好心理准备,1月26日,下周一将上演熟悉的剧情

A股:大家要做好心理准备,1月26日,下周一将上演熟悉的剧情

甜柠聊史
2026-01-24 09:34:13
经济不景气,什么行业最赚钱?当年日本经济泡沫给出了答案

经济不景气,什么行业最赚钱?当年日本经济泡沫给出了答案

泠泠说史
2026-01-22 18:46:47
苹果官宣新款 iPhone 降价 2500 元,太疯狂了!

苹果官宣新款 iPhone 降价 2500 元,太疯狂了!

花果科技
2026-01-24 10:40:32
闫学晶又迎噩耗,最担心的事还是发生了,儿媳体制内工作恐难保

闫学晶又迎噩耗,最担心的事还是发生了,儿媳体制内工作恐难保

离离言几许
2026-01-23 00:04:19
“这种家谁爱回?”农村大学生晒出不堪的房间,江浙沪家长又赢了

“这种家谁爱回?”农村大学生晒出不堪的房间,江浙沪家长又赢了

牛锅巴小钒
2026-01-24 06:38:11
曼联重大突破!皇马 1.2 亿巨星已点头,克洛普或主动 “舍弃”

曼联重大突破!皇马 1.2 亿巨星已点头,克洛普或主动 “舍弃”

奶盖熊本熊
2026-01-24 06:29:26
到北京才发现:波司登、骆驼羽绒服没人穿了,都在追这3个品牌

到北京才发现:波司登、骆驼羽绒服没人穿了,都在追这3个品牌

白宸侃片
2026-01-22 04:30:29
火箭111-104活塞3喜1忧!阿门进步,谢泼德卡佩拉绝配,申京奇葩

火箭111-104活塞3喜1忧!阿门进步,谢泼德卡佩拉绝配,申京奇葩

篮球资讯达人
2026-01-24 11:10:33
1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

南权先生
2026-01-20 15:49:53
陈道明唯一的绯闻对象左小青从当年坐姿,就能够看出来两人挺亲密

陈道明唯一的绯闻对象左小青从当年坐姿,就能够看出来两人挺亲密

可乐谈情感
2026-01-24 11:25:45
炸锅!马斯克当众自曝:我就是外星人!9000颗卫星佐证,真相曝光

炸锅!马斯克当众自曝:我就是外星人!9000颗卫星佐证,真相曝光

丁丁鲤史纪
2026-01-23 16:30:04
三峡大坝账本曝光:运行了 20 余年,2500 亿投入如今回本了吗?

三峡大坝账本曝光:运行了 20 余年,2500 亿投入如今回本了吗?

现代小青青慕慕
2026-01-23 21:35:30
比亚迪国内销量骤减30万,问题究竟出在哪

比亚迪国内销量骤减30万,问题究竟出在哪

新能源前瞻
2026-01-21 19:49:40
谷爱凌回应代表中国参赛

谷爱凌回应代表中国参赛

上观新闻
2026-01-24 06:37:08
2026-01-24 14:27:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11118文章数 116945关注度
往期回顾 全部

科技要闻

特斯拉Cybercrab即将落地 每公里不到1块钱

头条要闻

女子患癌为筹钱治病卖掉劳力士 收16万元后账户被冻结

头条要闻

女子患癌为筹钱治病卖掉劳力士 收16万元后账户被冻结

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

李微漪更新:狼王格林去世,3字泪目

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

家居
艺术
房产
手机
健康

家居要闻

在家度假 160平南洋混搭宅

艺术要闻

色彩之巅!法国蓬皮杜中心馆藏艺术大师特展”在北京民生现代美术馆开幕

房产要闻

正式官宣!三亚又一所名校要来了!

手机要闻

苹果首款折叠iPhone Fold机模和华为Pura X对比图曝光

耳石脱落为何让人天旋地转+恶心?

无障碍浏览 进入关怀版