网易首页 > 网易号 > 正文 申请入驻

文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

0
分享至


智东西
作者 王涵
编辑 漠影

智东西1月24日报道,在文心Moment大会上,文心大模型5.0正式版上线。

据称,该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。

40余项权威基准的综合评测中,文心5.0正式版的语言与多模态理解能力稳居国际第一梯队。音频和视觉生成能力与垂直领域专精模型相当,整体处于全球领先水平





目前,个人用户可在文心APP、文心一言官网体验,企业与开发者可通过百度千帆平台进行调用。

智东西第一时间体验了文心5.0。测评结果证明,该模型不仅能够处理不同文化语境下复杂情感、弦外之音、画面隐喻等任务,输出更符合语境、场景的回复,还能通过出色的规划反思和逻辑推理能力,生成兼具创意与逻辑的写作内容。可以说是大模型界的“最强文科生”

虽然已经有了预览版的铺垫,文心5.0正式版的上线还是让人眼前一亮。国产多模态大模型,真的已经进入“原生全模态”时间了。

一、稳居全球第一梯队,文心5.0开启原生全模态之路

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,与业界多数采用“后期融合”的多模态方案不同,文心5.0的技术路线采用统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一模型框架中进行联合训练,使得多模态特征在统一架构下充分融合并协同优化,实现原生的全模态统一理解与生成


▲百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜

文心5.0攻克了多模态理解与生成难以统一建模的难题,精细建模多模语义特征,实现了理解与生成相互增强,全面提升了全模态理解与生成能力。

文心5.0采用超大规模混合专家模型结构,依托飞桨深度学习框架进行超大规模MoE模型训练,总参数规模超过2.4万亿,这达到业界已公开参数的模型之最。具备超稀疏激活参数,激活参数比低于3%,在保持模型强大能力的同时降低了计算与推理成本。

同时,基于大规模工具环境,合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了模型的智能体和工具调用能力。

不管是从技术架构路线还是从大模型基建,文心5.0几乎是国内大模型顶配,让它在国际权威的大模型竞技场LMArena上实现了一次次问鼎。

在近三个月内,文心5.0系列模型五次登榜LMArena,在文本(Text Arena)、视觉理解(VisionArena)榜单,多次位列国内第一,是唯一进入全球第一梯队的中国大模型。

二、会写科幻小说、能分析相亲简历,文心5.0成“最强文科生”

在文心5.0 Preview发布之时,就有网友评价称其为“最强文科生”。今天,我们测测文心5.0正式版,看看这个称号是否名副其实。

第一题,我们看看文心5.0的知识储备和文采如何:

我们先让文心5.0写一篇刘慈欣短篇科幻小说《流浪地球》的续篇,要求遵循原文写作风格以及故事背景和人物设定,来考考它的知识储备量。

大约3分钟,该模型就完成了一篇超短篇的《流浪地球》续篇,取名为《流浪地球:静音纪元》。

整篇文章一看就是“读过”原小说的,原文的“大叛乱”和“太阳氦闪”等元素一个不落,还从“我”的第一视角讲述了资源即将耗尽、人类采取Plan B——火种计划的故事。整体上来说,文章通篇读下来很顺畅,文风也是刘慈欣的平实感,剧情衔接流畅。

除了小说,文心5.0的阅片量如何?我们抛给它这样一个问题:同为宫斗剧的《甄嬛传》《如懿传》《延禧攻略》在网络上常常被人拿来比较,如果甄嬛、如懿和魏璎珞身处在同一深宫内,谁能笑到最后呢?

文心5.0首先选择了一个这三个角色都共存的时代背景下,分析了三人各自的性格特点和经历,用两两对决的方法决出了最后的赢家为“魏璎珞”。分析过程讲的头头是道,一看就是资深剧迷。

接下来,我们来考考文心5.0的情商:

首先,我们上传了一张小红书帖子的截图,截图内容为求助该如何回复女友总是说“你不爱我了”。

从文心5.0的思考过程中可以看出,它判断了提问中女友的行为动机,还考虑了男生的心理,先设身处地地安慰了用户,再接着给出解决方案,这样会减少说教感。

从回答内容上看,文心5.0给出了四套方法论,每一套都确实可行,还说清了女友总说“你不爱我了”的弦外之音其实是“想你了”。就是在具体的措辞上稍微有点“油”,不走可爱风的直男朋友们尽量不要照搬。

接着,我们上传了一段“这个男孩能嫁吗?”的短视频,看看文心5.0能不能从相亲对象的简历中看出不对劲的地方。

原视频时长1分钟,视频主播中英文混杂并且语速很快,我不看字幕都很难跟下来。但文心5.0在一分钟内就完成了对视频内容的理解和分析,并且扒出了相亲对象简历中不合理且有所隐瞒的事项,措辞也是毫不留情。


三、原生全模态:剑指多模态大模型的未来

这样惊艳的体验效果是如何实现的?要回答这个问题还要从多模态大模型的类别说起。

当前市面上的多模态大模型主要分为拼接型和原生型两类。其中拼接型是行业主流形式,采用模块化架构,通过独立训练各模态模型再拼接实现融合,虽具备一定灵活性,却存在明显的信息损耗问题。

最早从GPT-4o时即提出“原生多模态”,后面Gemini 3的发布,让“原生多模态”真正被业界聚焦。而百度则在这一基础上更上一层楼,提出了“原生全模态”架构

原生全模态架构则从训练初期的底层逻辑出发,就将文本、图像、音频、视频等多模态数据深度融合,构建起统一语义空间,以此实现更高效的跨模态理解

同时,“原生全模态”方法还能有效避免灾难性遗忘,让模态数据在基础层面的融合更顺畅,也让跨模态任务的泛化能力大幅提升。

行业有观点认为,这本质上是技术路线之争:「原生架构」正在改写大模型厂商的游戏规则。若国内厂商未能在2025–2026年突破原生架构,可能在未来AI竞争中沦为功能跟随者。显然,百度文心5.0已带领百度在这一赛道率先突围,构建起一定的技术护城河。

如何才能抵达AGI?越来越多行业专家认为,AI能够真正感知世界、与物理世界互动,从物理世界中学习,这就是AGI。

让AI在物理世界中学习,就是要AI像人一样,在语言、图像、视频、音频等多模态数据中感知世界,将多模态数据相互对照,进而形成对世界的感知。

这样来看,原生全模态架构,或许将是AGI的地基和基石

结语:国产大模型进入“原生全模态”时间

文心5.0在知识问答、复杂场景理解、创意写作等多类任务中表现稳定,在遵循指令、理解语境、进行多轮思考方面的能力已较为成熟,展现出了超越工具的“灵性”与实用价值。

当前,谷歌已明确将“原生多模态”作为核心方向。文心5.0基于此完善的“原生全模态”,意味着国内在此技术路径上有了具备大规模参数和实际应用能力的对标产品。

国产大模型,进入“原生全模态”时间。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
关乎台湾问题,中国对美国摊牌了,当着特朗普面,中方把话说死了

关乎台湾问题,中国对美国摊牌了,当着特朗普面,中方把话说死了

今墨缘
2026-05-14 15:21:43
买车半年维修9次!蔚来车主:不敢开了,要求退车

买车半年维修9次!蔚来车主:不敢开了,要求退车

深圳晚报
2026-05-14 08:45:16
1972年尼克松访华时,向毛主席索要了一幅墨宝,这幅墨宝只有12个字,但尼克松却始终不明白毛主席是什么意思

1972年尼克松访华时,向毛主席索要了一幅墨宝,这幅墨宝只有12个字,但尼克松却始终不明白毛主席是什么意思

年代回忆
2026-05-13 20:03:59
亲历者回忆:邓公去世前几周表现异常,火化时秘书接到一密令

亲历者回忆:邓公去世前几周表现异常,火化时秘书接到一密令

凉州辞
2026-05-14 13:45:03
特朗普访华团五路人马各怀心思,鲁比奥必须在场,但牌面最薄

特朗普访华团五路人马各怀心思,鲁比奥必须在场,但牌面最薄

漫川舟船
2026-05-14 19:54:52
20岁的越南女孩嫁到南京,7年后第一次回家,丈夫给了她15万块钱

20岁的越南女孩嫁到南京,7年后第一次回家,丈夫给了她15万块钱

流萤叙情
2025-04-27 09:55:18
4300家个股下跌,中国长城、中国卫星直接跌停,大盘要做头了吗?

4300家个股下跌,中国长城、中国卫星直接跌停,大盘要做头了吗?

长风价值掘金
2026-05-14 15:36:38
恭喜!陈思诚又当爹!26岁小女友晒生日照,一脸孕相得到父母认可

恭喜!陈思诚又当爹!26岁小女友晒生日照,一脸孕相得到父母认可

八卦王者
2026-05-14 11:39:43
王曼昱首盘输球,马琳冲上去一把抱住她,全场没人看懂。邓亚萍一句话点透:这不是技术,是心态出了要命的问题

王曼昱首盘输球,马琳冲上去一把抱住她,全场没人看懂。邓亚萍一句话点透:这不是技术,是心态出了要命的问题

乒乓助手
2026-05-14 00:07:37
瓜岛战役日军为何会惨败?美国军医:他们人均排便量是美军1.5倍

瓜岛战役日军为何会惨败?美国军医:他们人均排便量是美军1.5倍

小莜读史
2026-04-28 07:14:32
贝莱德联手淡马锡和阿布扎比主权基金 豪掷300亿美元投资中东基建

贝莱德联手淡马锡和阿布扎比主权基金 豪掷300亿美元投资中东基建

财联社
2026-05-14 16:47:16
半决赛上海VS北京!赛前3个好消息1坏消息,G1开门红稳了

半决赛上海VS北京!赛前3个好消息1坏消息,G1开门红稳了

生活新鲜市
2026-05-14 17:09:35
河南信阳警方:一小轿车发生剐蹭后失控致1死5伤,司机涉嫌醉驾

河南信阳警方:一小轿车发生剐蹭后失控致1死5伤,司机涉嫌醉驾

澎湃新闻
2026-05-14 02:24:09
700万?!勇士第一笔补强敲定!?可以,双赢

700万?!勇士第一笔补强敲定!?可以,双赢

贵圈真乱
2026-05-14 14:48:18
霍尔木兹海峡,传来大消息!黄金、白银、原油突变!

霍尔木兹海峡,传来大消息!黄金、白银、原油突变!

证券时报e公司
2026-05-14 12:26:16
“还没成年,脖子就有草莓了!”原来穷人富养女,才是悲剧的祸根

“还没成年,脖子就有草莓了!”原来穷人富养女,才是悲剧的祸根

妍妍教育日记
2026-05-11 19:20:59
大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

深度报
2026-04-18 23:37:27
两性关系:男性过了75,不管跟谁处,牢记4句话,余生少心酸

两性关系:男性过了75,不管跟谁处,牢记4句话,余生少心酸

匹夫来搞笑
2026-05-14 00:32:20
腾讯AI一号位姚顺雨被传因算力资源将离职 官方回应:太恶劣 还编出各种搞笑情节 严正辟谣

腾讯AI一号位姚顺雨被传因算力资源将离职 官方回应:太恶劣 还编出各种搞笑情节 严正辟谣

快科技
2026-05-14 15:47:35
俄宣发布虚假消息,称苏-57战机在乌克兰上空击落萨博-340预警机

俄宣发布虚假消息,称苏-57战机在乌克兰上空击落萨博-340预警机

走进乌克兰2022
2026-05-14 19:48:01
2026-05-14 20:27:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11828文章数 117077关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

外媒询问中方对鲁比奥的制裁是否已经解除 外交部回应

头条要闻

外媒询问中方对鲁比奥的制裁是否已经解除 外交部回应

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

时尚
健康
游戏
旅游
亲子

T恤+低腰阔腿裤、衬衫+低腰半裙,今年夏天最时髦的搭配,谁穿谁好看!

专家揭秘干细胞回输的安全风险

LPL第二赛段:不拖的涅槃,就是好涅槃!LNG零封LGD

旅游要闻

半价or免票?5月17日-19日,崇明这些景点参与优惠活动

亲子要闻

摆烂在家的孩子,为什么会疯狂要钱?

无障碍浏览 进入关怀版