网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

文本排行榜，国产模型超过GPT-5.1？

2025-12-23 21:27:29　来源: AI异类

北京举报

0

分享至

LMArena 最新一轮文本排行榜又更新！
这一次，国产模型有新惊喜。

12月23日，也就是今天，LMArena 公布最新文本榜单，ERNIE-5.0-Preview-1203（文心 5.0 Preview）以 1451 分登榜，位列国内第一。

而且它不仅是在“国产榜”里领先，还直接和一众美国模型同场对打，超过了 Claude Opus 4.1、GPT-5.2、GPT-5.1、Qwen3-Max-Preview 等多款主流模型。

而且在前 20 名中，它是唯一的非美国模型。

LMArena 和其他榜单还不一样：它不是自报参数，会基于真实用户对话、匿名盲测的偏好投票，更接近真实使用体验。

谁更好用、谁更像“能长期对话的模型”，是用户说了算。

从能力分布来看，这次文心拉开差距的，是创意写作、高难度指令这些最容易翻车、但最贴近真实场景的能力。
可以看出，文心的确是那个真实用户场景完成度更高的大模型。

如果把时间线拉长，想想也很合理，文心5.0 Preview这次国内排第一也挺有迹可循的。

过去一个多月，文心在 LMArena 的出现频率明显变高：
11 月拿下文本榜全球并列第二、中国第一；
然后在视觉理解榜再次进入国内第一；
到这次文本榜再度刷新分数，上探 23 分。

迭代节奏真够快，像是在持续公开验证能力边界，也不是为了一次性的榜单排名。

业内也有消息称，文心大模型 5.0 正式版将于 1 月上线。
从这个角度看，Preview 阶段频繁上榜，可能是在为正式发布提前“跑一轮国际压力测试”。

过去聊 AI，很容易形成一种默认叙事：前沿在美国，国内更多是追赶。

但现在，至少在部分核心能力上，国产模型已经开始被直接放进全球第一梯队里对照，而且不是陪跑角色。
至少可以说：中美 AI 的对比，正在从发布会和参数表，转向真实使用体验的正面竞争。

而 LMArena上排第一的文心，只是这个变化最早被看见的地方之一。

#百度 #文心一言 #文心 #文心大模型 #AI #AI大模型 #科技 #AI技术 #干货分享 #AI异类弗兰克

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

北航提出大模型Scaling Laws：编程语言差异与多语言最优配比策略

机器之心Pro 2025-12-24 18:00:01
0 跟贴 0
浙大提出ContextGen，实现布局锚定多实例生成新SOTA

机器之心Pro 2025-12-23 15:30:26
0 跟贴 0

AI Coding新王登场！MiniMax M2.1拿下多语言编程SOTA

量子位 2025-12-24 09:15:24
1 跟贴 1

Uber、Lyft 英国试水 Robotaxi：投资文远，项目为何给了百度

经济观察报 2025-12-22 20:40:04
0 跟贴 0
王颖：当前AI应用存在三大痛点

量子位 2025-12-11 03:38:32
0 跟贴 0

百度慧播星获评钛媒体2025 EDGE AWARDS「最佳AI创新应用」

钛媒体APP 2025-12-23 14:11:06
0 跟贴 0

大上海滩，亚洲最国际的城市

尚曦读史 2025-12-20 09:59:16
0 跟贴 0
仿真落地三难点：物理、视觉、交互

量子位 2025-12-12 04:34:09
0 跟贴 0

现场围观腾讯广告算法大赛，我都想入职了

量子位 2025-12-24 12:08:48
0 跟贴 0
黄仁勋：中国的AI市场无论有没有英伟达都会进步与华为是竞争对手不是敌人

财联社 2025-07-21 10:22:14
7 跟贴 7
荒野求生（机器狗全自主版），2025ATEC挑战真实户外无遥操

量子位 2025-12-08 19:24:34
0 跟贴 0
简智正式发布第一视角无本体数据采集产品DAS Ego

量子位 2025-12-22 15:23:48
0 跟贴 0
谁还敢说谷歌掉队？2025年，它打了一场漂亮的翻身仗

机器之心Pro 2025-12-24 17:49:01
0 跟贴 0
造物主已经设好参数，巨兽超过极限就无法存在

易易影视君 2025-12-20 16:54:51
243 跟贴 243
AI战场缺一个腾讯系

钛媒体APP 2025-12-24 15:58:11
0 跟贴 0
五八智能四足机器人平台Q20A，适用于千行百业

量子位 2025-09-30 15:35:41
0 跟贴 0
大模型也会赌博上瘾！理智出走！

量子位 2025-11-03 07:06:08
0 跟贴 0
英伟达发布通用开源基础游戏AI NitroGen，学习4万小时玩家视频

量子位 2025-12-23 16:37:55
0 跟贴 0
AI研发本质是一场与生物进化同构的试错游戏

量子位 2025-12-12 04:34:17
0 跟贴 0
26岁郑州小伙伦敦闹市开店卖胡辣汤：一碗售价130元

极目新闻 2025-12-19 21:19:26
5840 跟贴 5840
李飞飞发起机器人家务挑战赛，老黄第一时间批钱赞助

量子位 2025-10-13 09:30:54
0 跟贴 0
国家文物局工作组已赴南京，江苏省委省政府成立调查组，南京博物院事件离真相不远了！

新民周刊 2025-12-23 20:04:32
6172 跟贴 6172
通用智能纯粹胡扯？！哈萨比斯和LeCun吵起来了

量子位 2025-12-24 17:54:55
0 跟贴 0
机器人终于有自己的真机评测大考了

量子位 2025-10-15 20:05:44
0 跟贴 0
机器狗被锯腿也能继续走，Skild Brain估值45亿美元

量子位 2025-09-27 17:49:32
0 跟贴 0
未来医生摘得全球第一，临床安全有效性评估新基准

量子位 2025-11-19 11:14:03
0 跟贴 0
五八智能四足机器人平台Q20A 不止跑跳整活还能维护公共安全

量子位 2025-09-30 10:01:00
0 跟贴 0
机器人管家Figure 03来了，承包一切家务！

量子位 2025-10-11 10:13:00
0 跟贴 0
中国大模型公司只花OpenAI 1%的钱，跑进全模态第一梯队

量子位 2025-12-23 16:38:23
0 跟贴 0
马斯克用Grok替代X员工，裁员90%

量子位 2025-11-29 16:58:47
0 跟贴 0
开源AI编程工具CoStrict，GitHub星标3K+

量子位 2025-12-09 01:52:08
0 跟贴 0
老婆为了老公乱溅，发明出这玩意，果然科技改变生活

晨华爱搞笑 2025-12-22 11:21:49
1 跟贴 1
被困近百度桑拿房，众人绝境寻出路

热剧推荐社 2025-12-23 10:40:30
1 跟贴 1
大模型的魅力在于突发涌现的能力

量子位 2025-12-11 03:38:02
0 跟贴 0
长城魏建军回应魏牌“九年八换CEO”：并不是我们辞退人家，是他们自己感觉压力特别大

红星资本局 2025-12-24 11:41:09
511 跟贴 511
数据中心的未来：英特尔至强6处理器与AI服务器

量子位 2025-12-19 12:00:39
0 跟贴 0
女生买岩板 ai说进不了电梯，不信邪手搓模型测试这不是能进吗？

河南都市频道 2025-12-24 11:43:14
79 跟贴 79
湖人残阵胜利是错觉，110分进攻表现低迷

稗官青史 2025-12-24 08:05:00
3 跟贴 3
AI建造者如何使用AI？《时代》周刊专访三位科技领袖

量子位 2025-12-16 08:37:19
0 跟贴 0
AI服务器的六边形战士，英特尔®至强®6处理器全面升级

量子位 2025-11-29 16:58:51
0 跟贴 0

突然变道飞往东京！这场出逃把自由焊在了路上。

突然变道飞往东京！这场出逃把自由焊在了路上。

百态人间

2025-12-23 16:41:18

美日对中国最恐惧的是海南封关，如果成功，推广全国就天下无敌了

美日对中国最恐惧的是海南封关，如果成功，推广全国就天下无敌了

我心纵横天地间

2025-12-24 16:47:33

陈慧琳素颜逛美国超市，脸好方，腮帮子鼓起来了，牙齿不整齐！

陈慧琳素颜逛美国超市，脸好方，腮帮子鼓起来了，牙齿不整齐！

庭小娱

2025-12-21 14:51:03

令人捉摸不透！湖人后场大闸在这场惨败中又找到了自己的手感？

令人捉摸不透！湖人后场大闸在这场惨败中又找到了自己的手感？

稻谷与小麦

2025-12-24 19:41:45

俄罗斯最高法院：批评政治人物不构成犯罪

俄罗斯最高法院：批评政治人物不构成犯罪

桂系007

2025-12-23 23:13:39

香港网友谈金信煜被解约：他拒绝在人工草训练，而且拿着高薪

香港网友谈金信煜被解约：他拒绝在人工草训练，而且拿着高薪

懂球帝

2025-12-24 12:26:29

2025年国家杰青最新名单

高分子科学前沿

2025-12-24 10:26:21

当你隔壁是个超级大国：东南亚人眼中的中国，到底是什么样的？

当你隔壁是个超级大国：东南亚人眼中的中国，到底是什么样的？

斜烟风起雨未

2025-12-24 13:32:53

6000 万欧水货？阿尔特塔暴怒有理！球迷狂喷：耻辱级表现

6000 万欧水货？阿尔特塔暴怒有理！球迷狂喷：耻辱级表现

澜归序

2025-12-24 09:50:42

国家一级演员男高音歌唱家歌剧表演艺术家戴玉强

国家一级演员男高音歌唱家歌剧表演艺术家戴玉强

韩驰

2025-12-24 17:07:11

笑死！全网最炸裂阿贝贝合集，家长：我真的要疯了

笑死！全网最炸裂阿贝贝合集，家长：我真的要疯了

夜深爱杂谈

2025-12-03 20:26:34

确诊了！右肩静脉血栓！火箭扔掉的NBA首轮秀

确诊了！右肩静脉血栓！火箭扔掉的NBA首轮秀

篮球实战宝典

2025-12-24 07:19:33

故事：山东一男子救下5只黄鼠狼后,身上频发怪事，至今都难以解释

故事：山东一男子救下5只黄鼠狼后,身上频发怪事，至今都难以解释

清茶浅谈

2024-12-04 14:29:09

当法官宣判死刑，杀了南大女研究生哥哥的凶手在法庭上疯狂嘶吼

当法官宣判死刑，杀了南大女研究生哥哥的凶手在法庭上疯狂嘶吼

诗意世界

2025-12-14 11:25:24

历史惊人的相似：白人与中国三次生死较量，最终都以“灭族”收场

历史惊人的相似：白人与中国三次生死较量，最终都以“灭族”收场

南宗历史

2025-12-23 14:46:20

12月24日俄乌最新：新的里程牌

12月24日俄乌最新：新的里程牌

西楼饮月

2025-12-24 18:05:03

杨瀚森替补4+2+2开拓者惜败魔术，阿夫迪亚25+6+8错失扳平三分

杨瀚森替补4+2+2开拓者惜败魔术，阿夫迪亚25+6+8错失扳平三分

湖人崛起

2025-12-24 13:26:59

北京连下六道指令，陕西硬抗整整四年，最高指示：让749局来

北京连下六道指令，陕西硬抗整整四年，最高指示：让749局来

小哥很OK

2025-12-12 14:33:01

人口告别世界第一？二孩催生无效后，国家终于向住房出手了

人口告别世界第一？二孩催生无效后，国家终于向住房出手了

奇思妙想草叶君

2025-12-23 22:58:43

特朗普下令，要把中企一锅端，美禁令生效前，中国取消10万吨订单

特朗普下令，要把中企一锅端，美禁令生效前，中国取消10万吨订单

井普椿的独白

2025-12-24 19:29:12

从硅谷到中关村，AI信息与测评

82文章数 5关注度

往期回顾全部

科技要闻

智谱和MiniMax拿出了“血淋淋”的账本

头条要闻

果农再次开启"赛博助农"：在"魔兽世界"卖3.5万斤橙子

头条要闻

果农再次开启"赛博助农"：在"魔兽世界"卖3.5万斤橙子

体育要闻

26岁广西球王，在质疑声中成为本土得分王

娱乐要闻

怀孕增重30斤！阚清子惊传诞一女夭折？

财经要闻

重磅！北京市优化调整住房限购政策

汽车要闻

“运动版库里南”一月份亮相或命名极氪9S

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

本地

游戏

艺术

公开课

赫本黑色高领衫的4种搭配，太值得借鉴！

本地新闻

云游安徽｜一川江水润安庆，一塔一戏一城史

1月PS+会免阵容预测：《真人快打11》《狙击精英》等

艺术要闻

2026第一福！孙晓云亲笔“福”字出炉

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版