网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Artificial Analysis发布全新Coding Agent基准智谱GLM-5.1取得全球开源SOTA

2026-05-12 21:00:04　来源: 格隆汇

广东举报

0

分享至

全球权威评测机构Artificial Analysis今日发布全新Coding Agent基准Artificial Analysis Coding Agent Index，用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA主流基准上的表现。其中，智谱GLM-5.1(在Claude Code中运行)取得开源第一。
Artificial Analysis在官方推文中点明了这一新榜单的“含金量”：“当开发者使用AI编程时，他们不仅在选择模型，也在将其与特定的Agent harness搭配使用。只有对这一组合进行基准测试，才能真正理解并比较不同模型的真实性能。”
从评测结果上来看，GLM-5.1代表了国产大模型在实际编程Agent场景下的SOTA级别能力。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

卡帕西都整破防了：AI Coding没门槛，可部署环节真嗯啊的难

量子位 2026-03-27 12:12:46
29 跟贴 29
重塑软件工程：从Vibe Coding走向Spec Coding

钛媒体APP 2026-02-11 09:37:53
73 跟贴 73

大模型最难的AI Infra，用Vibe Coding搞定

机器之心Pro 2026-01-07 15:33:06
0 跟贴 0

1美元Token撬动4800美元收益!百万美元级基准,最赚钱Agent出现了

机器之心Pro 2026-03-10 10:06:03
0 跟贴 0
奥特曼预言与现实相差几何？12个顶级模型“创业”一年，仅3个存活

钛媒体APP 2026-04-03 17:11:08
0 跟贴 0

海外研选 | 大摩：2030年服务器CPU市场规模或达2830亿美元

财联社 2026-05-12 20:07:11
1 跟贴 1

AI组织坍缩效应：中层管理者正在失去的，不是职位，是“信息税”

钛媒体APP 2026-05-12 15:25:23
14 跟贴 14
大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0

从字节、腾讯出走后，他们做起视频Agent，融资千万美元

智东西 2026-05-12 18:16:15
0 跟贴 0
支持远程操控和通用GUI操作3

机器之心Pro 2026-03-02 13:36:13
0 跟贴 0
智元杀进香港！2026成为部署态元年，机器人不再只会跳舞了

雷科技 2026-05-12 21:59:45
0 跟贴 0
Auto Research最后一块拼图,Frontier-Eng Bench,工程闭环里最优

机器之心Pro 2026-05-12 12:14:39
0 跟贴 0
OpenAI前CTO创业的模型首秀，与面壁智能「撞车」了

智东西 2026-05-12 20:09:32
0 跟贴 0
告别云端依赖！字节开源新作DreamLite让手机秒变 AI 画板

机器之心Pro 2026-05-12 20:47:59
0 跟贴 0
OpenAI又吃官司！佛州枪击案凶手问哪种武器和弹药最适合，何时何地能造成最大伤亡，ChatGPT均给出回答

每日经济新闻 2026-05-12 21:13:07
13 跟贴 13
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
智元APC香港观察：具身智能的终极角色是先进生产力单元

华尔街见闻官方 2026-05-12 21:49:18
0 跟贴 0
这个时代必须以Agent为中心：三个趋势回顾

量子位 2026-04-05 02:14:15
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
960万人围观！Claude Code工程师谈HTML“复兴”：Agent时代，Markdown不够用了

智东西 2026-05-12 12:41:12
12 跟贴 12
女团颁奖最感人一幕！孙颖莎修养含金量还在上升！难怪大家喜欢她

阿银紫 2026-05-12 00:23:25
11 跟贴 11
孙颖莎蝉联MVP！连续2届世乒赛力挽狂澜，不输外战含金量还在上升

小叶子侃球FM 2026-05-11 15:15:54
1 跟贴 1
Claude Code终于长出调度台：一个屏幕盯住所有AI会话，无需多开

新智元 2026-05-12 12:35:45
0 跟贴 0
姚来英已任中国烟草总公司总经理

界面新闻 2026-05-12 11:12:28
7930 跟贴 7930
一只太空螃蟹教孩子学Rust：20章故事书有了双语交互版

硅屿手记 2026-05-12 06:56:22
0 跟贴 0
基准10年期日本国债期货早盘下跌0.11点

每日经济新闻 2026-05-12 08:02:05
0 跟贴 0
美国10年期基准国债收益率涨4.95个基点，报4.4630%

每日经济新闻 2026-05-13 05:40:07
0 跟贴 0
单Agent时代正式结束：一个干不过，就上300个-3

机器之心Pro 2026-04-22 00:08:00
0 跟贴 0
老马秒羊腿，吃羊肉老马真权威，看一个馋一个，太香了

彗星看世界 2026-05-11 00:00:00
0 跟贴 0
托管机构被曝给孩子吃臭肉烂菜，山东滕州通报：立案调查

究竟视频 2026-05-10 14:03:19
0 跟贴 0
多名车主感叹"停车位缩水"：停车像在参加"极限挑战"

都市快报橙柿互动 2026-05-12 15:26:35
1882 跟贴 1882
九寨沟将实行“双向检票”？工作人员：出园检票并非新政策，一直严禁沟内住宿

上游新闻 2026-05-11 15:40:24
2879 跟贴 2879
Anthropic CEO：如果我是25岁，不会选编程，会选

机器之心Pro 2026-04-18 12:00:00
0 跟贴 0
辉煌难再现，穆里尼奥离开皇马后胜率从71.91%降至55.57%

懂球帝 2026-05-12 23:03:07
47 跟贴 47
突然爆火！湖北37岁小伙吹气球，半个月赚了60万！

大风新闻 2026-05-12 21:05:08
124 跟贴 124
男生打游戏要跟女朋友报备，男生用ai写了个报备程序，网友：直接点就完事了

安全与法 2026-05-11 15:40:38
0 跟贴 0
1-4月MPV销量TOP20名单出炉

我是老黄 2026-05-13 00:06:52
2 跟贴 2
广州中考名额分配：约11.6万名考生竞争3.2万个名额

南方都市报 2026-05-12 15:40:10
85 跟贴 85
面条模型，做的和真的一模一样

牛道影视剪辑 2026-05-12 13:54:02
1 跟贴 1
罗湖一小区使用近30年内部路或将收回？部门：超出红线范围

南方都市报 2026-05-12 11:51:22
332 跟贴 332

今年俄罗斯胜利日阅兵，为何唯独朝鲜派兵参加？中国怎么没派

今年俄罗斯胜利日阅兵，为何唯独朝鲜派兵参加？中国怎么没派

刘振起观点

2026-05-10 16:05:00

日本杀人犯逃亡后整容，因太帅了走红，大量女粉丝为其应援求情

日本杀人犯逃亡后整容，因太帅了走红，大量女粉丝为其应援求情

莫地方

2026-05-12 00:45:03

重庆奔驰撞人后续：知情人爆猛料出事前与多人吵架带情绪开车

重庆奔驰撞人后续：知情人爆猛料出事前与多人吵架带情绪开车

小鋭有话说

2026-05-12 18:20:51

5月，遇到这碱性水果，买它20斤，晒干囤起来，从夏天吃到秋天

5月，遇到这碱性水果，买它20斤，晒干囤起来，从夏天吃到秋天

阿龙美食记

2026-05-11 09:18:41

知名歌唱家贪财好色嫁大30岁二婚男，如今活成这样

知名歌唱家贪财好色嫁大30岁二婚男，如今活成这样

风月得自难寻

2026-05-12 06:25:42

张本美和不再沉默！说出全日本不想承认的事实：孙颖莎没任何弱点

张本美和不再沉默！说出全日本不想承认的事实：孙颖莎没任何弱点

八斗小先生

2026-05-12 11:24:29

谢婷婷晒照庆祝母亲节，小7岁男友同框狄波拉，三代同堂相处融洽

谢婷婷晒照庆祝母亲节，小7岁男友同框狄波拉，三代同堂相处融洽

书慧我心

2026-05-13 04:21:09

申花签下马莱加三年长约，锋线补强球迷期待新赛季

申花签下马莱加三年长约，锋线补强球迷期待新赛季

漫川舟船

2026-05-13 00:16:35

敢拦就开战？美国给“台独”递刀，中方：公海销毁没商量

敢拦就开战？美国给“台独”递刀，中方：公海销毁没商量

华山穹剑

2026-01-19 21:32:59

在巴萨夺得西甲冠军后的庆祝活动中，库巴西首次官宣了女友

在巴萨夺得西甲冠军后的庆祝活动中，库巴西首次官宣了女友

懂球帝

2026-05-12 18:00:11

张柏芝母亲节晒仨儿子, 8岁三胎儿子出镜, 谢霆锋疑似陪同吃饭

张柏芝母亲节晒仨儿子, 8岁三胎儿子出镜, 谢霆锋疑似陪同吃饭

可乐谈情感

2026-05-12 19:26:25

男子2天内嫖娼2次被行拘

观威海

2026-05-12 10:47:08

若世界杯彻底无缘中国观众，连锁后果超乎想象！梅西已是前车之鉴

若世界杯彻底无缘中国观众，连锁后果超乎想象！梅西已是前车之鉴

陈赩爱体育

2026-05-13 01:23:17

近10年买大江东的那批人，后悔了吗？

近10年买大江东的那批人，后悔了吗？

阿离家居

2026-05-12 18:29:09

亚历山大：毫不夸张地说米切尔是这轮系列赛表现最出色的球员

亚历山大：毫不夸张地说米切尔是这轮系列赛表现最出色的球员

北青网-北京青年报

2026-05-12 20:22:04

石破茂警告成真，高市终于松口示好，中方回应四个字：撤回言论

石破茂警告成真，高市终于松口示好，中方回应四个字：撤回言论

共工之锚

2026-05-12 23:57:43

青海17岁女学生溺亡！主动去的桥边，知情人曝猛料，恐不止是意外

青海17岁女学生溺亡！主动去的桥边，知情人曝猛料，恐不止是意外

北纬的咖啡豆

2026-05-12 11:29:42

李冰冰的脸骗了所有人，53岁生图揭开一个残酷真相，原来人不是变老是被榨干了

李冰冰的脸骗了所有人，53岁生图揭开一个残酷真相，原来人不是变老是被榨干了

科学发掘

2026-05-11 00:11:13

卡拉格：切尔西绝对会不惜一切代价把热刺送到英冠

卡拉格：切尔西绝对会不惜一切代价把热刺送到英冠

懂球帝

2026-05-12 12:20:06

两性关系：女人最爱这2种肢体触摸，99%女人都会动情

两性关系：女人最爱这2种肢体触摸，99%女人都会动情

皓皓情感说

2026-05-05 10:06:10

中国领先的全球投资研究平台

653316文章数 143385关注度

往期回顾全部

科技要闻

宇树发布载人变形机甲，定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案外交部回应

体育要闻

骑士终于玩明白了？

娱乐要闻

白鹿风波升级！掉粉20万评论区沦陷

财经要闻

利润再腰斩京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光电动尾翼+激光雷达

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

游戏

艺术

房产

公开课

亲子要闻

夏天建议：把孩子的空调服换成它！

活久见！电棍与香锅怒喷被撸圈开除后和解，祝Mlxg母亲节日快乐

艺术要闻

这位女摄影师的航拍风景照片，简直太美了！

房产要闻

穗八条引爆楼市！万博宝藏红盘，五一劲销出圈

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版