网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

GLM-5.1获Artificial Analysis全新Coding Agent基准开源第一

2026-05-12 20:36:05　来源: 证券时报

广东举报

0

分享至

人民财讯5月12日电，今日，全球权威评测机构Artificial Analysis发布全新Coding Agent基准Artificial Analysis Coding Agent Index，用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA主流基准上的表现。其中，闭源模型Opus 4.7（在Cursor CLI中运行）全球第一，GLM-5.1（在Claude Code中运行）取得开源第一。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

FDA 将封杀中国临床试验数据

生物学霸 2026-05-12 17:14:22
0 跟贴 0
北京大学最新Cell：冰箱中的草莓会启动一套全新“生物钟”，维持昼夜节律，抵抗腐烂

生物世界 2026-05-12 22:33:46
0 跟贴 0

4.3亿听障人士的福音，哥大团队研发脑控助听器，最高增益12分贝

DeepTech深科技 2026-05-12 18:04:57
3 跟贴 3

1美元Token撬动4800美元收益!百万美元级基准,最赚钱Agent出现了

机器之心Pro 2026-03-10 10:06:03
0 跟贴 0
卡帕西都整破防了：AI Coding没门槛，可部署环节真嗯啊的难

量子位 2026-03-27 12:12:46
29 跟贴 29

无畏帅得好权威这鼻梁真的可以滑滑梯

娱乐战斗姬 2026-05-09 11:16:23
0 跟贴 0

重塑软件工程：从Vibe Coding走向Spec Coding

钛媒体APP 2026-02-11 09:37:53
73 跟贴 73
大模型最难的AI Infra，用Vibe Coding搞定

机器之心Pro 2026-01-07 15:33:06
0 跟贴 0

960万人围观！Claude Code工程师谈HTML“复兴”：Agent时代，Markdown不够用了

智东西 2026-05-12 12:41:12
12 跟贴 12
奥特曼预言与现实相差几何？12个顶级模型“创业”一年，仅3个存活

钛媒体APP 2026-04-03 17:11:08
0 跟贴 0
姚来英已任中国烟草总公司总经理

界面新闻 2026-05-12 11:12:28
7983 跟贴 7983
Claude Code终于长出调度台：一个屏幕盯住所有AI会话，无需多开

新智元 2026-05-12 12:35:45
0 跟贴 0
日本走投无路，低调找俄求援，美国发现，中方已悄悄拿下全球第一

消费侠 2026-05-12 13:43:30
0 跟贴 0
基准10年期日本国债期货早盘下跌0.11点

每日经济新闻 2026-05-12 08:02:05
0 跟贴 0
单Agent时代正式结束：一个干不过，就上300个-3

机器之心Pro 2026-04-22 00:08:00
0 跟贴 0
海外研选 | 大摩：2030年服务器CPU市场规模或达2830亿美元

财联社 2026-05-12 20:07:11
1 跟贴 1
2002年作品《不可撤销》全球第一美女莫妮卡贝鲁奇，巅峰之作

军迷科普 2026-05-09 16:42:42
1 跟贴 1
老马秒羊腿，吃羊肉老马真权威，看一个馋一个，太香了

彗星看世界 2026-05-11 00:00:00
0 跟贴 0
AI组织坍缩效应：中层管理者正在失去的，不是职位，是“信息税”

钛媒体APP 2026-05-12 15:25:23
14 跟贴 14
九寨沟将实行“双向检票”？工作人员：出园检票并非新政策，一直严禁沟内住宿

上游新闻 2026-05-11 15:40:24
3112 跟贴 3112
多名车主感叹"停车位缩水"：停车像在参加"极限挑战"

都市快报橙柿互动 2026-05-12 15:26:35
1884 跟贴 1884
托管机构被曝给孩子吃臭肉烂菜，山东滕州通报：立案调查

究竟视频 2026-05-10 14:03:19
0 跟贴 0
辉煌难再现，穆里尼奥离开皇马后胜率从71.91%降至55.57%

懂球帝 2026-05-12 23:03:07
47 跟贴 47
男子结婚六七年不会做饭，为了匹配媳妇那么好的厨艺，家务这块儿整的相当权威

河南都市频道 2026-05-11 11:24:39
16 跟贴 16
法国新法落地：归还 “260万被抢文物”有多艰难？｜重建现场

新京报动新闻 2026-05-11 01:46:32
856 跟贴 856
广州中考名额分配：约11.6万名考生竞争3.2万个名额

南方都市报 2026-05-12 15:40:10
85 跟贴 85
海军新型末端防空反导系统现身指挥屏满屏打上马赛克

环球网资讯 2026-05-12 14:31:32
1363 跟贴 1363
罗湖一小区使用近30年内部路或将收回？部门：超出红线范围

南方都市报 2026-05-12 11:51:22
332 跟贴 332
面条模型，做的和真的一模一样

牛道影视剪辑 2026-05-12 13:54:02
1 跟贴 1
13岁女孩沉迷“二次元”，花光父亲18万积蓄买画稿，最贵一张5400元，画稿师：不知对方是未成年人，愿退费

环球网资讯 2026-05-12 19:26:13
396 跟贴 396
突然爆火！湖北37岁小伙吹气球，半个月赚了60万！

大风新闻 2026-05-12 21:05:08
119 跟贴 119
一组汽车出口数据，戳破了日本制造业最后的底气

荆楚寰宇文枢 2026-05-12 23:27:06
0 跟贴 0
从字节、腾讯出走后，他们做起视频Agent，融资千万美元

智东西 2026-05-12 18:16:15
0 跟贴 0
马瑞新书《意象之象》发布，新华社等多家权威媒体集中报道

鲁中晨报 2026-05-12 17:19:39
0 跟贴 0
这些地区的中国公民，立即撤离！中使馆紧急提醒

南方都市报 2026-05-12 16:09:22
539 跟贴 539
Auto Research最后一块拼图,Frontier-Eng Bench,工程闭环里最优

机器之心Pro 2026-05-12 12:14:39
0 跟贴 0
OpenAI前CTO创业的模型首秀，与面壁智能「撞车」了

智东西 2026-05-12 20:09:32
0 跟贴 0
告别云端依赖！字节开源新作DreamLite让手机秒变 AI 画板

机器之心Pro 2026-05-12 20:47:59
0 跟贴 0
常州⇆无锡，将全程无红绿灯！

中吴网 2026-05-12 13:59:27
26 跟贴 26
王凯与中国交通建设集团董事长宋海良举行工作会谈

证券时报 2026-05-12 19:52:04
0 跟贴 0

大S年轻时房间曝光，太过诡异引人不适，难怪有人曾说活不过50岁

大S年轻时房间曝光，太过诡异引人不适，难怪有人曾说活不过50岁

草莓解说体育

2026-05-11 20:49:33

记者：麦基和斯佩尔曼这俩大爷的态度北京未来很难过上海这一关

记者：麦基和斯佩尔曼这俩大爷的态度北京未来很难过上海这一关

狼叔评论

2026-05-13 01:50:16

今夜，美联储，利空突袭！芯片半导体，集体大跌

今夜，美联储，利空突袭！芯片半导体，集体大跌

中国基金报

2026-05-13 00:11:54

罗马教皇遭银行客服挂电话：必须本人前往银行网点办理

罗马教皇遭银行客服挂电话：必须本人前往银行网点办理

维城

2026-05-08 19:29:12

研究表明：性生活次数不达标，不管男女容易早衰且癌症风险增高！

研究表明：性生活次数不达标，不管男女容易早衰且癌症风险增高！

黯泉

2026-05-03 20:25:37

“新能源车普遍偏大一点，我停在车位上，左右车门都不能打得特别开，有时候人都出不去……”最近不少车主感叹：停车位缩水了？

“新能源车普遍偏大一点，我停在车位上，左右车门都不能打得特别开，有时候人都出不去……”最近不少车主感叹：停车位缩水了？

都市快报橙柿互动

2026-05-12 15:26:35

广东5人合同到期！杜润旺+2小将或留队，王少杰租借到期买断吗？

广东5人合同到期！杜润旺+2小将或留队，王少杰租借到期买断吗？

篮球资讯达人

2026-05-13 01:31:06

190元榴莲维权1600公里，商家道歉误伤女孩涨粉5万

190元榴莲维权1600公里，商家道歉误伤女孩涨粉5万

仙味少女心

2026-05-11 23:24:48

41岁C罗获评6.4分:拼尽全力，目睹球队遭绝平，无缘率队提前夺冠

41岁C罗获评6.4分:拼尽全力，目睹球队遭绝平，无缘率队提前夺冠

侧身凌空斩

2026-05-13 04:13:15

张柏芝谢霆锋活动偶遇，他那一秒的表情，让全网都破防了…

张柏芝谢霆锋活动偶遇，他那一秒的表情，让全网都破防了…

陈意小可爱

2026-05-12 13:04:00

印媒：大尼科巴岛将成为中国的噩梦！

印媒：大尼科巴岛将成为中国的噩梦！

达文西看世界

2026-05-10 08:28:38

通信业好多年没见过这么严峻的形势了……

通信业好多年没见过这么严峻的形势了……

悲了伤的白犀牛

2026-05-10 19:17:54

梁安琪带奚梦瑶扫货豪宅，同层豪掷1.68亿，拿下三套李泽楷新楼盘

梁安琪带奚梦瑶扫货豪宅，同层豪掷1.68亿，拿下三套李泽楷新楼盘

素衣读史

2026-05-12 21:57:21

人蠢不蠢一看就知：两个典型特征，中一条就不能深交

人蠢不蠢一看就知：两个典型特征，中一条就不能深交

心理观察局

2026-05-06 08:30:11

女子硕士入学清华后参与智力测验，仅得25分，回应：无论是学习、工作、创业，我都没有遇到困难，但我居然智力中下

女子硕士入学清华后参与智力测验，仅得25分，回应：无论是学习、工作、创业，我都没有遇到困难，但我居然智力中下

扬子晚报

2026-05-11 07:48:21

从今日起，中国不再需要日本道歉！这觉醒，来自3500万亡魂的重量

从今日起，中国不再需要日本道歉！这觉醒，来自3500万亡魂的重量

呼呼历史论

2026-05-13 00:53:16

从明晚起！CCTV-8黄金档、浙江卫视将播2部大剧，你想追哪部？

从明晚起！CCTV-8黄金档、浙江卫视将播2部大剧，你想追哪部？

阿废冷眼观察所

2026-05-13 01:05:13

美国一华人市长辞职，被指控充当外国代理人！

美国一华人市长辞职，被指控充当外国代理人！

西虹市闲话

2026-05-12 10:31:51

贵州20岁女子因腹痛就医才发现自己怀孕且胎儿已足月，当天平安分娩5斤多女儿；当事人：以为只是月经不调，误将胎动当做正常肠胃蠕动

贵州20岁女子因腹痛就医才发现自己怀孕且胎儿已足月，当天平安分娩5斤多女儿；当事人：以为只是月经不调，误将胎动当做正常肠胃蠕动

台州交通广播

2026-05-11 14:48:35

日系供应链集体失守！丰田日产大举采用中国零部件：成本低3成、质量还一样

日系供应链集体失守！丰田日产大举采用中国零部件：成本低3成、质量还一样

快科技

2026-05-12 12:20:06

运营主体:深圳证券时报社有限公司

910060文章数 239066关注度

往期回顾全部

科技要闻

宇树发布载人变形机甲，定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案外交部回应

体育要闻

骑士终于玩明白了？

娱乐要闻

白鹿风波升级！掉粉20万评论区沦陷

财经要闻

利润再腰斩京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光电动尾翼+激光雷达

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

艺术

家居

健康

公开课

教育要闻

求求你试试「5+1+1」学习法!!!

艺术要闻

这位女摄影师的航拍风景照片，简直太美了！

家居要闻

极简主义下的居住场域与空间

干细胞能让人“返老还童”吗

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版