网易首页 > 网易号 > 正文 申请入驻

Code Arena放榜:阿里千问3.7编程能力超越GPT、Gemini,仅次于Claude系列

0
分享至

5月26日凌晨,全球权威三方编程榜单Code Arena放榜,阿里最新旗舰模型Qwen3.7-Max得分1541,超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一众模型,仅次于Claude系列,在大模型厂商中排名全球第二,这也标志着在代码理解与生成领域,千问3.7成功跻身全球编程模型第一梯队。


图说:Code Arena榜单显示,凭借Qwen3.7-Max,阿里位列全球第二

编程能力是当下模型智能水平的核心指标,而Code Arena是由知名第三方大模型盲测平台LMArena推出的最具影响力的榜单之一。与传统的代码基准测试不同,Code Arena并不考核孤立的代码片段生成或传统算法题,而是由开发者出题,要求模型从零生成完整的、可交互的Web应用程序,并交由用户对匿名模型的生成效果进行两两PK,由投票综合生成榜单,因此Code Arena也被认为是目前全球最具公信力的AI编程能力评测之一。经全球开发者以真实使用体验盲测投票,千问3.7模型编程能力位居前4,打破由Claude-Opus-4.7和4.6统治已久的前四格局,Qwen3.7-Max也成为目前榜单中唯一突破1540分大关的国产大模型。

据了解,面向Agent打造的Qwen3.7-Max在编程、智能体、长程任务等核心能力上实现了大幅突破,不但能在数小时内独立完成专业团队耗时2周的复杂项目端到端交付,大幅提升办公自动化和企业级生产力,甚至可以持续运行35小时、累计超1000次工具调用的复杂长程任务,自我编程优化芯片内核。

Qwen3.7-Max发布后迅速在全球引发强烈反响。大量独立开发者、AI创作者、企业用户第一时间在社交媒体上分享了测评结果:多位开发者评价其"长程自主执行能力令人印象深刻""是真正能把事情做完的智能体基座模型";有AI机构在相同提示词下同步横评了Qwen3.7-Max、Claude-4.7与GPT-5.5,发现千问3.7较上代的性能提升幅度最大、推理成本最低,在输出速度和生成质量两个维度上相较其他模型均有明显优势。

雷峰网

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王楚然搞“剧组夫妻”被实锤!?

王楚然搞“剧组夫妻”被实锤!?

八卦疯叔
2026-05-28 11:28:04
湖南24岁消防员郑雅文去世,突逢意外,妻子孕晚期,未能去送葬!

湖南24岁消防员郑雅文去世,突逢意外,妻子孕晚期,未能去送葬!

千言娱乐记
2026-05-28 14:51:17
心梗发作前7天,身体疯狂发警报!这5个信号,一定要注意!

心梗发作前7天,身体疯狂发警报!这5个信号,一定要注意!

健康之光
2026-05-27 17:15:06
C罗年薪的7倍!吉达联合:给梅西开出每年14亿欧合同,被他拒绝了

C罗年薪的7倍!吉达联合:给梅西开出每年14亿欧合同,被他拒绝了

夏侯看英超
2026-05-28 16:58:41
炸锅!中超首例申诉成功,足协实锤重大误判

炸锅!中超首例申诉成功,足协实锤重大误判

梦忆之浅
2026-05-28 13:56:33
“没穿几次,坏到离谱!”知名品牌淘宝旗舰店,上海消费者质疑买来“陈年老鞋”

“没穿几次,坏到离谱!”知名品牌淘宝旗舰店,上海消费者质疑买来“陈年老鞋”

一口娱乐
2026-05-28 18:06:31
同济学者重磅:红茶抗老成分抗炎、抗衰、抗脂肪肝一箭三雕!

同济学者重磅:红茶抗老成分抗炎、抗衰、抗脂肪肝一箭三雕!

时光派长寿观察
2026-05-27 14:20:08
货车在南京一小区内超速撞击4岁幼童致重伤,奶奶为护孩子不幸身亡

货车在南京一小区内超速撞击4岁幼童致重伤,奶奶为护孩子不幸身亡

大风新闻
2026-05-28 21:25:04
重庆市纪委监委驻市交通运输委纪检监察组原一级巡视员贾如兴

重庆市纪委监委驻市交通运输委纪检监察组原一级巡视员贾如兴

汲古知新
2026-05-27 21:17:11
沉默45年,中国终于迎来第二轮“严打”!目标改变总体战正式打响

沉默45年,中国终于迎来第二轮“严打”!目标改变总体战正式打响

闻识
2026-05-04 08:59:03
婚内强奸是强奸,那妻子抢工资是抢劫?付费同房是嫖娼?撕开婚姻最双标的底层真相

婚内强奸是强奸,那妻子抢工资是抢劫?付费同房是嫖娼?撕开婚姻最双标的底层真相

青苹果sht
2026-05-26 04:58:29
李慧严重违纪违法被开除党籍和公职

李慧严重违纪违法被开除党籍和公职

中国能源网
2026-05-27 16:15:05
上海一女神太漂亮 身高164CM 体重48公斤 五官精致到无懈可击

上海一女神太漂亮 身高164CM 体重48公斤 五官精致到无懈可击

TVB的四小花
2026-05-28 21:04:04
历史不会重演,但会惊人相似:新能源车,极可能重走燃油车的老路

历史不会重演,但会惊人相似:新能源车,极可能重走燃油车的老路

侃故事的阿庆
2026-05-28 14:28:28
中国动用否决权!下场联合国秘书长选举,当着全世界划下4条铁规

中国动用否决权!下场联合国秘书长选举,当着全世界划下4条铁规

近史谈
2026-05-27 18:29:02
上海德云社票房下滑背后,粉丝吹捧不买票,买票的观众给差评

上海德云社票房下滑背后,粉丝吹捧不买票,买票的观众给差评

我就是个码字的
2026-05-28 16:50:03
2020年,长沙女子癌症晚期,争夺女儿40万学费,直言:我只想活着

2020年,长沙女子癌症晚期,争夺女儿40万学费,直言:我只想活着

大鱼简科
2026-04-06 11:33:07
山西省人民政府通知

山西省人民政府通知

黄河新闻网吕梁
2026-05-28 17:42:32
朝鲜称绝不放弃核武器,外交部表态

朝鲜称绝不放弃核武器,外交部表态

澎湃新闻
2026-05-28 16:50:05
输上海3分!揪出3大“废柴”,坑惨了广厦队

输上海3分!揪出3大“废柴”,坑惨了广厦队

体育哲人
2026-05-28 23:58:40
2026-05-29 06:11:00
雷峰网 incentive-icons
雷峰网
关注智能与未来!
69483文章数 656136关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

美财长:特朗普不会接受“糟糕的伊朗协议”

头条要闻

美财长:特朗普不会接受“糟糕的伊朗协议”

体育要闻

唐斯经历的一切,此刻的他与尼克斯

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

小米仍需一次创业

汽车要闻

从智驾兜底到自研4nm芯片,再到迪迪虾,比亚迪智能化战略凭什么封神?

态度原创

教育
本地
亲子
健康
公开课

教育要闻

“好怕你俩亲上”,成年礼家长合照出圈,儿子的情结写在脸上

本地新闻

用剪纸的方式,打开江苏扬州

亲子要闻

豆包否认建议家长“每顿给婴儿喂60毫升奶”!提醒遵医嘱

专家教你辨认“正规外泌体”!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版