网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

号称碾压GPT-4的AI，实测数据却不敢放全？

2026-03-23 14:08:27　来源: 固件更新中

北京举报

0

分享至

AI编程工具Composer 2的第三方评测结果开始流出。

评测数据与官方博客公布的指标基本吻合。

但开发者自己泼了冷水。

「benchmarks are an imperfect measure」，官方账号在X平台直言。

这句话的潜台词很微妙：数字好看，不代表真好用。

Composer 2主打"AI软件工程师"定位，能端到端完成编码任务。

其母公司Anysphere年初刚完成9亿美元融资，估值飙至90亿美元。

此前官方宣称该模型在SWE-bench编码基准上超越GPT-4。

但具体领先幅度、测试场景细节，博客并未完全公开。

第三方评测机构也未披露完整方法论。

AI编程赛道正陷入"跑分内卷"：Cursor、Windsurf、Devin轮番刷新榜单。

用户真正的痛点是：代码能跑，但维护成本谁算？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

波兰防长：波兰因美方施压正在将军队人数增至50万人

财联社 2026-03-23 19:48:11
1524 跟贴 1524
国际油价持续下跌美油布油均跌超13%

证券时报 2026-03-23 19:34:02
3104 跟贴 3104

小区公共收益：－74万元！沪上业主惊呆：5年临时停车收入0；倒欠物业巨款

新民晚报 2026-03-23 18:41:26
256 跟贴 256

十连胜！上海男篮“复刻”95申花？

上观新闻 2026-03-24 09:26:12
49 跟贴 49
“报备”了遭强拆，想“报批”无人理？南京一业主称装修遭遇“封闭阳台之困”

极目新闻 2026-03-23 20:19:53
1063 跟贴 1063

新华时评：“骂声”何尝不是改进工作的鞭策声

澎湃新闻 2026-03-23 23:28:03
862 跟贴 862

史上最大造芯计划启动，马斯克胃口为何这么大

澎湃新闻 2026-03-24 07:30:37
614 跟贴 614
“亿元村”饮水难的背后：重庆奉节县永乐镇大坝村部分村民反映，日常生活要喝雨水、溪沟水

澎湃新闻 2026-03-24 13:42:03
112 跟贴 112

百词斩崩了！连续打卡几百天的学生称因“断签”急哭，公司深夜回应

极目新闻 2026-03-24 07:58:43
105 跟贴 105
“汽车之家”多个平台社交账号被禁止关注，曾被相关部门点名批评

界面新闻 2026-03-24 12:13:39
37 跟贴 37
三大指数均高开近1%

财联社 2026-03-24 09:27:05
125 跟贴 125
对话乒乓球名将陈梦：体育的意义远不止于金牌

环球网资讯 2026-03-24 08:46:09
120 跟贴 120
中小学春假，多地跟进！

学申论的谈妹 2026-03-23 21:46:48
859 跟贴 859
日本东证股价指数涨幅扩大，最新上涨2.5%

每日经济新闻 2026-03-24 08:29:04
26 跟贴 26
上半场0分，詹姆斯：为了赢球，我必须扮演好这个角色

文汇报 2026-03-24 15:41:05
5 跟贴 5
河南“最爱发钱老板”请员工父母旅游，4000余人预计花费近千万元，公司：活动持续了14年，老板想帮员工尽孝心

极目新闻 2026-03-24 11:40:03
11 跟贴 11
U16国足0比2不敌格勒诺布尔U17队

齐鲁壹点 2026-03-23 19:15:09
157 跟贴 157
六部门：稳步推进农村供水价格改革

财联社 2026-03-24 11:49:09
15 跟贴 15
钟华论：一步一步往上走，一程一程向复兴

新京报 2026-03-23 20:54:26
201 跟贴 201
索尼集团拟向TCL出售家庭娱乐业务多数股权，交易估值约10亿美元

环球网资讯 2026-03-24 16:33:25
8 跟贴 8
多地明确：逐步消除高校8人间

澎湃新闻 2026-03-24 17:54:23
2 跟贴 2
啥情况？泰州快速路上一车辆突发火情！

百晓生很小声 2026-03-24 17:55:56
0 跟贴 0

为什么现在越来越多人用苹果手机？网友：确实是老年人首选

为什么现在越来越多人用苹果手机？网友：确实是老年人首选

夜深爱杂谈

2026-03-23 19:57:00

中国已被卷入美伊生死局！如果伊朗倒下，下一个将会是我们？

中国已被卷入美伊生死局！如果伊朗倒下，下一个将会是我们？

沙溪解说

2026-03-03 16:20:03

中国最“闲”的3座机场：每天飞1趟航班，飞机一走员工就集体下班

中国最“闲”的3座机场：每天飞1趟航班，飞机一走员工就集体下班

青眼财经

2026-03-07 23:26:43

韦德和詹姆斯之间的兄弟情义为何会逐渐冷淡？韦德有重大过错

韦德和詹姆斯之间的兄弟情义为何会逐渐冷淡？韦德有重大过错

篮球小烟花

2026-03-24 08:00:03

客机撞消防车，纽约机场上演《死神来了》：意外环环相扣导致灾难，空管崩溃：我搞砸了！

客机撞消防车，纽约机场上演《死神来了》：意外环环相扣导致灾难，空管崩溃：我搞砸了！

红星新闻

2026-03-24 14:27:54

脑机接口板块短线拉升，塞力医疗涨停

脑机接口板块短线拉升，塞力医疗涨停

每日经济新闻

2026-03-24 10:15:35

雄鹿官宣裁掉托马斯！他曾拒绝2年3000万肥约豪赌

雄鹿官宣裁掉托马斯！他曾拒绝2年3000万肥约豪赌

体坛周报

2026-03-24 09:18:12

山姆发布情况说明

最江阴

2026-03-23 11:09:55

勇士噩耗！穆迪倒地！库里抱头！勇士未来悬了？

勇士噩耗！穆迪倒地！库里抱头！勇士未来悬了？

篮球盛世

2026-03-24 17:16:33

两国可能合并，一旦成功将变成超级大国，恐终结美国一家独大局面

两国可能合并，一旦成功将变成超级大国，恐终结美国一家独大局面

现代小青青慕慕

2026-03-15 09:34:25

吃以色列的饭，砸以色列的锅，若以色列“灭国”，有他们一半功劳

吃以色列的饭，砸以色列的锅，若以色列“灭国”，有他们一半功劳

易玄

2026-03-24 00:11:41

小里夫斯：若阿德巴约能在文班亚马手中砍30分，比打奇才83分更牛

小里夫斯：若阿德巴约能在文班亚马手中砍30分，比打奇才83分更牛

好火子

2026-03-24 04:35:04

曾投资阿里140亿，还投资恒大200亿，如今只剩一套68平小房子

曾投资阿里140亿，还投资恒大200亿，如今只剩一套68平小房子

小明哗扑

2026-03-19 10:50:52

娜扎直播大胆卸妆，素颜状态封神，网友：这是卸了个空气？

娜扎直播大胆卸妆，素颜状态封神，网友：这是卸了个空气？

乡野小珥

2026-03-24 08:39:27

8罚0中，周琦率领吉林队击败北京首钢，以实际行动拒绝中国男篮

8罚0中，周琦率领吉林队击败北京首钢，以实际行动拒绝中国男篮

姜大叔侃球

2026-03-23 21:55:08

险些逆转！湖人110-113活塞，本场谁是罪魁祸首，数据不会说谎！

险些逆转！湖人110-113活塞，本场谁是罪魁祸首，数据不会说谎！

谈史论天地

2026-03-24 12:34:34

丧子又丧偶！女子独自一人办丧事，用去世儿子的书包给丈夫装骨灰

丧子又丧偶！女子独自一人办丧事，用去世儿子的书包给丈夫装骨灰

每一次点击

2026-01-31 22:57:20

为什么只有革命卫队与美以干，而伊朗40万国防军沉默观战？

为什么只有革命卫队与美以干，而伊朗40万国防军沉默观战？

廖保平

2026-03-17 09:04:38

国内将逐渐停止“心脏支架”？做完身体就垮了？医生告诉您真相

国内将逐渐停止“心脏支架”？做完身体就垮了？医生告诉您真相

医学原创故事会

2026-03-24 14:42:05

回顾“91女神”琪琪：五官出众，却因天真让自己“受伤”

回顾“91女神”琪琪：五官出众，却因天真让自己“受伤”

就一点

2025-11-22 10:36:39

固件更新中

有态度网友ytd

347文章数 3关注度

往期回顾全部

科技要闻

黄仁勋看透中国AI圈人情世故卷出最快创新

头条要闻

外媒披露特朗普"急转弯"原因:盟友和海湾国家发出警告

头条要闻

外媒披露特朗普"急转弯"原因:盟友和海湾国家发出警告

体育要闻

NBA最强左手射手，是个右撇子

娱乐要闻

林峰张馨月全家浙江游岳母帮忙带女儿

财经要闻

很多人，都被黄金吓怕了！

汽车要闻

尚界Z7双车预售22.98万起问界M6预售26.98万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

手机

数码

艺术

家居

她们都在穿的赛车夹克有什么魔力？

手机要闻

全球首创阔折叠！华为Pura X全新配色型格橙、型格紫来了

数码要闻

316L精钢+超长续航小米Watch S5手表全面评测：小米汽车最强黄金搭

艺术要闻

美国发现赵孟頫孤本真迹，这字美得难以言表，老外看了都竖大拇指！

家居要闻

智慧生活奢享家居

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版