网易首页 > 网易号 > 正文 申请入驻

「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗

0
分享至

机器之心报道

编辑:杜伟

一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。

不过,在刚刚过去的这个周末,Claude 最强编程模型的地位似乎开始动摇了。OpenAI 同样本月发布的 GPT-5 在编程赛道获得了越来越多人的青睐与使用。

有人发帖称,他基本已经完全不用 Claude Opus 了。现在同时开着几个 Codex 标签页,让 GPT-5-high 分别在三个代码库(HVM、Bend、Kolmo)上处理不同的任务。AI 编程进展从未如此迅速。他的工作基本上就是将定义清晰的任务交给 Codex,然后审查代码输出。

他还特意强调,这不是 OpenAI 打的广告。他只是觉得这个模型真的非常强大,而人们没有看到这一点。大多数人还只是将聊天机器人当作「女友」或其他用途,而不是用来协助完成复杂的编程任务。

不过,他也表示自己依然热爱 Anthropic,并在 VIM 编辑器中使用 Opus 进行代码补全,速度要比 GPT-5-high 快得多。

另一位推特博主、CoreView 联合创始人兼 CTO Ivan Fioravanti 也表示,他现在主要用 Claude Code,但 Codex-CLI 搭配 GPT-5 reasoning high 逐渐获得了他的更多信任。至于谷歌的 Gemini CLI,他都没开始深入研究。

不仅如此,他在需要直接执行的任务中同样在用 GPT-5 reasoning。

一位全栈产品开发者表示,「GPT-5-high 是目前为止他用过的最好的编程模型。」

该模型在指令遵循方面表现出色,可以放手让它处理更复杂的任务。此外,它在大规模重构任务中尤其给力,只要下指令「把这个改得更像那个」,它就能处理得很好。

粉丝近 20 万的推特大 V、e/acc 思潮创始人表示,根据他在旧金山听到的一些「小道消息」,现在很多人私下里其实更喜欢用 GPT-5 来写代码,这和流行的「Claude 更擅长编程」的叙事恰恰相反。

看到自家模型受到了越来越多人的喜爱,OpenAI 联合创始人兼总裁 Greg Brockman「坐不住」了,发推自夸道「用 GPT-5 写代码感觉太棒了」。

更多的人并认可了 GPT-5 的强大编程能力。

从这些人的反馈来看,GPT-5 编程能力更强似乎已经成为了一个不争的事实。与此同时,reddit 社区今天有一个帖子提到,「GPT-5 的幻觉率和通用实用性显著优于 Claude。」

帖子的主角是一位软件工程师,主要使用大语言模型来做编程、架构等工作。他开始注意到,Claude 在很大程度上其实是个「偏科型选手」(one-trick pony)。该系列模型只在写代码时表现出色,但一旦超出这个领域,幻觉率就高得离谱,结果也很差。

不过,他还是要给 Claude 加一分,它在写作上的「温度感」更强一些,尤其把它当成学习伙伴时。而 GPT-5 作为学习伙伴时,经常会把答案伪装成一个追问。相比之下,Claude 则保持了一种更严格的学习伙伴风格,它会引导你逐步接近答案,而不是直接把答案给你。

然而,GPT-5 的幻觉现象较少,搜索功能也相当不错。他举例称自己之前在找一款带有非常具体尺寸、颜色等要求的收纳抽屉。GPT-5 思考了大约 2.5 分钟,并进行了多次搜索,最后给了他一个几乎完全匹配的结果。而在那之前,他自己在 Amazon、Walmart、Target、Wayfair 等网站上搜了两个小时都没找到。最后他直接下单买了 GPT-5 推荐的那款。当他把完全相同的查询交给 Claude Opus 4.1 时,它不仅给出的尺寸选项比他要求的小得多,还找了一堆借口。

与此同时,在健康医疗类的问题上,Claude 的幻觉非常严重,这很危险。它经常把一些内容当作事实来说,但这些内容恰恰与医学界公认的结论完全相反。相比之下,GPT-5 的幻觉率要低得多。

也许正如最后这样网友所言,一开始并不信任 GPT-5,但用过之后发现:它在各个领域的表现确实都不错。

已经用上 GPT-5 一段时间的小伙伴们,你们现在的感觉怎么样呢?欢迎评论区探讨。

https://x.com/gdb/status/1959523328642703827

https://x.com/VictorTaelin/status/1958543021324029980

https://x.com/buildleansaas/status/1959686114375352641

https://x.com/BasedBeffJezos/status/1958942764747694593

https://www.reddit.com/r/OpenAI/comments/1mz26r4/gpt5_is_more_useful_than_claude_in_everydaythings/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不比不知道,一比吓一跳!苏林回国后很焦虑:原来我们落后这么多

不比不知道,一比吓一跳!苏林回国后很焦虑:原来我们落后这么多

壹切的壹切
2026-04-21 21:29:46
太心酸了!36岁程序员自述被裁经历,从年薪四五十万到被家人嫌弃

太心酸了!36岁程序员自述被裁经历,从年薪四五十万到被家人嫌弃

火山詩话
2026-04-20 07:13:56
特斯拉 Model Y 新版本现身!值得期待

特斯拉 Model Y 新版本现身!值得期待

花果科技
2026-04-22 15:35:37
一句“让他上”救了单位,保安的傲慢,到底毁了谁?

一句“让他上”救了单位,保安的傲慢,到底毁了谁?

社会日日鲜
2026-04-22 08:32:24
发现诺亚方舟?疑似诺亚方舟真身曝光,内部结构被雷达扫出

发现诺亚方舟?疑似诺亚方舟真身曝光,内部结构被雷达扫出

Science科学说
2026-04-21 20:40:34
博士回炉读硕士,本科鼓励读技校,2026届高校毕业生1270万创新高

博士回炉读硕士,本科鼓励读技校,2026届高校毕业生1270万创新高

黑企鹅观察
2026-04-22 09:33:04
掘金现在恐怕肠子都要悔青了!

掘金现在恐怕肠子都要悔青了!

君子一剑似水流年
2026-04-22 06:48:20
新娘确实漂亮,但我更喜欢戴眼镜那个。

新娘确实漂亮,但我更喜欢戴眼镜那个。

动物奇奇怪怪
2026-04-12 12:44:36
保定通报灌溉井水呈红色:初步研判与染料有关

保定通报灌溉井水呈红色:初步研判与染料有关

界面新闻
2026-04-22 17:32:17
空军全军覆没?伊朗突亮地下底牌!美以傻眼了,就这样被骗几十亿

空军全军覆没?伊朗突亮地下底牌!美以傻眼了,就这样被骗几十亿

琨玉秋霜
2026-04-21 00:11:13
中美联合国激烈交锋,美逼中国买单,中方拒绝接受,对美反将一军

中美联合国激烈交锋,美逼中国买单,中方拒绝接受,对美反将一军

健身狂人
2026-04-22 20:37:47
太扎心了!上海男子年薪百万失业引不满,新婚3个月女子就想离婚

太扎心了!上海男子年薪百万失业引不满,新婚3个月女子就想离婚

火山詩话
2026-04-20 06:12:18
树倒猢狲散!武亮直播哭红眼眶,20余天的人事动荡,让他心力憔悴

树倒猢狲散!武亮直播哭红眼眶,20余天的人事动荡,让他心力憔悴

火山詩话
2026-04-20 06:31:57
大快人心!张敬轩复出泡汤,霍汶希被拖下水,英皇如坐针毡

大快人心!张敬轩复出泡汤,霍汶希被拖下水,英皇如坐针毡

一盅情怀
2026-04-21 19:20:32
美军扣押伊朗货轮,中国商品就在船上,不到1天,中国就表态了

美军扣押伊朗货轮,中国商品就在船上,不到1天,中国就表态了

泠泠说史
2026-04-22 21:27:25
曾经那些真实的特供,超出普通人的想象…

曾经那些真实的特供,超出普通人的想象…

深度报
2026-04-21 22:56:47
1只就判刑!2024年,江苏4名男子为饱口福猎杀两只,价值数十万元

1只就判刑!2024年,江苏4名男子为饱口福猎杀两只,价值数十万元

万象硬核本尊
2026-04-23 00:02:17
马刺官宣:文班亚马脸部重摔地板 触发脑震荡保护协议提前退赛

马刺官宣:文班亚马脸部重摔地板 触发脑震荡保护协议提前退赛

醉卧浮生
2026-04-22 09:17:19
多投44次还是输!火箭0-2背后是老毛病:引进杜兰特也没解决问题

多投44次还是输!火箭0-2背后是老毛病:引进杜兰特也没解决问题

罗说NBA
2026-04-23 05:54:03
“中年返贫三件套”,正在吞掉一代人的存款

“中年返贫三件套”,正在吞掉一代人的存款

十点读书
2026-04-18 18:36:15
2026-04-23 07:39:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12831文章数 142633关注度
往期回顾 全部

科技要闻

对话梅涛:没有视频底座,具身智能走不远

头条要闻

媒体:听到美国要查中国成分 东南亚贸易代表倒吸冷气

头条要闻

媒体:听到美国要查中国成分 东南亚贸易代表倒吸冷气

体育要闻

网易传媒再度签约法国队和阿根廷队

娱乐要闻

蜜雪冰城泰国代言人 被扒出辱华黑历史

财经要闻

医院专家号"秒空"!警方牵出黑色产业链

汽车要闻

纯电续航301km+激光雷达 宋Pro DM-i飞驰版9.99万起

态度原创

手机
旅游
数码
游戏
军事航空

手机要闻

OPPO Find X9 Ultra明天首销:把增距镜塞进手机里 7499元起

旅游要闻

“五一”高性价比“小城游”热度攀升 你pick哪座城?

数码要闻

OPPO Find X9 Ultra体验:这就是满级Ultra该有的样子

魔兽世界:时光服争议不断,1000包片金主嫌贵,竞拍却能破2000!

军事要闻

特朗普宣布延长停火 伊朗表态

无障碍浏览 进入关怀版