网易首页 > 网易号 > 正文 申请入驻

「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗

0
分享至



机器之心报道

编辑:杜伟

一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。



不过,在刚刚过去的这个周末,Claude 最强编程模型的地位似乎开始动摇了。OpenAI 同样本月发布的 GPT-5 在编程赛道获得了越来越多人的青睐与使用。

有人发帖称,他基本已经完全不用 Claude Opus 了。现在同时开着几个 Codex 标签页,让 GPT-5-high 分别在三个代码库(HVM、Bend、Kolmo)上处理不同的任务。AI 编程进展从未如此迅速。他的工作基本上就是将定义清晰的任务交给 Codex,然后审查代码输出。

他还特意强调,这不是 OpenAI 打的广告。他只是觉得这个模型真的非常强大,而人们没有看到这一点。大多数人还只是将聊天机器人当作「女友」或其他用途,而不是用来协助完成复杂的编程任务。



不过,他也表示自己依然热爱 Anthropic,并在 VIM 编辑器中使用 Opus 进行代码补全,速度要比 GPT-5-high 快得多。



另一位推特博主、CoreView 联合创始人兼 CTO Ivan Fioravanti 也表示,他现在主要用 Claude Code,但 Codex-CLI 搭配 GPT-5 reasoning high 逐渐获得了他的更多信任。至于谷歌的 Gemini CLI,他都没开始深入研究。



不仅如此,他在需要直接执行的任务中同样在用 GPT-5 reasoning。



一位全栈产品开发者表示,「GPT-5-high 是目前为止他用过的最好的编程模型。」

该模型在指令遵循方面表现出色,可以放手让它处理更复杂的任务。此外,它在大规模重构任务中尤其给力,只要下指令「把这个改得更像那个」,它就能处理得很好。



粉丝近 20 万的推特大 V、e/acc 思潮创始人表示,根据他在旧金山听到的一些「小道消息」,现在很多人私下里其实更喜欢用 GPT-5 来写代码,这和流行的「Claude 更擅长编程」的叙事恰恰相反。



看到自家模型受到了越来越多人的喜爱,OpenAI 联合创始人兼总裁 Greg Brockman「坐不住」了,发推自夸道「用 GPT-5 写代码感觉太棒了」。



更多的人并认可了 GPT-5 的强大编程能力。



从这些人的反馈来看,GPT-5 编程能力更强似乎已经成为了一个不争的事实。与此同时,reddit 社区今天有一个帖子提到,「GPT-5 的幻觉率和通用实用性显著优于 Claude。」



帖子的主角是一位软件工程师,主要使用大语言模型来做编程、架构等工作。他开始注意到,Claude 在很大程度上其实是个「偏科型选手」(one-trick pony)。该系列模型只在写代码时表现出色,但一旦超出这个领域,幻觉率就高得离谱,结果也很差。

不过,他还是要给 Claude 加一分,它在写作上的「温度感」更强一些,尤其把它当成学习伙伴时。而 GPT-5 作为学习伙伴时,经常会把答案伪装成一个追问。相比之下,Claude 则保持了一种更严格的学习伙伴风格,它会引导你逐步接近答案,而不是直接把答案给你。

然而,GPT-5 的幻觉现象较少,搜索功能也相当不错。他举例称自己之前在找一款带有非常具体尺寸、颜色等要求的收纳抽屉。GPT-5 思考了大约 2.5 分钟,并进行了多次搜索,最后给了他一个几乎完全匹配的结果。而在那之前,他自己在 Amazon、Walmart、Target、Wayfair 等网站上搜了两个小时都没找到。最后他直接下单买了 GPT-5 推荐的那款。当他把完全相同的查询交给 Claude Opus 4.1 时,它不仅给出的尺寸选项比他要求的小得多,还找了一堆借口。

与此同时,在健康医疗类的问题上,Claude 的幻觉非常严重,这很危险。它经常把一些内容当作事实来说,但这些内容恰恰与医学界公认的结论完全相反。相比之下,GPT-5 的幻觉率要低得多。

也许正如最后这样网友所言,一开始并不信任 GPT-5,但用过之后发现:它在各个领域的表现确实都不错。



已经用上 GPT-5 一段时间的小伙伴们,你们现在的感觉怎么样呢?欢迎评论区探讨。

https://x.com/gdb/status/1959523328642703827

https://x.com/VictorTaelin/status/1958543021324029980

https://x.com/buildleansaas/status/1959686114375352641

https://x.com/BasedBeffJezos/status/1958942764747694593

https://www.reddit.com/r/OpenAI/comments/1mz26r4/gpt5_is_more_useful_than_claude_in_everydaythings/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
愿意无偿提供场所的江苏昆山企业负责人抵达北京嫣然医院与工作人员对接;李亚鹏前妻:为孩子父亲点赞,多年笨拙的坚守很不容易

愿意无偿提供场所的江苏昆山企业负责人抵达北京嫣然医院与工作人员对接;李亚鹏前妻:为孩子父亲点赞,多年笨拙的坚守很不容易

极目新闻
2026-01-19 20:17:57
全线跳水!刚刚,近24万人爆仓

全线跳水!刚刚,近24万人爆仓

中国能源网
2026-01-19 11:25:06
重磅:莫斯科遇袭大面积停电!乌克兰海马斯导弹齐射

重磅:莫斯科遇袭大面积停电!乌克兰海马斯导弹齐射

项鹏飞
2026-01-19 19:48:15
梁小龙去世早有预兆,关门弟子爆料3个“不良爱好”,都是催命符

梁小龙去世早有预兆,关门弟子爆料3个“不良爱好”,都是催命符

查尔菲的笔记
2026-01-19 12:35:23
车企懵圈!没了补贴“救济粮”,1月份新能源车销量狂跌了67%!

车企懵圈!没了补贴“救济粮”,1月份新能源车销量狂跌了67%!

言车有徐
2026-01-19 19:20:28
4万亿引爆,吃透【电力电网】产业链!附10大核心标的

4万亿引爆,吃透【电力电网】产业链!附10大核心标的

飞跑的鹿
2026-01-19 20:37:27
打虎!顾军被查

打虎!顾军被查

新京报
2026-01-19 18:18:09
曝中超劲旅更名为“浙江杭州”!死忠组织怒发文抵制:请尊重球迷

曝中超劲旅更名为“浙江杭州”!死忠组织怒发文抵制:请尊重球迷

我爱英超
2026-01-19 22:58:28
人民日报下场点评西贝事件,罗永浩有点危险了

人民日报下场点评西贝事件,罗永浩有点危险了

麦杰逊
2026-01-19 13:23:58
2025年商品房待售面积又增长1.6%,新增人口却不足800万,以后谁来买新房?

2025年商品房待售面积又增长1.6%,新增人口却不足800万,以后谁来买新房?

回旋镖
2026-01-19 12:37:43
“211女儿变成了这样,”父母记录学霸女儿堕落过程,引人深思

“211女儿变成了这样,”父母记录学霸女儿堕落过程,引人深思

妍妍教育日记
2026-01-19 17:24:54
6岁男童在医院补牙时钻针脱落,“约3厘米钻针掉入腹内”

6岁男童在医院补牙时钻针脱落,“约3厘米钻针掉入腹内”

南国今报
2026-01-19 22:39:03
王菲也没想到,离婚12年,李亚鹏给自己上了生动一课,李嫣没说错

王菲也没想到,离婚12年,李亚鹏给自己上了生动一课,李嫣没说错

白面书誏
2026-01-19 13:16:14
陈光标喊话李亚鹏邀请王菲办演唱会,称愿全额承担出场费,演唱会收入将捐赠给嫣然医院

陈光标喊话李亚鹏邀请王菲办演唱会,称愿全额承担出场费,演唱会收入将捐赠给嫣然医院

都市快报橙柿互动
2026-01-19 20:53:21
多省份公布金融数据:浙江人均存款超17万元

多省份公布金融数据:浙江人均存款超17万元

第一财经资讯
2026-01-19 20:30:29
吴晓波建议:把每年1.4万亿元烟草税收入直接“转移”为生育补贴,交税有利生育

吴晓波建议:把每年1.4万亿元烟草税收入直接“转移”为生育补贴,交税有利生育

六子吃凉粉
2026-01-19 17:17:23
浙江省委常委王文序,已任杭州市政协党组书记

浙江省委常委王文序,已任杭州市政协党组书记

新京报政事儿
2026-01-19 23:13:27
GOAT!德约三大满贯迎百胜里程碑,超越费德勒独占历史第一

GOAT!德约三大满贯迎百胜里程碑,超越费德勒独占历史第一

全景体育V
2026-01-19 20:50:17
老人除了防摔倒不吃饱外,还要注意这四件事,谁看谁受益

老人除了防摔倒不吃饱外,还要注意这四件事,谁看谁受益

情感大使馆
2026-01-19 09:24:25
敢拦就开战?美国给“台独”递刀,中方:公海销毁没商量

敢拦就开战?美国给“台独”递刀,中方:公海销毁没商量

华山穹剑
2026-01-19 21:32:59
2026-01-20 07:47:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12147文章数 142546关注度
往期回顾 全部

科技要闻

OpenAI首款硬件设备有望于2026年下半年亮相

头条要闻

江西警方:在柬失联叶文斌被电诈园区送出 已被刑拘

头条要闻

江西警方:在柬失联叶文斌被电诈园区送出 已被刑拘

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

公章争夺 家族反目 双星为何从顶端跌落?

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

艺术
数码
教育
公开课
军事航空

艺术要闻

瑞典艺术大师,佐恩人物作品精选19幅

数码要闻

荣耀手表GS 5发布:行业独家防猝筛查、23天蓝牙续航,699元

教育要闻

首都师大2025分数线公布!560分就能上?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

古美关系高度紧张 古巴启动"战争状态"

无障碍浏览 进入关怀版