网易首页 > 网易号 > 正文 申请入驻

Claude 4.1发布,正面迎战GPT-5!写代码的王回来了!马上还有大更新

0
分享至

大数据文摘出品

8月6日,也就是今天,Anthropic正式推出了其旗舰模型Claude Opus 4.1,对Opus 4进行全面升级。

Claude Opus 4.1目前已上线于Claude的付费服务、Claude Code平台、API接口、Amazon Bedrock,以及Google Cloud的Vertex AI。

价格维持不变,还是那个会员价。

该版本最引人注目的是在SWE-bench Verified基准测试中拿下了74.5%的得分,打破了此前记录。这是测试衡量的是AI模型在开源代码中的实际Bug修复能力

Opus 4.1的得分比前代Opus 4高出约两个百分点,领先OpenAI最新的o系列模型约五个百分点。

GitHub方面指出,Claude Opus 4.1在多文件代码重构方面表现尤为突出,几乎所有指标相较于Opus 4均有提升。

Rakuten Group提供了实战数据:该模型能在庞大代码库中精准识别问题位置避免不必要的修改,也不会引入新Bug。

这种“只动该动的地方”的风格,恰恰适合日常调试。

曾专注AI编程的创业公司Windsurf称,Claude Opus 4.1在其“初级开发者测试”中取得了一整标准差的提升。他们把这种飞跃比作Sonnet 3.7升级到Sonnet 4时的表现差距。

也就是说,对一线开发者而言,这不是微调,而是质变

01 更聪明的“AI agent”

除了编程能力之外,Claude Opus 4.1在数据分析和研究任务中的能力也大幅增强

Anthropic表示,模型在细节跟踪与**任务搜索(agentic search)**方面变得更加可靠。

agentic能力指的是AI能否独立完成多步骤、目标明确的复杂任务

这类能力越来越成为AI竞赛的主战场。

Opus 4.1在这方面已经显现出对比其他主流模型的领先优势。

在Anthropic公布的基准测试中,Opus 4.1在agentic编码、视觉推理、数学竞赛任务上,全面超越Sonnet 4、Gemini 2.5 Pro以及OpenAI的o3版本。

Claude Opus 4.1 在代理式编程、视觉推理和数学竞赛等领域略胜其他领先的 AI 模型一筹。| 图片来源:Anthropic

Claude官方建议所有使用Opus 4的用户尽快迁移到Opus 4.1。如果是API用户,只需要更换模型tag为claude-opus-4-1-20250805即可接入。

整个迁移过程无缝衔接。

02 正面迎战GPT-5

Claude Opus 4.1的发布时间并不巧合。OpenAI的下一代重量级模型GPT-5即将发布。(有消息称是本周四)

据《The Information》报道,GPT-5的改进集中于编程、数学和代理任务,但不会像GPT-3到GPT-4那样带来“断层式”进化

换言之,GPT-5很强,但不会一骑绝尘

Anthropic的动作就是在这个时间点,推出Opus 4.1,并公开承诺:更大幅度的模型升级将在“未来几周内”陆续上线。这既是回应,也是挑衅。

他们显然意识到,如果GPT-5仅有“渐进式提升”,那么Claude 4.1就是一个可以维持技术制高点的“缓冲带”。

对开发者来说,这意味着无需观望GPT-5,Claude已经足够先进,值得继续押注。

显然,这是Anthropic“为GPT-5发布预先埋下的棋子”。而且棋下得很准。

同时,他们鼓励开发者阅读系统卡(System Card)、模型页面、价格页和技术文档,全面了解Opus 4.1的全貌。

作者长期关注 AI 产业与学术,欢迎对这些方向感兴趣的朋友添加微信Q1yezi,共同交流行业动态与技术趋势!

GPU 训练特惠!

H100/H200 GPU算力按秒计费,平均节省开支30%以上!

扫码了解详情☝

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
触目惊心!央视曝光上海一中医馆:从医生到病人全是演员!

触目惊心!央视曝光上海一中医馆:从医生到病人全是演员!

人间颂
2026-04-20 10:16:00
卡利巴夫抨击伊朗强硬派,担心自己被罢免,外长阿拉格奇被赶下台

卡利巴夫抨击伊朗强硬派,担心自己被罢免,外长阿拉格奇被赶下台

山河路口
2026-04-20 21:44:07
五一调休炸锅!放5天=休1天?全网骂疯:这哪是放假,是折腾人!

五一调休炸锅!放5天=休1天?全网骂疯:这哪是放假,是折腾人!

周哥一影视
2026-04-20 18:33:51
高市早苗向靖国神社献祭品

高市早苗向靖国神社献祭品

界面新闻
2026-04-21 06:51:26
《芯片战争:世界最关键技术的争夺战》第六部分:英特尔如何遗忘创新

《芯片战争:世界最关键技术的争夺战》第六部分:英特尔如何遗忘创新

我读我在
2026-04-21 07:25:56
互联网是有记忆的,她的黑历史一大堆啊!

互联网是有记忆的,她的黑历史一大堆啊!

BenSir本色说
2026-04-15 22:38:07
伊朗媒体:伊朗不参加谈判的决定尚未改变

伊朗媒体:伊朗不参加谈判的决定尚未改变

财联社
2026-04-20 23:03:06
今夜,跳水!中东大消息!

今夜,跳水!中东大消息!

中国基金报
2026-04-21 00:21:20
不建议有司机大老板买小米!雷军回应小米YU7二排比迈巴赫多一度:没有诋毁 但确实多

不建议有司机大老板买小米!雷军回应小米YU7二排比迈巴赫多一度:没有诋毁 但确实多

快科技
2026-04-18 10:12:12
醪糟再次被关注!医生发现:高血脂患者喝醪糟,不用多久4大变化

醪糟再次被关注!医生发现:高血脂患者喝醪糟,不用多久4大变化

芹姐说生活
2026-04-19 15:52:53
港媒曝张曼玉“五官彻底分离”,61岁生图惹争议,俩部位面目全非

港媒曝张曼玉“五官彻底分离”,61岁生图惹争议,俩部位面目全非

冷紫葉
2026-04-20 17:12:17
俄罗斯梁赞州向各单位下达征兵命令,翻译成中文很亲切

俄罗斯梁赞州向各单位下达征兵命令,翻译成中文很亲切

李未熟擒话2
2026-04-20 10:47:19
湖人G2赛前做出争议决定,或将彻底激怒詹姆斯!

湖人G2赛前做出争议决定,或将彻底激怒詹姆斯!

夜白侃球
2026-04-20 10:12:53
张馨予眼光不错!何捷出席学校活动,颜值爆表!当过兵就是不一样

张馨予眼光不错!何捷出席学校活动,颜值爆表!当过兵就是不一样

娱乐团长
2026-04-20 19:08:47
张雪回应:820RR爆缸是发动机问题,换新车还是退钱,车主选!

张雪回应:820RR爆缸是发动机问题,换新车还是退钱,车主选!

哄动一时啊
2026-04-18 19:39:31
最近你发现没有,好多城市的路口、天桥底下,突然冒出一群怪人。

最近你发现没有,好多城市的路口、天桥底下,突然冒出一群怪人。

阿振观点
2026-04-20 06:02:48
羽毛球女神沦为“生育工具”!韩景枫官宣二胎,距离1胎仅隔5个月

羽毛球女神沦为“生育工具”!韩景枫官宣二胎,距离1胎仅隔5个月

科学发掘
2026-04-21 00:01:33
环保要求“一律关窗”,应急要求“一直开窗”,“工厂开窗还是关窗生产”惊动3部委

环保要求“一律关窗”,应急要求“一直开窗”,“工厂开窗还是关窗生产”惊动3部委

法律学堂
2026-04-21 00:06:18
巴基斯坦也没想到,跟着中国混来混去,结果自己也混了一个霸主

巴基斯坦也没想到,跟着中国混来混去,结果自己也混了一个霸主

小樾说历史
2026-04-14 14:52:07
罕见大爆发!刚刚,涨停!重磅驱动,突现!

罕见大爆发!刚刚,涨停!重磅驱动,突现!

证券时报
2026-04-20 19:56:05
2026-04-21 08:04:49
大数据文摘 incentive-icons
大数据文摘
专注大数据,每日有分享!
6851文章数 94541关注度
往期回顾 全部

科技要闻

重磅官宣:库克卸任,特努斯接任苹果CEO

头条要闻

特朗普两天三次反转 伊朗学习特朗普玩起"极限施压"

头条要闻

特朗普两天三次反转 伊朗学习特朗普玩起"极限施压"

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成,字节到底在做什么

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

健康
家居
亲子
公开课
军事航空

干细胞抗衰4大误区,90%的人都中招

家居要闻

自然慢调 慢享时光

亲子要闻

大体重孩子家长要关注孩子运动足部压力是否正常

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:美舰向伊朗货船开火炸出个洞

无障碍浏览 进入关怀版