网易首页 > 网易号 > 正文 申请入驻

Claude Opus 4.1深夜狙击OpenAI,SWE-bench编程卷到74.5%,预告更强大模型

0
分享至

智东西8月6日消息,今天,Anthropic正式发布Claude Opus 4.1

据Anthropic公告,新模型在智能体工具调用、智能体编程与多语言问答能力上全面超越OpenAI o3,Anthropic还计划在未来数周内为模型推出更大幅度的改进。

▲Anthropic推文截图(来源:X)

Opus 4.1现已面向付费Claude用户Claude Code提供,该版本同时登陆API、Amazon Bedrock和Google Cloud的Vertex AI平台,开发者可通过API使用claude-opus-4-1-20250805版本

在定价上,Opus 4.1与Opus 4保持一致,输入15美元(约合人民币107.8元)/百万token,输出75美元(约合人民币538.8元)/百万token。

性能方面,Opus 4.1在SWE-bench Verified上的顶级编码性能提升至74.5%,该版本还增强了Claude的深度研究与数据分析能力,特别是在细节追踪和智能体搜索方面。

在GitHub上,相较于Opus 4,Claude Opus 4.1在多数能力维度均有提升,其中多文件代码重构的性能进步尤为显著。

Opus 4.1在智能体工具调用与多语言问答能力上超越OpenAI o3,在智能体编程方面的分数为74.5%43.3%大幅超越OpenAI o3和Gemini 2.5 Pro,但其在视觉推理和数学能力上与OpenAI o3和Gemini 2.5 Pro还有一定的差距。

Anthropic的公告中透露,Rakuten Group发现Opus 4.1擅长在大型代码库中精确定位修正点,且不会进行不必要的调整或引入错误,其团队更倾向在日常调试任务中使用这种精准性。

Windsurf报告显示,在其初级开发者基准测试中,Opus 4.1相比Opus 4实现了1个标准差的提升,性能跃升幅度相当于从Sonnet 3.7升级至Sonnet 4。

结语:大模型竞赛进入“智能体时代”

从基准测试结果可以看出,Anthropic这次推出的Claude Opus 4.1,主要在大模型的智能体相关能力上,例如智能体编程和智能体工具调用等方面,进行了升级侧重。

也从侧面反映出,如今的大模型开始朝着“给智能体提供更智能的大脑”的方向升级迭代,为智能体的进一步发展夯实地基。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“毕设作品快递中破损”新进展:当事人称快递公司愿意全额赔偿,但要求退回雕塑丨云投诉

“毕设作品快递中破损”新进展:当事人称快递公司愿意全额赔偿,但要求退回雕塑丨云投诉

封面新闻
2026-07-04 20:29:06
不结婚,怎么解决生理需求?58岁的歌唱家张也,给出了最佳回答

不结婚,怎么解决生理需求?58岁的歌唱家张也,给出了最佳回答

悦君兮君不知
2026-07-04 00:01:28
太惨了!夫妻省吃俭用三年为孩子教育砸下30万元,高考考了420分

太惨了!夫妻省吃俭用三年为孩子教育砸下30万元,高考考了420分

火山詩话
2026-07-04 16:03:24
国足天塌了!又一夜封神后,佛得角喊话中国足协,理由竟无法拒绝

国足天塌了!又一夜封神后,佛得角喊话中国足协,理由竟无法拒绝

笑一个吧
2026-07-04 21:03:31
中纪委怒批:公务员也是人,正常生活不应问责处理!

中纪委怒批:公务员也是人,正常生活不应问责处理!

细说职场
2026-06-24 10:55:30
马未都回应“被盗佛像疑似现身观复博物馆”:等待上级公布鉴定结果

马未都回应“被盗佛像疑似现身观复博物馆”:等待上级公布鉴定结果

澎湃新闻
2026-07-04 22:14:26
世界杯16强全部出炉,金球奖悬念已不大!将在以下9名球员中产生

世界杯16强全部出炉,金球奖悬念已不大!将在以下9名球员中产生

球场没跑道
2026-07-04 14:25:12
厄德高个人条款谈妥,枪手标价4000万欧

厄德高个人条款谈妥,枪手标价4000万欧

温柔且自由
2026-07-04 00:28:31
炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次八百到几万

炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次八百到几万

就一点
2026-06-02 15:45:51
世界杯16强格局:欧洲+美洲独占14席,亚洲球队全军覆没

世界杯16强格局:欧洲+美洲独占14席,亚洲球队全军覆没

橙汁的味道123
2026-07-04 11:32:26
世界杯16强全部产生,1/8决赛对阵赛程出炉,预测这8支球队进8强

世界杯16强全部产生,1/8决赛对阵赛程出炉,预测这8支球队进8强

第五才子
2026-07-04 12:07:15
还没服务过任何人,就先摆好了当老爷的姿态!

还没服务过任何人,就先摆好了当老爷的姿态!

胖胖说他不胖
2026-07-03 15:39:28
高考699分女孩报清华却被网暴,到底是谁在替她“不配”?

高考699分女孩报清华却被网暴,到底是谁在替她“不配”?

极目新闻
2026-07-04 09:49:07
中央决定:李孝振履新职

中央决定:李孝振履新职

上观新闻
2026-07-04 10:42:48
怪不得这么难,全国大中型国企有2295家都在亏损,累计亏损超千亿

怪不得这么难,全国大中型国企有2295家都在亏损,累计亏损超千亿

黯泉
2026-06-24 11:33:53
已是无人不晓!佛得角主帅6月底采访时说:希望我们回家时人们会记得,佛得角参加过这届世界杯

已是无人不晓!佛得角主帅6月底采访时说:希望我们回家时人们会记得,佛得角参加过这届世界杯

鲁中晨报
2026-07-04 10:50:03
阿里亚斯一剑封喉,哥伦比亚1-0击败非洲劲旅,晋级世界杯16强

阿里亚斯一剑封喉,哥伦比亚1-0击败非洲劲旅,晋级世界杯16强

侧身凌空斩
2026-07-04 11:31:39
惨败日本后郭士强连夜换阵!赵继伟高诗岩被拿下?庞峥麟或成生死战奇兵

惨败日本后郭士强连夜换阵!赵继伟高诗岩被拿下?庞峥麟或成生死战奇兵

画夕
2026-07-05 00:58:57
“高考估分715查分299 女孩称试卷不是自己的”?四川绵阳市教体局核查:纯属谣言 查无此人

“高考估分715查分299 女孩称试卷不是自己的”?四川绵阳市教体局核查:纯属谣言 查无此人

闪电新闻
2026-07-02 12:26:25
印度人在南京水库被罚5000!放印度人入境不是错,错的是审核太松

印度人在南京水库被罚5000!放印度人入境不是错,错的是审核太松

世界地缘观察
2026-07-03 16:05:05
2026-07-05 03:04:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12176文章数 117119关注度
往期回顾 全部

科技要闻

韬定律论文V2版,充工程细节和实测数据

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

白鹿打戏抠图惹非议 连累丞磊遭扒皮

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

时尚
教育
旅游
房产
游戏

别再说"露肩衣服 "难驾驭!看看这几组日常穿搭,大方有回头率

教育要闻

两个孩子拾金不昧,没想到换来全套练习题

旅游要闻

来思南慢摇一夏!解锁上海文旅新体验

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

韩版“全境封锁”PC配置降低 内存改为32GB起步

无障碍浏览 进入关怀版