网易首页 > 网易号 > 正文 申请入驻

刚刚,Anthropic正式推出Claude Opus 4.1,附全网实测

0
分享至

作者|子川

来源|AI先锋官

今天这是怎么了?各大厂家模型齐发!

今天凌晨,OpenAI开源两款推理模型。

Anthropic紧接着推出Claude Opus 4.1,来了一场狭路相逢的戏码。

据介绍,此次推出的Claude Opus 4.1将代理任务、编程、推理等能力推向了新的高度。

特别是在 SWE-bench Verified 编码测试中,相比Claude Opus 4,新版的Opus 4.1性能飙升至 74.5%虽然提升不大)。

可能很多朋友还不了解SWE-bench Verified这个榜单,这里给大家简单介绍一下。

SWE-bench Verified是 AI 代码能力评测中“最贴近真实开发场景”的榜单之一,专门用来衡量大模型/智能体在软件工程任务中的“动手能力”。

和传统刷算法题不同,它把 GitHub 上真实存在的 issue(bug 或需求)连同整个代码仓库、依赖环境一起打包,要求模型独立完成。

并且只有一次性通过测试,才算“解决”,因此这个榜单的成绩含金量非常高。

目前这个榜单的前三分别是Claude 4 Opus、Claude 4 Sonnet和o3。

除此之外,Claude Opus 4.1在Agentic terminal coding、Graduate-level reasoning、Multilingual Q&A、Visual reasoning等测试中,都全面超越了Claude Opus 4。

下面就是大家最关心的价格,Claude Opus 4.1加量不加价,价格和Claude Opus 4保持一致(不过也真的贵)。

  • 每百万输入 token 15 美元

  • 每百万输出 token 75 美元

目前Claude Opus 4.1已经面向Pro、Max、Team和Enterprise用户开放,同时大家也可以通过调用。

距离发布已过好几个小时,不少网友已经陆续分享它们实测的结果。

网友@Lisan al Gaib测试发现,Claude Opus 4.1的理解能力很强,

并评论到:他是为数不多在你说“想象你的家”时,会想象一间房间而非整栋房子的模型之一。

网友@karminski-牙医放出了对比Gemini 2.5 Pro、gpt-oss-120b、gpt-oss-20b的对比视频。

网友@Techikansh放出了他使用Claude Opus4.1和Claude Opus 4的一个对比动画,从肉眼上看,几乎没有区别。

Claude Opus4.1

Claude Opus4

@suemaru用游戏来做了性能对比,结论是画面质量明显更好。

并表示除了视觉效果,之前用 Sonnet 4 生成的关卡难度爆表,想截个图都费劲;而 Opus 4.1 生成的难度刚刚好,玩着很舒服,甚至没下指令就自带高分榜,回放也做得特别有趣。

长期以来,Anthropic 一直被视为 OpenAI 最强劲的竞争对手,尤其是在对模型要求极高的编程领域。

最近,这场竞争的紧张气氛再度升级,有报道称 Anthropic 指控 OpenAI 违规使用其模型以训练和优化自家的产品,并因此切断了 OpenAI 对其 API 的访问权限。

而现在,Anthropic 紧随 OpenAI 的步伐,于同一天发布了新模型 Claude Opus 4.1,这多少有一点“狙击”的意思了。

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国务院安委办召开专题调度会,加强烟花爆竹全链条安全监管

国务院安委办召开专题调度会,加强烟花爆竹全链条安全监管

澎湃新闻
2026-02-18 23:36:26
高市会否“政治暴走”,取决于日本国内的一颗“地雷”何时引爆

高市会否“政治暴走”,取决于日本国内的一颗“地雷”何时引爆

观察者网
2026-02-20 14:10:03
全线爆满!排长队!无锡这里迎来客流巅峰!

全线爆满!排长队!无锡这里迎来客流巅峰!

江南晚报
2026-02-20 11:49:17
日媒:超八成支持,和平宪法岌岌可危,高市政权右转印证中方警告

日媒:超八成支持,和平宪法岌岌可危,高市政权右转印证中方警告

纵横之策
2026-02-20 11:35:45
美媒:美西方没得选,现在不陪中国一起卷,以后在国外早晚被卷死

美媒:美西方没得选,现在不陪中国一起卷,以后在国外早晚被卷死

朝子亥
2026-02-19 18:45:03
一个非常不好的消息:中国超2亿独生子女面临的非常严峻问题。

一个非常不好的消息:中国超2亿独生子女面临的非常严峻问题。

百态人间
2026-02-05 15:39:14
记者:1亿太多,多家俱乐部认为迪奥曼德成交价6000-7000万欧

记者:1亿太多,多家俱乐部认为迪奥曼德成交价6000-7000万欧

懂球帝
2026-02-19 23:52:07
统治百年却同化失败?俄远东多地加速汉化,为何非华夏文明不可!

统治百年却同化失败?俄远东多地加速汉化,为何非华夏文明不可!

残梦重生来
2026-02-19 07:57:05
到底是奶奶亲,还是姥姥亲?科学家给出明确排序,细想现实又扎心

到底是奶奶亲,还是姥姥亲?科学家给出明确排序,细想现实又扎心

窈窕妈妈
2026-01-22 20:32:23
谋财害命的中药注射液,早该被清理进历史的垃圾堆

谋财害命的中药注射液,早该被清理进历史的垃圾堆

老爸讲科学
2025-10-20 16:11:11
解放中场,他的搭档成曼联第一目标

解放中场,他的搭档成曼联第一目标

西哇体育
2026-02-20 14:20:58
张学良到了晚年才吐露心声:我这辈子从来不信迷信,然而在老虎厅除掉杨宇霆之后,我却不得不改变想法

张学良到了晚年才吐露心声:我这辈子从来不信迷信,然而在老虎厅除掉杨宇霆之后,我却不得不改变想法

清风鉴史
2025-12-26 17:05:13
赴美留学暴跌28.6%!美国不留中国也不要,这届留学生两头受气

赴美留学暴跌28.6%!美国不留中国也不要,这届留学生两头受气

毒sir财经
2026-02-19 16:57:09
这是央视有史以来最端庄大气美女,北大学霸,26岁就登上春晚舞台

这是央视有史以来最端庄大气美女,北大学霸,26岁就登上春晚舞台

乡野小珥
2026-02-20 13:58:28
简洁明了穿搭,穿出魅力四射感觉,青春动感活力无限

简洁明了穿搭,穿出魅力四射感觉,青春动感活力无限

独角showing
2026-02-20 13:08:30
高市早苗个人官网约1000篇“专栏文章”已无法访问,其记录了高市在政坛的成长轨迹

高市早苗个人官网约1000篇“专栏文章”已无法访问,其记录了高市在政坛的成长轨迹

大象新闻
2026-02-20 13:56:11
真是人走茶凉!看了三只羊传媒的现状,才明白什么叫兔死狗烹

真是人走茶凉!看了三只羊传媒的现状,才明白什么叫兔死狗烹

聚焦真实瞬间
2026-02-10 20:45:40
广东教育掀桌子!摇号分班全凭命,智力大锅饭谁吃得消?

广东教育掀桌子!摇号分班全凭命,智力大锅饭谁吃得消?

解说阿洎
2026-02-19 18:47:54
余嘉豪正式宣布缺席集训,世预赛之路能否再现助力?

余嘉豪正式宣布缺席集训,世预赛之路能否再现助力?

卿子书
2026-02-19 10:33:34
小猴被亲妈抛弃,只能和玩偶形影不离...如今,真正的家人终于出现了!

小猴被亲妈抛弃,只能和玩偶形影不离...如今,真正的家人终于出现了!

英国那些事儿
2026-02-19 23:20:47
2026-02-20 14:48:49
AI先锋官 incentive-icons
AI先锋官
AIGC大模型及应用精选与评测
433文章数 52关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

牛弹琴:特朗普开了个前所未有的会 合影美国5人站中心

头条要闻

牛弹琴:特朗普开了个前所未有的会 合影美国5人站中心

体育要闻

宁忠岩4年从第7到摘金,刷新奥运纪录

娱乐要闻

苏翊鸣夺金朱易示爱,两人默契引热议

财经要闻

太疯狂!“顾客不问价直接出手”

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

教育
旅游
本地
房产
手机

教育要闻

2026年高考十大热门专业前瞻分析(下):五大经典专业深度解读

旅游要闻

科技赋能,为古都新春增添“新玩法”

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

房产要闻

春节三亚楼市再放大招!千亿巨头,重磅推出超性价比海景现房

手机要闻

苹果自研基带翻车:iPhone Air现硬件故障 不能打电话变砖

无障碍浏览 进入关怀版