Anthropic 急了,发布了 Claude Opus 4.5,同时终于从原来死贵的 75 美元变成了 25 美元,当然还是比 Gemini 3 Pro 贵不少。
介绍一下详细更新内容:
## 性能表现:编程任务新世界第一
SWE-bench Verified Opus 4.5 拿了第一。
Anthropic 内部还做了个有意思的测试:他们让 Opus 4.5 做性能工程师的入职考试(2小时限时),结果模型的分数超过了所有人类候选人。
不只是编程,Opus 4.5 在数学、视觉、推理等各个维度都有提升。
## 顶级模型价格对比(per million tokens):
- Claude Opus 4.5: $5 / $25
- GPT-5.1: $1.25 / $10
- GPT-5-pro: $15 / $120
- Gemini 3 Pro: $2-4 / $12-18
## 效率大幅提升:更聪明意味着更省钱
Opus 4.5 引入了一个新参数叫 effort(努力程度),你可以根据任务选择不同的思考深度。
在 medium effort 模式下,Opus 4.5 达到了 Sonnet 4.5 的最佳分数,但只用了 24% 的输出 tokens。换句话说,少用了 76% 的 tokens。
即使在 highest effort 模式下,Opus 4.5 的表现超过 Sonnet 4.5 有 4.3 个百分点,同时还少用了 48% 的 tokens。
这说明模型变聪明了:更少的回溯、更少的冗余探索、更精准的推理。对于长期运行的代理任务,这个效率提升会直接转化为成本节省。
有权使用 Opus 4.5 的 Claude 和 Claude Code 用户,已移除针对 Opus 的特定限制。
Max 和 Team Premium 用户,提高了总体使用上限,这意味着将拥有与之前使用 Sonnet 时大致相同数量的 Opus Token。
效率提升这点是这次比较关键的,用的好的话,它可能会比 sonnet 4.5 还要便宜。
我的观察是它有点变得像GPT5.1了。 就是输出的结果和思考的结果非常的节省。然后输出的结果就我能看懂,但是它不像是给人看的,写出来。
![]()
![]()
![]()
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.