★ 设为星标 | 只讲人话,带你玩转AIGC。
太卷了,真的太卷了。
Google 的 Gemini 3 Pro 才发布不到一周吧?
“最强模型”的屁股还没坐热,今早一睁眼,Anthropic 反手就是一个王炸:Claude Opus 4.5 来了。
这就是神仙打架,凡人看戏。
![]()
图:美国 AI 竞争循环
本来Gemini 3 Pro 的编码能力就不如 Claude,这回更是被甩了一条街。
![]()
图:Opus 4.5 性能指标
废话不说,看看它到底强在哪。
1. 代码能力封神:这回是真“大佬”
这次最吓人的还是写代码。
在权威的软件工程测试 SWE-Bench 里,它拿了 80.9%,直接甩飞友商。
![]()
图:软件工程能力对比
更离谱的是,Anthropic 透露:在内部高难度招聘测试里,它的得分超过了所有人类候选人。
不过这里有个细节。
这个“超越全人类”的成绩是开了个“外挂”跑出来的——同时试好几种解法挑最好的。
如果关掉外挂,它的成绩是追平了最强人类。
但哪怕是“追平”,也够恐怖了,程序员这回真的。。。得想想新的职业了?
2. 价格膝盖斩:顶级大脑“白菜价”
通常来说,性能越强越贵,但这次 Claude 居然反向操作。
Opus 4.5 的价格,直接比上一代砍掉了三分之二。
![]()
图:Claude 模型价格对比
立刻能用的神器
除了这些,他们还提供了一些工具,我们可以直接用起来:
- Claude for Chrome: 浏览器装个大脑,跨标签页自动整理信息,搬砖神器。
- Claude for Excel: 别背公式了,直接跟它说人话,表格自动搞定。
Claude 写代码最强其实早就不算新闻了,但这周的剧情真的太精彩。
前两天 Gemini 3 Pro 刚发布时,那种“手搓代码”的演示已经让无数人直呼“天花板”了。
结果呢?Anthropic 连一周的安全期都没给对手留,反手就用 Opus 4.5 再次刷新了认知。
巨头们卷得越凶,留给我们的工具就越强。
评论区聊聊,在这个“代码大爆炸”的时代,你最看好谁?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.