Chance Townsend盯着屏幕上的官方公告,手指在键盘上停顿了几秒。他追踪Anthropic的Sonnet系列更新已经好几个月了。周二,这家公司终于不再沉默,正式发布了Claude Sonnet 5,把长达数月的行业猜测画上了句号。
Anthropic在官方公告中对这款中端AI模型的定位相当明确——“迄今为止最具自主代理能力的Sonnet模型”。按照公司的描述,Sonnet 5能够自主规划、调用浏览器和终端等工具,并以独立模式运行,而这些能力此前只属于那些更大、更昂贵的系统。
![]()
在性能层面,Anthropic给出的判断很直接:相比前代产品Sonnet 4.6,Sonnet 5在推理、编码和知识工作等基准测试上“有实质性的提升”。更值得注意的是,它的表现已经逼近公司旗舰产品Opus 4.8,但运行成本却大幅降低。在一个对代币价格越来越敏感的行业里,这个定价策略显得格外扎眼。Sonnet 5的推广期定价为每百万输入代币2美元、每百万输出代币10美元,有效期到8月31日。推广期结束后,标准价格将调整为输入代币每百万3美元、输出代币每百万15美元。
安全方面,Anthropic报告称Sonnet 5在幻觉率、谄媚倾向以及其他不良行为指标上,都比前代模型有所改善,同时对抗提示注入攻击的能力也得到了增强。不过公司特别指出,该模型的网络安全能力仍“远低于”其Opus级和Mythos级系统,并且Sonnet 5在发布时已默认启用了网络安全防护措施作为预防手段。
但Chance注意到一个关键缺失:Anthropic的公告里没有提供幻觉率改善的具体数字。公司只给出了相比Sonnet 4.6“比率更低”的笼统描述,而没有发布基准测试数据。另一项被略过的话题是模型的能源消耗或环境足迹——随着AI模型变得越来越强大、计算强度越来越高,这已成为行业面临的现实问题。
从发布渠道来看,Sonnet 5目前已覆盖所有Claude计划层级,包括免费版、专业版、Max版、团队版和企业版。开发者也可以通过Claude Code和Claude平台的API访问,模型名称为claude-sonnet-5。这次正式上线印证了我们2月份的报道方向——当时科技媒体圈流传的消息是,Anthropic正在准备一次Sonnet更新,目标是让其中端模型以极具竞争力的优惠价格,对标Opus层级的性能。周二的发布内容与这一预判吻合。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.