网易首页 > 网易号 > 正文 申请入驻

Claude最新Sonnet:Opus级智能,性价比王炸,OpenClaw天选API

0
分享至

Jay 发自 凹非寺
量子位 | 公众号 QbitAI

春节才是真正的大模型战场,全世界参与的那种。

大年初二,Anthropic史上最强Sonnet——Claude Sonnet 4.6发布。

计算机操作是这次更新的主打卖点。

Anthropic表示,对填写复杂Excel、网页清单等任务,Sonnet 4.6已经接近人类水平

其他方面也是全方位升级:编码、长上下文推理、Agent规划、知识型工作、设计……Beta阶段还支持1M上下文

重点来了!定价依然跟Sonnet 4.5一样,免费用户也能用。

性价比简直高到离谱。

创业者Alex Finn体验后表示「难以置信」:

  • 在大多数Agent任务上,Sonnet 4.6的表现跟Opus系列差不多好,速度还更快,价格只要1/5。



还不只一个人这么说。

Anthropic表示,内测用户对Sonnet 4.6的喜爱程度,已经超过了超大杯Opus 4.5

史上最强Sonnet

计算机操作能力,可以说是这次Sonnet 4.6最亮眼的部分了,Anthropic也在这部分花了不少笔墨。

虽然跟最熟练的人类工作者比还有差距,但进步速度真的恐怖。

看下面这张图——

四个月一次的高频率更新下,性能曲线依然保持着不错的上升势头。



当然,计算机操作能力提升,也意味着如果模型被prompt injection,风险会更大。

Anthropic也想到了这一点,专门给用户们塞了颗定心丸:

Sonnet 4.6的安全等级相比前代Sonnet 4.5有显著改进,表现跟Opus 4.6差不多。



事实上,计算机操作只是冰山一角,Claude Sonnet 4.6在各类Benchmark上都有提升。

具体细节都在下面这张表,一个大杯模型,智能却直逼超大杯Opus系列

从Benchmark上还可以看到Claude这边出现了「倒反天罡」的情况。

金融分析和办公室任务这两项测试中,Sonnet 4.6用一骑绝尘的数值,拿下了SOTA,力压历代Opus。



用户的反馈更能说明问题。

在Claude Code的早期内测中,Anthropic发现,在59%的场景下,用户更倾向于选择Sonnet 4.6(而不是Opus 4.5)。

大家评价说,Sonnet 4.6明显更少出现过度设计和「偷懒」,指令遵循方面表现更好。

同时,虚假成功声明更少,幻觉更少,多步骤任务的执行也更加稳定。

对了,这次Sonnet 4.6还提供100万token的上下文,能装下几十篇研究论文。最重要的是,在这么大规模的上下文中,Sonnet 4.6依然保持了相当领先的推理水平。

这一点在Vending-Bench Arena上特别明显。

这是个测试模型在长时间跨度内模拟运营一家企业能力的Benchmark,引入了竞争机制,不同模型需要相互对抗,争取更高利润。

在这个测试中,Sonnet 4.6采用了一种新策略:前10个模拟月份大幅投入产能建设,支出明显高于竞争对手,但在后期迅速开始想办法盈利。

这种转向时机的把握,帮助它在最终成绩上明显领先。



除此之外,用户还反馈称前端代码生成能力有提升。

Sonnet 4.6生成的视觉输出更加精致,布局、动画和设计感都比之前的模型好,达到可用于生产环境的质量所需的迭代轮次也减少了。

OpenClaw又发力了

实在是奇怪,一款大杯模型,内测中居然比超大杯旗舰款还招人喜欢。

但目前看来,也有许多网友并不买账,甚至说Anthropic是没活硬整。



主要是不太理解:

  • 既然Opus仍然是最强,为啥要用Sonnet 4.6?



对此,有人出来解释称:这其实是定价策略和目标用户不一样

对于本就不差钱的用户来说,这事儿影响不大。毕竟Max订阅套餐里本来就有大量补贴后的Opus 4.6额度,随便用。

但这是C端的思考方式。

在B端,企业客户可没这么大方的token补贴,调用量却高出好几倍。

与此同时,很多场景根本用不着那么强的智能。如果只是让AI帮你居中一个div这种简单活儿,Opus未免有些太奢侈。

从这个角度看,Anthropic的战略路线其实已经很清晰:

  • Opus用来争夺王座,维持C端品牌认知;
  • Sonnet用来占领市场,用更低的成本将智能下放。



不过,这个「市场」其实也不光是企业客户。

计算机操作能力大幅提升,Opus级智能,Sonnet级定价……

这不就是为OpenClaw量身定做的API嘛!

果然,Anthropic这款高性价比模型的消息一出来,「龙虾大军」立马就涌进来了:

  • 立即升级您的OpenClaw至Sonnet 4.6!

网友直接放话:这是有史以来最棒的OpenClaw模型,大家赶紧给自己的龙虾安排上。



实在是有些drama,Anthropic真得好好谢谢OpenClaw作者。

人家项目名字都被整没了,自己也加入了OpenAI,结果……OpenClaw至今还在帮Anthropic带货。

参考链接:
[1]https://www.anthropic.com/news/claude-sonnet-4-6
[2]https://x.com/AlexFinn/status/2023828886287708303

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
于骞出席2026智能电动汽车高层论坛:物理AI,智驾的下一个战场

于骞出席2026智能电动汽车高层论坛:物理AI,智驾的下一个战场

AutoBusiness
2026-04-13 11:23:41
太没底线!三球16记三分“抢戏”,克尼佩尔险胜加冕历史首人!

太没底线!三球16记三分“抢戏”,克尼佩尔险胜加冕历史首人!

田先生篮球
2026-04-13 11:23:36
AI语聊软件暗藏大尺度色情内容 境外涉黄AI软件绕过监管流入国内

AI语聊软件暗藏大尺度色情内容 境外涉黄AI软件绕过监管流入国内

财联社
2026-04-12 20:28:24
特朗普威胁若中国向伊朗供武就加征关税,外交部:关税战没有赢家

特朗普威胁若中国向伊朗供武就加征关税,外交部:关税战没有赢家

澎湃新闻
2026-04-13 15:32:26
王石和秦枫,必有一个要进去

王石和秦枫,必有一个要进去

葱哥说
2026-04-13 10:28:28
广东一网约车司机车内售卖高至29元现磨咖啡,滴滴:不建议,挣的钱还没有扣的多

广东一网约车司机车内售卖高至29元现磨咖啡,滴滴:不建议,挣的钱还没有扣的多

界面新闻
2026-04-13 11:52:09
中共中央批准,开除乌兰党籍

中共中央批准,开除乌兰党籍

新京报
2026-04-13 11:34:26
bZ5对比海豹06GT 谁更懂“全家安心用”?

bZ5对比海豹06GT 谁更懂“全家安心用”?

网通社
2025-09-19 18:58:38
小米汽车市场危机,开始公开化

小米汽车市场危机,开始公开化

浙江车网
2026-04-13 09:15:19
人均600万到欠400亿,毁掉"天下第一村"的不是别人,是他们自己

人均600万到欠400亿,毁掉"天下第一村"的不是别人,是他们自己

闻香阁
2026-04-11 08:40:49
全员“梓涵”消失不见,老师崩溃!新一批烂大街名字再次来袭

全员“梓涵”消失不见,老师崩溃!新一批烂大街名字再次来袭

谭老师地理大课堂
2026-04-12 20:21:47
随着曼城3-0,热刺0-1,维拉1-1,纽卡1-2,英超最新积分榜出炉

随着曼城3-0,热刺0-1,维拉1-1,纽卡1-2,英超最新积分榜出炉

侧身凌空斩
2026-04-13 03:08:52
难以相信!她已经61岁了,看起来竟然像三四十岁的样子!

难以相信!她已经61岁了,看起来竟然像三四十岁的样子!

手工制作阿歼
2026-04-13 03:15:24
高铁站工作人员回应游客站台吸烟行为:如果有权限,我一定第一个冲上去制止

高铁站工作人员回应游客站台吸烟行为:如果有权限,我一定第一个冲上去制止

大象新闻
2026-04-13 11:49:02
不到一周张雪机车再战WSBK!张雪:可能会输 提前泼一盆冷水

不到一周张雪机车再战WSBK!张雪:可能会输 提前泼一盆冷水

快科技
2026-04-13 11:12:10
6天“和平之旅”,郑丽文返台,临别留下一句重要表态,分量不轻

6天“和平之旅”,郑丽文返台,临别留下一句重要表态,分量不轻

清沐执笔
2026-04-12 19:11:32
35年品质坚守 一汽-大众成就国民首选品牌

35年品质坚守 一汽-大众成就国民首选品牌

中车网评
2026-03-23 15:10:50
“截屏就开除”,追觅创始人俞浩内部群放狠话

“截屏就开除”,追觅创始人俞浩内部群放狠话

山西经济日报
2026-04-13 10:33:25
时速350公里!越南首条高铁正式动工!

时速350公里!越南首条高铁正式动工!

缅甸中文网
2026-04-13 13:26:18
金价大跌!

金价大跌!

吉林日报
2026-04-13 10:00:08
2026-04-13 15:48:49
量子位 incentive-icons
量子位
追踪人工智能动态
12465文章数 176449关注度
往期回顾 全部

科技要闻

传荣耀与字节跳动接洽“豆包手机”合作

头条要闻

女子名下多出一套上海房产很苦恼:丈夫去世 房子没了

头条要闻

女子名下多出一套上海房产很苦恼:丈夫去世 房子没了

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

贾玲减重后现身冯巩生日宴 身材未反弹

财经要闻

起底AI"造黄"灰产:19.9元"一键脱衣"

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

本地
房产
家居
公开课
军事航空

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

房产要闻

6000亿投资盛宴,全球巨头齐聚,海南又要干件大事!

家居要闻

复古风格 自然简约

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:今晚10点封锁伊朗 对北约非常失望

无障碍浏览 进入关怀版