网易首页 > 网易号 > 正文 申请入驻

一行代码,Claude成本直降85%!最强Opus做大脑,Sonnet疯狂搬砖

0
分享至


新智元报道

编辑:桃子 好困

【新智元导读】Anthropic深夜发布Claude「顾问策略」,让Opus 4.6退居幕后当军师,Sonnet/Haiku当苦力。实测性能翻倍,成本暴降85%,全网直呼:这就是我们要的「龙虾」完全体!

深夜,Anthropic官宣重磅更新:Claude「顾问策略」(Advisor Strategy)上线

这一架构的核心逻辑是——

让智商最高的Opus 4.6退居幕后当「顾问」;

让性价比极高的Sonnet 4.6或Haiku 4.5冲在前面当「执行者」。


简单来说,Opus做「大脑」,Sonnet/Haiku做「手脚」

在全新的工作流中,核心是由Sonnet/Haiku,全权负责跑通整个流程。


当遇到真正棘手的难题、无法做出合理决策时,才会通过API调用Opus「顾问」来指点迷津。

随后,Opus会迅速审阅上下文,给出一个锦囊妙计、修正方案,然后由执行者继续完成剩下的「苦差事」。

这一策略的提出,真正反转了传统的「大模型拆解任务、小模型搬砖」模式。


结果,实测数据极其震撼。

在SWE-bench编程测试中,「Sonnet 4.6+Opus 4.6」得分提升2.7个百分点,而成本暴降11.9%

更离谱的是,「Haiku4.5+Opus 4.6」性能直接翻倍,成本($1.07)只有Sonnet($7)的一小部分。

用网友的话来说,「享受Opus的性能,却无需支付Opus的钱」




还有人全网奔走相告,Claude「龙虾」超进化了,一个更好的OpenClaw版本诞生。



可以说,这不只是一次API更新,更是一场彻底的效率革命。

Claude有了「顾问」

最强Opus 4.6幕后指路

一直以来,开发者在构建AI Agent的过程中,往往面临一个两难选择:

  • 用顶级模型虽聪明,但价格昂贵;

  • 用轻量模型虽便宜,但处理复杂任务时容易「掉链子」。

传统模式的做法是,让性能最强的LLM坐镇中央当「编排者」,把大任务拆解成若干子任务,再分发给更小、更快的模型去执行。


这就好比一个项目经理(大模型)在开会,给底下的组员(小模型)分发不同的工单。

它的局限在于,无论任务简单还是复杂,顶级模型都必须首先介入拆解。每一条请求的开头,都要烧掉最贵的Token。

Anthropic这次玩了个「反直觉」的战术,彻底反转了「大管小」的逻辑。


「顾问策略」采用了一种更加灵活的向上追溯机制:

  • 执行者: 由Sonnet 4.6或Haiku 4.5担任,负责端到端的任务执行、调用工具、读取结果并持续迭代;

  • 顾问: 由顶级模型Opus 4.6担任,潜伏在幕后,并不直接与人对话,也不调用工具。

只有当「执行者」遇到无法独立决策的难题时,它才会主动向「顾问」请教。

Opus会读取共享的上下文,给出计划、纠正方案或停止信号,随后「执行者」再带着这些「应急妙策」继续工作。


这种策略,将前沿级的推理能力精准地用在了「刀刃」上。

在SWE-bench测试中,「Sonnet+Opus顾问」提升了2.7个百分点,还将单次Agent任务的成本压缩了11.9%。


在智能体基准测试中:

  • 智能体搜索任务(BrowseComp),性能涨2.3%,成本6.13美元。

  • 终端编码任务(Terminal-Bench 2.0),性能涨3.8%,成本0.88美元。


对于预算更敏感的场景,「Haiku 4.5+Opus 4.6顾问」的组合表现更是令人惊艳。

在BrowseComp测试中,其得分从19.7%飙升至41.2%,性能翻倍。

虽然这比Sonnet单独运行的得分低29%,但其成本却降低了85%,是处理高并发任务的极佳方案。

在Terminal-Bench 2.0中,性能暴涨13.3%,成本也降低了0.2美元。


对于那些既需要一定智能水平、又需要控制成本的大规模批量任务来说,Haiku绝对是个绝佳的选择。

官博中,Anthropic说的非常直白——

这能让AI Agent拥有接Opus级别的智能,同时让token开销保持在接近Sonnet的水平。

不得不说,简直太香了!


一行代码,即可调用

那么,究竟如何上手?


目前,Claude平台上已上线了「测试版」。

只需在API调用中改写「一行代码」,便能用上「顾问策略」,具体来说:

在Messages API请求中声明advisor_20260301,模型的交接就会在单次/v1/messages请求的内部静默完成——不需要额外去回传数据或管理上下文。

「执行者」模型会自己决定什么时候摇人。

当它发起调用时,会把整理好的上下文路由给「顾问」模型,拿到计划后返回,「执行者」接着干活,所有操作都在同一个请求里一气呵成。

# 顾问消耗的Token会在用量(usage)中单独列出。

那么,token消耗的这笔账如何算?

「顾问」消耗的Token按Opus定价,执行者消耗的Token按Sonnet或Haiku定价。

关键在于,顾问每次出手只生成一份简短的计划,通常在400到700个Token左右。

而真正的大头输出,全部由执行者以更低的费率包揽。

整体算下来,成本远低于从头到尾只用Opus。


担心顾问被「薅」太多次?Anthropic也想到了。

开发者可以通过设置max_uses,限制单次请求中顾问的最大调用次数。

同时,顾问的Token消耗会在用量信息中单独列出,方便追踪每一层模型的开销。

而且,advisor工具跟你现有的工具栈完全兼容。

它就是Messages API请求里的一个普通条目,没有任何特殊架构要求。


你的Agent可以在同一个循环里,一边搜索网页、执行代码,一边向Opus请教。

该搬砖搬砖,该问策问策,互不干扰。

一些用上「顾问策略」的大客户全都被瞬间惊艳了,EVE机器学习工程师直言——

用上Haiku 4.5+Opus 4.6,成本降低了1/5,还用上了接近Opus级别的智能。


Agent不用一直转了

后台脚本守着就行

同在今天,Anthropic为Claude带来了名为——Monitor的重量级工具更新。

这一功能,直接让Claude创建并运行「后台脚本」。


过去,让Agent监控某个任务(比如等CI跑完、等PR审批),它必须不停循环询问,每问一次就烧一轮Token。

Monitor让Claude自己写一段后台监控代码。程序报错了,唤醒。代码合规检查通过了,唤醒。

从「主动轮询」变成「事件驱动」。


有了Monitor,Claude可以做到两件事。

  • 持续盯着系统日志中的错误,有问题了才叫Agent过来处理。

  • 自动追踪GitHub上的PR状态,脚本在后台轮询,Agent本身不消耗Token。

具体用的时候,需在提示词中明确要求,如Anthropic研究员给出的例子所示。


和Advisor Strategy的逻辑一脉相承,都是在Agent运行中找到「不需要烧钱的环节」,然后把它剥离出去。

一个省模型调用的钱,一个省空转循环的钱。

但顾问策略和Monitor不是孤立的两招。

再加上此前刚发布的Managed Agents,Agent的运维和基建全由Anthropic包办,0.08美元一小时。

这几步棋放在一起看,方向就明了了。

Anthropic不再只是一家卖模型API的公司。它在搭一整套Agent运行时平台,从模型调度到任务执行到云端托管,全栈通吃。

你不需要自己养Agent了

Advisor Strategy和Monitor优化的是Agent的「跑法」,Managed Agents解决的是更根本的问题,谁来管基建。

0.08美元一个session小时,沙箱隔离、断线自动恢复、会话可自主跑数小时,Anthropic全包了。

Managed Agents管运行,MCP Connectors管工具接入。

Anthropic的Connectors Directory覆盖Asana、Notion、Sentry等工具,标准OAuth一键接入。

另一边,4月4日封杀了OpenClaw通过Claude订阅额度调API的通道,用户要么换后端,要么按量付费,成本翻倍。

推自家生态,切竞品供给,一套组合拳。

HN上有人总结,「核心不是封杀谁,是让开发者习惯在Anthropic的平台上跑Agent。」

从卖模型到卖运行时

Advisor Strategy管调度,Monitor管效率,Managed Agents管基建,MCP Connectors管生态。四层叠起来,一个完整的Agent平台。

Anthropic不是在卖聊天机器人,是在卖「你只管说要做什么,剩下的我来」。

而且野心可能不止于软件。据Reuters本周报道,Anthropic正在探索自研AI芯片,目前仍处于早期阶段。

支撑这个野心的数字,年化营收突破300亿美元,去年底还是90亿。企业级AI收入对OpenAI的份额已经追到50:50。

这盘棋能不能赢,取决于开发者愿不愿意把Agent逻辑交给Anthropic的平台。

Sentry、Notion、Rakuten已经投了票。



彩蛋

Claude到底有多大?这是AI圈最想拆解的黑盒。

马斯克在对比自家Grok 4.2与Claude时,漫不经心地透露了一个数字——

Claude Sonnet参数量约为1T,Opus高达5T。

对此,有大佬猜测,Claude Mythos体量至少是10T,甚至更大级别。



参考资料:

https://x.com/claudeai/status/2042308622181339453?s=20

https://x.com/noahzweben/status/2042332268450963774?s=20

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
安徽六岁女童嫌疑犯的社交账号,让人越看心里越发毛,家有两娃

安徽六岁女童嫌疑犯的社交账号,让人越看心里越发毛,家有两娃

魔都姐姐杂谈
2026-04-08 05:08:34
市场情绪提振!美股全线走强,特朗普:对美伊达成和平协议“非常乐观”,“如果他们不达成协议,后果将极其痛苦”

市场情绪提振!美股全线走强,特朗普:对美伊达成和平协议“非常乐观”,“如果他们不达成协议,后果将极其痛苦”

每日经济新闻
2026-04-10 11:16:26
碎三观!杭州一院长关灯猥亵女经理被举报,妻子称是“国外习惯”

碎三观!杭州一院长关灯猥亵女经理被举报,妻子称是“国外习惯”

火山詩话
2026-04-10 11:45:42
美国AI三巨头联手限制蒸馏:最便宜的那条路,被掐断了

美国AI三巨头联手限制蒸馏:最便宜的那条路,被掐断了

卢松松
2026-04-08 14:07:41
向来福气深厚,下半年更是好运爆棚的4个生肖,升官发财平安!

向来福气深厚,下半年更是好运爆棚的4个生肖,升官发财平安!

毅谈生肖
2026-04-10 12:33:39
陈丽华追悼会曝光,原来无儿无女的迟重瑞,早已被安排好“退路”

陈丽华追悼会曝光,原来无儿无女的迟重瑞,早已被安排好“退路”

青梅侃史啊
2026-04-09 19:57:58
以色列警告:伊朗新领导层更极端,更敢赌——报复不再留手

以色列警告:伊朗新领导层更极端,更敢赌——报复不再留手

桂系007
2026-04-10 14:07:39
68岁女子不顾家人反对,执意寻找50年前初恋,发现对方为她终身未娶,初恋:我等你等得头发都白了!

68岁女子不顾家人反对,执意寻找50年前初恋,发现对方为她终身未娶,初恋:我等你等得头发都白了!

励职派
2026-04-03 12:45:44
没想到,陈丽华去世后,竟给无儿无女的迟重瑞留下了一个“礼物”

没想到,陈丽华去世后,竟给无儿无女的迟重瑞留下了一个“礼物”

小娱乐悠悠
2026-04-10 09:32:47
戴森憋了30年憋出99美元小风扇,风速55mph却不敢吹脸

戴森憋了30年憋出99美元小风扇,风速55mph却不敢吹脸

全栈遛狗员
2026-04-09 18:04:56
复旦大学研究:我国财政供养人员6846万,其中退休人员占四成!

复旦大学研究:我国财政供养人员6846万,其中退休人员占四成!

黯泉
2026-04-09 17:27:59
全球同时收到消息,北京迎来贵宾,见面握紧中方手,美国时代结束

全球同时收到消息,北京迎来贵宾,见面握紧中方手,美国时代结束

傲傲讲历史
2026-04-10 02:32:06
“觞觥觚斛”这四个字怎么读?能读出来说明文化程度相当不低!

“觞觥觚斛”这四个字怎么读?能读出来说明文化程度相当不低!

未央看点
2026-04-10 00:08:51
美股深V反弹,半导体股爆发,闪迪涨超9%,中概股走低,现货黄金失守4760美元

美股深V反弹,半导体股爆发,闪迪涨超9%,中概股走低,现货黄金失守4760美元

21世纪经济报道
2026-04-10 07:09:55
初中三年,我最后悔的事:让他一个人关在房间里写作业

初中三年,我最后悔的事:让他一个人关在房间里写作业

诺妈家有男宝娃
2026-04-10 12:08:53
黑龙江这件事,窒息感扑面而来!

黑龙江这件事,窒息感扑面而来!

胖胖说他不胖
2026-04-10 09:55:12
没想到!第一个为全红婵站出来的竟然是66岁的韩乔生,太解气了!

没想到!第一个为全红婵站出来的竟然是66岁的韩乔生,太解气了!

喜欢历史的阿繁
2026-04-10 07:30:52
“解冻是真实的”!中方证实:5年多来首次访华

“解冻是真实的”!中方证实:5年多来首次访华

第一财经资讯
2026-04-09 14:49:20
雷迪克:詹姆斯展现了强大的领导力,为整支球队奠定了基调

雷迪克:詹姆斯展现了强大的领导力,为整支球队奠定了基调

懂球帝
2026-04-10 13:23:06
都是穷,河南的穷,四川的穷,有什么差别

都是穷,河南的穷,四川的穷,有什么差别

高广银
2026-04-10 06:09:37
2026-04-10 15:04:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14939文章数 66763关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

夏克立婚内出轨 曾参加《爸爸去哪儿》

财经要闻

爱尔眼科一院长被指猥亵 总部:已被停职

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

健康
游戏
手机
亲子
旅游

干细胞抗衰4大误区,90%的人都中招

KK官方对战平台CS1.6传奇联赛瑞士轮收官:八强席位即将揭晓

手机要闻

苹果iPhone Ultra折叠手机渲染视频曝光:5800mAh电池

亲子要闻

手外纪事|第57期 束带宝宝,父母没有放弃治疗,换来孩子一个未来

旅游要闻

亚洲游客抛弃中东,扎堆邮轮与短途游

无障碍浏览 进入关怀版