![]()
新智元报道
编辑:桃子 好困
【新智元导读】Anthropic深夜发布Claude「顾问策略」,让Opus 4.6退居幕后当军师,Sonnet/Haiku当苦力。实测性能翻倍,成本暴降85%,全网直呼:这就是我们要的「龙虾」完全体!
深夜,Anthropic官宣重磅更新:Claude「顾问策略」(Advisor Strategy)上线。
这一架构的核心逻辑是——
让智商最高的Opus 4.6退居幕后当「顾问」;
让性价比极高的Sonnet 4.6或Haiku 4.5冲在前面当「执行者」。
![]()
简单来说,Opus做「大脑」,Sonnet/Haiku做「手脚」。
在全新的工作流中,核心是由Sonnet/Haiku,全权负责跑通整个流程。
![]()
当遇到真正棘手的难题、无法做出合理决策时,才会通过API调用Opus「顾问」来指点迷津。
随后,Opus会迅速审阅上下文,给出一个锦囊妙计、修正方案,然后由执行者继续完成剩下的「苦差事」。
这一策略的提出,真正反转了传统的「大模型拆解任务、小模型搬砖」模式。
![]()
结果,实测数据极其震撼。
在SWE-bench编程测试中,「Sonnet 4.6+Opus 4.6」得分提升2.7个百分点,而成本暴降11.9%!
更离谱的是,「Haiku4.5+Opus 4.6」性能直接翻倍,成本($1.07)只有Sonnet($7)的一小部分。
用网友的话来说,「享受Opus的性能,却无需支付Opus的钱」。
![]()
![]()
![]()
还有人全网奔走相告,Claude「龙虾」超进化了,一个更好的OpenClaw版本诞生。
![]()
![]()
可以说,这不只是一次API更新,更是一场彻底的效率革命。
Claude有了「顾问」
最强Opus 4.6幕后指路
一直以来,开发者在构建AI Agent的过程中,往往面临一个两难选择:
用顶级模型虽聪明,但价格昂贵;
用轻量模型虽便宜,但处理复杂任务时容易「掉链子」。
传统模式的做法是,让性能最强的LLM坐镇中央当「编排者」,把大任务拆解成若干子任务,再分发给更小、更快的模型去执行。
![]()
这就好比一个项目经理(大模型)在开会,给底下的组员(小模型)分发不同的工单。
它的局限在于,无论任务简单还是复杂,顶级模型都必须首先介入拆解。每一条请求的开头,都要烧掉最贵的Token。
Anthropic这次玩了个「反直觉」的战术,彻底反转了「大管小」的逻辑。
![]()
「顾问策略」采用了一种更加灵活的向上追溯机制:
执行者: 由Sonnet 4.6或Haiku 4.5担任,负责端到端的任务执行、调用工具、读取结果并持续迭代;
顾问: 由顶级模型Opus 4.6担任,潜伏在幕后,并不直接与人对话,也不调用工具。
只有当「执行者」遇到无法独立决策的难题时,它才会主动向「顾问」请教。
Opus会读取共享的上下文,给出计划、纠正方案或停止信号,随后「执行者」再带着这些「应急妙策」继续工作。
![]()
这种策略,将前沿级的推理能力精准地用在了「刀刃」上。
在SWE-bench测试中,「Sonnet+Opus顾问」提升了2.7个百分点,还将单次Agent任务的成本压缩了11.9%。
![]()
在智能体基准测试中:
智能体搜索任务(BrowseComp),性能涨2.3%,成本6.13美元。
终端编码任务(Terminal-Bench 2.0),性能涨3.8%,成本0.88美元。
![]()
对于预算更敏感的场景,「Haiku 4.5+Opus 4.6顾问」的组合表现更是令人惊艳。
在BrowseComp测试中,其得分从19.7%飙升至41.2%,性能翻倍。
虽然这比Sonnet单独运行的得分低29%,但其成本却降低了85%,是处理高并发任务的极佳方案。
在Terminal-Bench 2.0中,性能暴涨13.3%,成本也降低了0.2美元。
![]()
对于那些既需要一定智能水平、又需要控制成本的大规模批量任务来说,Haiku绝对是个绝佳的选择。
官博中,Anthropic说的非常直白——
这能让AI Agent拥有接Opus级别的智能,同时让token开销保持在接近Sonnet的水平。
不得不说,简直太香了!
![]()
一行代码,即可调用
那么,究竟如何上手?
![]()
目前,Claude平台上已上线了「测试版」。
只需在API调用中改写「一行代码」,便能用上「顾问策略」,具体来说:
在Messages API请求中声明advisor_20260301,模型的交接就会在单次/v1/messages请求的内部静默完成——不需要额外去回传数据或管理上下文。
「执行者」模型会自己决定什么时候摇人。
当它发起调用时,会把整理好的上下文路由给「顾问」模型,拿到计划后返回,「执行者」接着干活,所有操作都在同一个请求里一气呵成。
# 顾问消耗的Token会在用量(usage)中单独列出。那么,token消耗的这笔账如何算?
「顾问」消耗的Token按Opus定价,执行者消耗的Token按Sonnet或Haiku定价。
关键在于,顾问每次出手只生成一份简短的计划,通常在400到700个Token左右。
而真正的大头输出,全部由执行者以更低的费率包揽。
整体算下来,成本远低于从头到尾只用Opus。
![]()
担心顾问被「薅」太多次?Anthropic也想到了。
开发者可以通过设置max_uses,限制单次请求中顾问的最大调用次数。
同时,顾问的Token消耗会在用量信息中单独列出,方便追踪每一层模型的开销。
而且,advisor工具跟你现有的工具栈完全兼容。
它就是Messages API请求里的一个普通条目,没有任何特殊架构要求。
![]()
你的Agent可以在同一个循环里,一边搜索网页、执行代码,一边向Opus请教。
该搬砖搬砖,该问策问策,互不干扰。
一些用上「顾问策略」的大客户全都被瞬间惊艳了,EVE机器学习工程师直言——
用上Haiku 4.5+Opus 4.6,成本降低了1/5,还用上了接近Opus级别的智能。
![]()
Agent不用一直转了
后台脚本守着就行
同在今天,Anthropic为Claude带来了名为——Monitor的重量级工具更新。
这一功能,直接让Claude创建并运行「后台脚本」。
![]()
过去,让Agent监控某个任务(比如等CI跑完、等PR审批),它必须不停循环询问,每问一次就烧一轮Token。
Monitor让Claude自己写一段后台监控代码。程序报错了,唤醒。代码合规检查通过了,唤醒。
从「主动轮询」变成「事件驱动」。
![]()
有了Monitor,Claude可以做到两件事。
持续盯着系统日志中的错误,有问题了才叫Agent过来处理。
自动追踪GitHub上的PR状态,脚本在后台轮询,Agent本身不消耗Token。
具体用的时候,需在提示词中明确要求,如Anthropic研究员给出的例子所示。
![]()
和Advisor Strategy的逻辑一脉相承,都是在Agent运行中找到「不需要烧钱的环节」,然后把它剥离出去。
一个省模型调用的钱,一个省空转循环的钱。
但顾问策略和Monitor不是孤立的两招。
再加上此前刚发布的Managed Agents,Agent的运维和基建全由Anthropic包办,0.08美元一小时。
这几步棋放在一起看,方向就明了了。
Anthropic不再只是一家卖模型API的公司。它在搭一整套Agent运行时平台,从模型调度到任务执行到云端托管,全栈通吃。
你不需要自己养Agent了
Advisor Strategy和Monitor优化的是Agent的「跑法」,Managed Agents解决的是更根本的问题,谁来管基建。
0.08美元一个session小时,沙箱隔离、断线自动恢复、会话可自主跑数小时,Anthropic全包了。
Managed Agents管运行,MCP Connectors管工具接入。
Anthropic的Connectors Directory覆盖Asana、Notion、Sentry等工具,标准OAuth一键接入。
另一边,4月4日封杀了OpenClaw通过Claude订阅额度调API的通道,用户要么换后端,要么按量付费,成本翻倍。
推自家生态,切竞品供给,一套组合拳。
HN上有人总结,「核心不是封杀谁,是让开发者习惯在Anthropic的平台上跑Agent。」
从卖模型到卖运行时
Advisor Strategy管调度,Monitor管效率,Managed Agents管基建,MCP Connectors管生态。四层叠起来,一个完整的Agent平台。
Anthropic不是在卖聊天机器人,是在卖「你只管说要做什么,剩下的我来」。
而且野心可能不止于软件。据Reuters本周报道,Anthropic正在探索自研AI芯片,目前仍处于早期阶段。
支撑这个野心的数字,年化营收突破300亿美元,去年底还是90亿。企业级AI收入对OpenAI的份额已经追到50:50。
这盘棋能不能赢,取决于开发者愿不愿意把Agent逻辑交给Anthropic的平台。
Sentry、Notion、Rakuten已经投了票。
彩蛋
Claude到底有多大?这是AI圈最想拆解的黑盒。
马斯克在对比自家Grok 4.2与Claude时,漫不经心地透露了一个数字——
Claude Sonnet参数量约为1T,Opus高达5T。
对此,有大佬猜测,Claude Mythos体量至少是10T,甚至更大级别。
![]()
![]()
参考资料:
https://x.com/claudeai/status/2042308622181339453?s=20
https://x.com/noahzweben/status/2042332268450963774?s=20
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.