网易首页 > 网易号 > 正文 申请入驻

仅需一行代码AI智商飙升成本反降!Claude推出军师模式:最强模型opus只做幕后大脑

0
分享至


来源:AI寒武纪


Anthropic又出招了,在Claude平台上实装了一套军师策略,主要目标降低成本和提高次级模型智商。最近很多网友反应claude 降智了,A厂现在的顶尖模型的token使用很明显就是偏向to B和内部迭代,越来越对C端不友好了,不知道A厂内部是不是很早就在偷用这个军师策略

简单来说,就是让最强大的Opus模型在后台当军师,让轻量级的Sonnet或者Haiku模型去当执行者。通过这种搭配,开发者可以用极低的成本,让自己的智能体瞬间获得接近Opus级别的顶级智商。


过去很多开发者为了平衡AI的智力和使用成本,自己摸索出了这种大小模型打配合的套路。今天,Anthropic官方直接把这个经验变成了Claude平台上的一个现成工具,只需要在API调用里改一行代码就能实现。

这个策略的运作机制非常巧妙。

在军师策略下,Sonnet或Haiku会作为执行者负责包揽全场。它们从头到尾运行任务,调用各种工具,读取结果,并不断尝试解决问题。但是,当执行者遇到难度极高的关键决策,觉得自己搞不定时,它就会呼叫Opus这位军师来寻求指导。

接到呼叫后,Opus会读取双方共享的上下文信息,然后给出一个明确的计划,一个纠错建议,或者直接给出一个停止信号,随后执行者拿到建议继续干活。在这个过程中,军师绝对不会亲自去调用任何工具,也不会直接生成给用户看的最终内容,它的职责仅仅是给执行者提供高层指导。

这种玩法直接反转了业界目前最常用的子智能体模式。以前大家习惯用一个超大模型做统筹节点,把任务拆解后分发给底下的工人小模型去干。而在军师策略里,一个小巧且极其省钱的模型承担了主导和向上汇报的工作,完全不需要复杂的任务拆解逻辑和庞大的工人池。最顶尖的推理算力好钢全用在了刀刃上,只有在执行者真正卡壳时才介入,剩下的绝大部分运行时间都维持在极低的成本线上。

实测数据证明了这套方案的强大。

在SWE benchmark Multilingual这套测试集中,带上Opus军师的Sonnet执行者,最终得分比单打独斗的Sonnet高出了2.7个百分点,而每个任务的平均成本居然还降低了11.9%。


在BrowseComp和Terminal benchmark 2.0这两项基准测试中,有Opus当军师的Sonnet不仅得分全面提升,花费同样比单独使用Sonnet时还要少。


如果把执行者换成尺寸最小的Haiku模型,效果更加立竿见影。在BrowseComp测试中,带上军师的Haiku拿到了41.2%的高分,这比它自己单干时19.7%的成绩翻了一倍还要多。虽然这个组合的最终得分比单用Sonnet落后29%,但它的单次任务成本足足下降了85%。引入军师确实会让Haiku增加一点开销,但整体算下来依然只是单跑Sonnet的一小部分零头。对于那些既需要一定智商又面临海量高并发需求的应用场景来说,这是一个极具杀伤力的性价比选项。


现在,这个军师工具已经在Claude平台上开启Beta测试。

开发者只要在Messages API请求中声明advisor 20260301,模型的交接工作就会在同一个API请求内全部自动完成。不需要任何额外的网络往返通信,也不用开发者手动去管理复杂的上下文。

执行者模型会自己判断什么时候该请军师出山。一旦触发,系统会在后台自动把整理好的上下文发给军师,获取计划后执行者无缝衔接继续推进,整个过程行云流水。

核心代码的配置非常简单:


response = client.messages.create(
model=claude-sonnet-4-6,
tools=[
{
type: advisor_20260301,
name: advisor,
model: claude-opus-4-6,
max_uses: 3,
},
],
messages=[...]
)

计费方式也算得非常清楚。军师消耗的Token按军师的超大杯费率算,执行者消耗的Token按轻量级的费率算。因为军师通常只会吐出一份包含400到700个Token的简短指导计划,而耗费大量Token的最终长文本全交给价格低廉的执行者搞定,所以总体成本被死死压在了全量跑大模型之下。

不仅如此,官方还内置了成本控制功能。你可以通过设置max_uses参数来限制每次请求中呼叫军师的次数上限。系统也会在使用情况明细里把军师消耗的Token单独列出来,方便你追踪每一块钱的去向。

这个新工具和你现有的技术栈完全兼容。军师工具本质上只是你API请求列表里的一个新增条目而已。你的智能体完全可以一边在网上搜索资料,一边敲代码测试,遇到死胡同时顺手向Opus请教一下,所有动作都在同一个循环里完美闭环。

想要立即上手体验体验,只需按照以下三个步骤操作即可:

首先在请求头中加上Beta版特性声明:anthropic-beta: advisor-tool-2026-03-01

接着在你的Messages API请求里添加advisor_20260301

最后根据你具体的业务场景调整一下系统提示词

Anthropic官方强烈建议开发者现在就用自己的评估数据集跑一下对比测试,分别看看单跑Sonnet,采用军师策略组合,以及单跑Opus的具体效果差异。

source :

https://claude.com/blog/the-advisor-strategy

阅读最新前沿科技趋势报告,请访问21世纪关键技术研究院的“未来知识库”


未来知识库是 “21世纪关键技术研究院”建 立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告

(加入未来知识库,全部资料免费阅读和下载)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一场97-116的惨败让快船绝望!拿MVP换数据刷子,2换1交易完败了

一场97-116的惨败让快船绝望!拿MVP换数据刷子,2换1交易完败了

毒舌NBA
2026-04-11 12:48:15
从日本翻身看:这次谁能扛住高油价?

从日本翻身看:这次谁能扛住高油价?

虎嗅APP
2026-04-11 04:12:09
湖人赢球&火箭定格西部第五,最后一轮湖人仍有望升至第三

湖人赢球&火箭定格西部第五,最后一轮湖人仍有望升至第三

懂球帝
2026-04-11 13:24:21
中年男人最大的悲哀是什么?网友:我,中年女人,也对啥都没兴趣

中年男人最大的悲哀是什么?网友:我,中年女人,也对啥都没兴趣

带你感受人间冷暖
2026-04-10 01:21:44
枭龙战机进入伊朗领空,巴基斯坦动了真格,穆杰塔巴的口风也变了

枭龙战机进入伊朗领空,巴基斯坦动了真格,穆杰塔巴的口风也变了

阿斚田侃故事
2026-04-11 04:33:39
郑丽文想要的,大陆给得很爽快,随行人员有惊喜,蓝营一姐发话了

郑丽文想要的,大陆给得很爽快,随行人员有惊喜,蓝营一姐发话了

谛听骨语本尊
2026-04-10 16:28:28
报应来了?欧美工厂大面积瘫痪,现在来求中国复工?晚了!

报应来了?欧美工厂大面积瘫痪,现在来求中国复工?晚了!

月光作笺a
2026-04-10 21:14:58
广东热销莫氏鸡煲秘方大曝光!老中医转行透露7种神秘食材

广东热销莫氏鸡煲秘方大曝光!老中医转行透露7种神秘食材

马蹄烫嘴说美食
2026-04-11 03:47:13
韩媒:一旦开战,将对北京发起致命打击,大连、青岛都在列!

韩媒:一旦开战,将对北京发起致命打击,大连、青岛都在列!

青烟小先生
2026-04-11 09:46:04
别查了,受不了!巴拿马外长终于急了:请中国尊重我!

别查了,受不了!巴拿马外长终于急了:请中国尊重我!

近史博览
2026-04-10 10:53:36
“只是为了取乐”,以色列又大开杀戒

“只是为了取乐”,以色列又大开杀戒

南风窗
2026-04-10 17:21:14
高人指点!封顶价500万!张雪机车45秒拍卖冠军车,暗藏精妙布局

高人指点!封顶价500万!张雪机车45秒拍卖冠军车,暗藏精妙布局

火山詩话
2026-04-11 06:58:06
全红婵后续:香港媒体先爆料,检察日报喊话严查,队友集体背刺!

全红婵后续:香港媒体先爆料,检察日报喊话严查,队友集体背刺!

眼光很亮
2026-04-09 12:34:30
WTT男单四强战:国乒温瑞博0-3惨败压力山大

WTT男单四强战:国乒温瑞博0-3惨败压力山大

小皷拍客在北漂
2026-04-11 11:05:02
这是文物刚出土的样子,“新鲜”到不像真品,难怪专家会被农民骗

这是文物刚出土的样子,“新鲜”到不像真品,难怪专家会被农民骗

收藏大视界
2026-04-10 23:37:01
释放了4大信号!军队高级干部政治整训,迎接建军一百周年

释放了4大信号!军队高级干部政治整训,迎接建军一百周年

南宗历史
2026-04-11 04:02:12
陈丽华追悼会曝光,原来无儿无女的迟重瑞,早已被安排好“退路”

陈丽华追悼会曝光,原来无儿无女的迟重瑞,早已被安排好“退路”

青梅侃史啊
2026-04-09 19:57:58
一场双加时血战让前8再次洗牌!辽宁被钉死在第9,山东不幸遭波及

一场双加时血战让前8再次洗牌!辽宁被钉死在第9,山东不幸遭波及

后仰大风车
2026-04-11 06:10:10
月租万元小区部分房屋变身研究生宿舍?深圳大学回应每经:相关事项仍在推进中

月租万元小区部分房屋变身研究生宿舍?深圳大学回应每经:相关事项仍在推进中

每日经济新闻
2026-04-11 12:30:07
加油逃单的路虎车主被找到了!逃单原因曝光,司机将被行政处罚

加油逃单的路虎车主被找到了!逃单原因曝光,司机将被行政处罚

潮鹿逐梦
2026-04-11 09:41:59
2026-04-11 13:39:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4650文章数 37449关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

贵州400余名村民被困在"危山"之下:雨季来了只能等死

头条要闻

贵州400余名村民被困在"危山"之下:雨季来了只能等死

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

浪姐7淘汰 该走的没走,不该走的走了

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

数码
游戏
房产
艺术
本地

数码要闻

笔记本同款陶瓷铝合金材料,华硕推出ZenMouse MD202无线鼠标

第五次忍界大战!火影手游遭炮轰 五大主播联名抗议

房产要闻

28条新规落地!好房子,终于有了“广州标准”!

艺术要闻

17位当代青年画家油画欣赏

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

无障碍浏览 进入关怀版