网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Anthropic预测：2025是智能体系统年！年终总结分享最佳实践

2024-12-24 12:20:06　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：alan

【新智元导读】近日，Anthropic开发者关系主管发推表示：万事俱备，2025年将是智能体系统之年！在年终总结的博文中，Anthropic分享了一年来与客户合作构建智能体系统的最佳实践。

模型到应用之间的距离，就是烧钱与搞钱之间的距离。

这条路上，Agent已经身经百战，万事俱备。

在这个2024的结尾，Anthropic开发者关系主管Alex Albert表示：2025年将是智能体系统之年！

「各个部分正在就位，是时候开始考虑构建这些系统了。」

过去的一年里，Anthropic与数十个团队合作，构建了跨行业的大语言模型智能体系统。

实战表明，最成功的实现方式并不是使用复杂的框架或专用库，而是应用简单的可组合模式。

根据与客户合作的经验，Anthropic在年末总结的博文中分享了构建有效智能体系统的实用建议。

Agent系统最佳实践

智能体（Agent）可以有多种定义方式，比如将其视为完全自主的系统，可以在较长时间内独立运行，并使用各种工具完成复杂的任务。

这听起来很像另一个名词：工作流，但两者之间有着重要的架构区别：

工作流是通过预定义的代码路径来调用LLM和工具的系统；而智能体则是LLM动态指导自己的流程和使用工具，控制完成任务方式的系统。

那么，什么时候使用智能体？什么时候使用工作流？

一个原则是：找到尽可能简单的解决方案，并且仅在需要时增加复杂性。

智能体系统通常会以延迟和成本为代价来获得更好的任务性能，开发者应当根据实际情况权衡，是否真的需要构建智能体系统。

当需要更高的复杂性时，工作流为定义明确的任务提供可预测性和一致性；当需要大规模的灵活性和模型驱动的决策时，智能体是更好的选择。

对于许多应用程序来说，使用检索和上下文来优化单个LLM调用通常就足够了。

何时使用框架

有许多现成的框架可以帮助构建智能体系统，比如：

LangChain的LangGraph； Amazon Bedrock的AI Agent框架 Rivet，拖放式GUI LLM工作流构建器； Vellum，用于构建和测试复杂工作流的GUI工具

框架简化了标准的低级任务（如调用LLM、定义和解析工具、将调用整合在一起），但通常会创建额外的抽象层。

这可能会掩盖底层提示和响应，使系统更难调试。但开发者有时会禁不住框架的诱惑而选择增加系统的复杂性。

Anthropic建议开发人员尽量直接使用LLM（许多功能只需几行代码就能搞定），如果确实需要使用框架，请确保先了解底层代码，——对框架实现原理的错误假设是错误的常见来源。

从0开始构建系统

生产中的常见模式，是从基础模块开始，逐步增加复杂性，从简单的组合工作流到自主智能体系统。

基础模块：增强型LLM

智能体系统的基本构建块是LLM，并通过检索、使用工具和记忆等功能进行了增强。

增强型LLM可以主动使用这些功能，生成自己的搜索查询、选择适当的工具并确定要保留的信息。

Anthropic建议在实施中关注两个关键方面：根据特定应用定制这些功能，以及确保为LLM提供简单且文档健全的接口。

比如Anthropic最近发布的Model Context Protocol，允许开发人员通过简单的客户端实现与各种第三方工具进行集成。

提示链（Prompt chaining）

提示链将任务分解为一系列步骤，每个LLM调用都会处理前一个调用的输出。可以在任何中间步骤中添加编程检查，以确保流程处于正轨。

这种工作流非常适合可以轻松将任务分解为固定子任务的情况（每个LLM负责一个简单的子任务）。

提示链应用场景：

生成市场营销策略，然后将其翻译成不同的语言。编写文档的大纲，检查大纲是否满足特定条件，然后根据大纲编写文档。

路由（Routing）

路由对输入进行分类并将其定向到专门的后续任务，这个过程可以分离关注点，并构建更专业的提示。否则，针对一种输入进行优化可能会损害其他输入的性能。

路由适用于复杂任务，通过LLM或更传统的分类算法准确处理分类，对于不同类别的子任务，可以更好地单独处理。

路由应用场景：

将不同类型的客户服务查询（一般问题、退款请求、技术支持）引导到不同的下游流程、提示和工具中。将简单常见的问题路由到较小的模型（如Claude 3.5 Haiku），将困难的问题路由到功能更强大的模型（如Claude 3.5 Sonnet），以优化成本和速度。

并行化（Parallelization）

LLM有时并行处理一项任务，并以编程方式聚合其输出。并行化工作流有两种形式：

分段（Sectioning）：将任务分解可以为并行运行的独立子任务。投票（Voting）：多次运行同一任务，获得不同的输出。

当已划分的子任务可以并行执行，或者需要多次推理以获得更高置信度的结果时，并行化非常有效。

对于需要考虑多个因素的复杂任务，让单独的LLM负责一个特定的方面，通常会提高系统的表现力。

并行化的应用场景：

一个模型实例处理用户查询，另一个模型实例筛选用户查询是否存在不适当的内容。这往往比使用相同的LLM同时处理安全校验和核心响应的性能要好。自动评估LLM的性能：每个LLM调用都会评估模型在给定提示符下性能的不同方面。检查一段代码是否存在漏洞，如果发现问题，则触发不同的提示来检查并标记代码。评估给定的内容是否合适：多个提示用来评估不同的方面或使用不同的投票阈值来平衡误报和漏报。

Orchestrator-workers

在orchestrator-workers工作流中，中央LLM动态分解任务，将它们委托给worker LLM，并综合其结果。

这种工作流非常适合于无法预测所需子任务的复杂任务（比如编码中，需要更改的文件数以及每个文件中更改的内容取决于实际情况）。

orchestrator-workers与并行化在拓扑上相似，主要区别在于子任务不是预定义的，而是由orchestrator根据特定输入确定的。

应用场景：

每次对多个文件进行复杂更改的编码任务。从多个来源收集和分析相关信息的搜索任务。

Evaluator-optimizer

在evaluator-optimizer工作流中，一个LLM调用生成响应，另一个LLM在循环中提供评估和反馈。

当开发者有明确的评估标准，且迭代过程能提供用于比较的值时，evaluator-optimizer工作流特别有效。

evaluator-optimizer应用场景：

文学翻译中，译者LLM最初可能无法捕捉到一些细节，但评估者LLM可以提供有用的批评反馈。复杂的搜索任务中，需要多轮搜索和分析以收集全面的信息，评估者LLM决定是否需要进一步搜索。

总结

智能体在生产中帮助理解复杂的输入、参与推理和规划、可靠地使用工具以及从错误中恢复。

执行过程中，智能体在每个步骤从环境中获取「基本事实」以评估其进度，也可以在检查点或遇到障碍时暂停以获得人工反馈。

智能体用于难以预测所需步骤数，以及无法对固定路径进行硬编码的开放式问题。LLM可能会运行多个回合，需要用户对其决策有一定程度的信任。

智能体的自主性意味着更高的成本，并且可能会使错误复杂化。作者建议在沙盒环境中进行广泛测试，并使用适当的防护机制。

LLM的成功应用并不是构建最复杂的系统，而是根据需求构建正确的系统。在应用智能体时，尽量遵循三个核心原则：

保持智能体设计的简单性；明确显示智能体的规划步骤；提供全面的工具文档和测试，作为智能体和计算机之间的接口

框架可以帮助快速入门，但面对生产环境时，不要犹豫，减少抽象层并使用基本组件进行构建。

参考资料：

https://www.anthropic.com/research/building-effective-agents

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

媒体:官员称欧洲不适合装空调有人提议中国电力输欧

新民周刊 2026-07-07 11:05:50
7785 跟贴 7785
媒体：逼走中企后接盘工厂美国还吹嘘新能源"复兴"了

澎湃新闻 2026-07-07 11:43:57
3151 跟贴 3151

杭州车主把燃油车停在充电车位，回来发现车被上锁，最后交了一百块钱

都市快报橙柿互动 2026-07-07 12:13:20
980 跟贴 980

阿塞拜疆空军展示枭龙战机：这次不是借的

澎湃新闻 2026-07-07 11:43:57
61 跟贴 61
浙大去年申请注册校徽商标今年7月部分成功注册

封面新闻 2026-07-07 14:51:16
887 跟贴 887

北京一凶宅952万元拍卖，1人报名但未出价

现代快报 2026-07-07 12:30:18
271 跟贴 271

NASA很急：中国快得惊人能做到苏联做不到的事

澎湃新闻 2026-07-07 12:28:09
47 跟贴 47
字节跳动申请网络热梗著作权，包括“咕咕嘎嘎”“刀盾狗”“香蕉猫”等数十个网络热门表情包，网友吐槽：是你的吗，你就登记？

大风新闻 2026-07-07 13:20:05
1154 跟贴 1154

中国主动公开发射潜射战略导弹画面专家：信息量很大

央视新闻客户端 2026-07-07 18:47:01
389 跟贴 389
小店老板守着冰柜叹气：今年雪糕棒冰怎么没人吃了？

大象新闻 2026-07-05 21:58:07
1598 跟贴 1598
“整座楼都被掏空了”！男子从12楼被吸出，掉到绿化带，现场曝光

星视频 2026-07-07 15:19:36
126 跟贴 126
中国足协回应“佛得角邀国足踢友谊赛被婉拒”：消息不实

界面新闻 2026-07-07 18:19:33
720 跟贴 720
一副大墨镜骗过了特斯拉！司机开启FSD后睡着车辆以时速100km狂奔

中国能源网 2026-07-07 15:21:03
66 跟贴 66
8万元星空顶免费送！百万价格国产电动汽车“变相降价”，记者走访北京门店

北京商报 2026-07-07 00:53:21
158 跟贴 158
C罗谢幕，后会无期

中国新闻周刊 2026-07-07 18:45:38
4 跟贴 4
广州举行云溪植物园、云萝植物园门票收费标准方案听证会

南方都市报 2026-07-07 13:48:11
135 跟贴 135
点都德深夜道歉！“已在全国范围统一停售该产品”

都市快报橙柿互动 2026-07-07 02:24:40
231 跟贴 231
“扫描”主播｜百万粉丝主播的减肥“生意”：话术、私域与假进口糖果

澎湃新闻 2026-07-07 08:04:27
213 跟贴 213
欧洲迎今夏第三波热浪：多国多地破40℃，法德电价将大涨

澎湃新闻 2026-07-07 11:40:26
1100 跟贴 1100
数字光影复原故宫乾隆花园全域风貌

澎湃新闻 2026-07-07 19:48:27
1 跟贴 1
曝自由市场开启前几周詹姆斯仍认为自己有八成把握留在湖人

北青网-北京青年报 2026-07-07 20:23:08
17 跟贴 17
网传“新能源汽车智驾芯片自主化率不低于70%”系谣言（2026·07·07）

今日辟谣 2026-07-07 17:14:14
26 跟贴 26
薪资专家：乔治放弃了390万的交易保证金

北青网-北京青年报 2026-07-07 20:35:12
12 跟贴 12
长江武汉段逼近设防水位

极目新闻 2026-07-07 22:02:00
1 跟贴 1
“整栋楼被掏空”，男子住12楼被大风“吸出”坠入绿化带，家属：还在ICU！罕见龙卷风袭击黄冈，货车被掀出30米

都市快报橙柿互动 2026-07-07 22:50:39
0 跟贴 0
福建泉州一6岁女孩在马术课上坠马，家长要求退费遭拒：教练至少2次低头看手机；机构称孩子坠马时教练在看蚊子包；当地两部门介入

大象新闻 2026-07-07 22:54:05
0 跟贴 0

黄冈遭遇强对流天气，男子从12楼被大风“吸”出坠落绿化带，家属：还在重症监护室

黄冈遭遇强对流天气，男子从12楼被大风“吸”出坠落绿化带，家属：还在重症监护室

潇湘晨报

2026-07-07 12:12:27

C罗呆立原地+泪如雨下!获评6.8分全队倒数第3 18岁亚马尔上前安慰

C罗呆立原地+泪如雨下!获评6.8分全队倒数第3 18岁亚马尔上前安慰

风过乡

2026-07-07 05:31:20

血债还没还完！伊朗被曝组建海外暗杀队，目标直指特朗普

血债还没还完！伊朗被曝组建海外暗杀队，目标直指特朗普

新姐看世界

2026-07-06 21:50:06

总推进距离-5.7米！C罗被狂批：你还好意思哭一拿球就回传罪人

总推进距离-5.7米！C罗被狂批：你还好意思哭一拿球就回传罪人

风过乡

2026-07-07 05:58:37

4年2.73亿美元！米切尔与骑士达成续约：带球员选项+交易保证金

4年2.73亿美元！米切尔与骑士达成续约：带球员选项+交易保证金

罗说NBA

2026-07-07 21:21:37

马斯克有句话点醒过我“如果今天我破产了，绝对不会去找工作，而是去做一件能快速产生现金流，并且可以复制放大的事。”

马斯克有句话点醒过我“如果今天我破产了，绝对不会去找工作，而是去做一件能快速产生现金流，并且可以复制放大的事。”

LULU生活家

2026-07-07 20:59:47

从“我回来了”到“欢迎回葡萄牙”！法国传奇评C罗：没有世界杯冠军，就不能称GOAT

从“我回来了”到“欢迎回葡萄牙”！法国传奇评C罗：没有世界杯冠军，就不能称GOAT

红星新闻

2026-07-07 16:23:17

乐极生悲！英格兰队翻越广告牌庆祝的亨德森确诊手腕骨折，将缺席本届世界杯剩余比赛

乐极生悲！英格兰队翻越广告牌庆祝的亨德森确诊手腕骨折，将缺席本届世界杯剩余比赛

红星新闻

2026-07-07 08:28:57

C罗谢幕，后会无期

中国新闻周刊

2026-07-07 18:45:38

到了高中你会发现：中考成绩600分左右的孩子，到了高中容易下滑

到了高中你会发现：中考成绩600分左右的孩子，到了高中容易下滑

娱乐的宅急便

2026-07-05 03:55:27

队报：克罗地亚足协致信FIFA，要求就葡萄牙的几次判罚作解释

队报：克罗地亚足协致信FIFA，要求就葡萄牙的几次判罚作解释

懂球帝

2026-07-07 21:40:06

著名经济学家高善文逝世，终年55岁

著名经济学家高善文逝世，终年55岁

澎湃新闻

2026-07-07 20:08:27

苏州遇难母子找到了！官媒再曝猛料，更多细节流出，果然不简单

苏州遇难母子找到了！官媒再曝猛料，更多细节流出，果然不简单

秋风悲画芯

2026-07-07 01:46:57

第二个许家印！广州首富栽了！世界500强竟是假的，千亿帝国清零

第二个许家印！广州首富栽了！世界500强竟是假的，千亿帝国清零

乐天闲聊

2026-07-05 20:04:36

交通运输部：优先保障广西防汛抢险人员、防汛救灾物资运输，做好灾害损毁路段抢通保通

交通运输部：优先保障广西防汛抢险人员、防汛救灾物资运输，做好灾害损毁路段抢通保通

界面新闻

2026-07-07 12:39:29

雷军发文：风雨同舟，共克时艰！携手抗灾，我们同在！小米捐赠1000万元现金紧急驰援广西等地救灾

雷军发文：风雨同舟，共克时艰！携手抗灾，我们同在！小米捐赠1000万元现金紧急驰援广西等地救灾

大风新闻

2026-07-07 20:46:28

“北大毕业，月薪1600”，女孩满脸憔悴，网友：谁让你读这专业？

“北大毕业，月薪1600”，女孩满脸憔悴，网友：谁让你读这专业？

泽泽先生

2026-07-04 21:35:57

法国足协：令人发指！要求启动司法程序；法国总统府、国际足联主席最新发声：强烈谴责！

法国足协：令人发指！要求启动司法程序；法国总统府、国际足联主席最新发声：强烈谴责！

鲁中晨报

2026-07-07 16:43:47

37.0℃！申城发布今年首个高温橙色预警，台风“巴威”路径有变！

37.0℃！申城发布今年首个高温橙色预警，台风“巴威”路径有变！

文汇报

2026-07-07 18:28:08

速报！日本横滨山下公园只有上半身的“无头女尸”，经确认是45岁中国籍女性...

速报！日本横滨山下公园只有上半身的“无头女尸”，经确认是45岁中国籍女性...

东京新青年

2026-07-07 17:38:08

AI产业主平台领航智能+时代

15631文章数 66949关注度

往期回顾全部

科技要闻

全球下载量第一，可阿里AI还没学会赚钱

头条要闻

媒体:巴拉圭"不回头" 与中国签自贸协定可能性几乎为0

头条要闻

媒体:巴拉圭"不回头" 与中国签自贸协定可能性几乎为0

体育要闻

比利时干掉美国：正义必胜大喜剧！

娱乐要闻

私密照流出！曝关晓彤曾两次原谅鹿晗

财经要闻

桔子数科暴雷启示录：合规定生死

汽车要闻

试驾全新坦克300 Hi4-Z/激光雷达/全场景NOA

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

时尚

本地

房产

艺术

亲子要闻

最伤孩子的5句话，家长千万不要对孩子说~

除了小黑裙，“这条裙子”夏天一定要拥有！高级又气质

本地新闻

国内足球之旅？这座小城给你高分答案

房产要闻

洋浦，大量卖地！

艺术要闻

当代中国画家，张可扬油画作品选

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版