网易首页 > 网易号 > 正文 申请入驻

2025,AI Agents技术栈解读出炉!

0
分享至

来源:PaperAgent

2025新年伊始, 今年 将是 “Agentic系统之年 ”, “2025将会出现真正Agent ” ,时不我待, 请签收 属于你的 AI Agents技术栈 综述 。

理解AI Agents生态

尽管我们看到了大量关于Agent栈和市场的分类图,但我们往往不同意它们的分类方式,发现它们很少反映开发者实际使用的。 在过去几个月中,随着在内存、工具使用、安全执行和部署方面的进步,Agent软件生态系统有了显著的发展,因此,能够真正落地的“Agent技术栈(agent stack)”应该是怎样尼?

AI Agents技术栈,被组织成三个关键层:Agent托管/服务、Agent框架,以及LLM模型和存储。

从LLM到LLM Agent

在2022年和2023年,我们看到了LLM框架和SDK的兴起,比如LangChain(2022年10月发布)和LlamaIndex(2022年11月发布)。同时,我们也看到了几个“标准”平台的建立,这些平台通过API消费LLMs以及自部署LLM推理(vLLM和Ollama)。

在2024年,我们看到了对AI“Agent”的兴趣急剧转变,更广泛地说,是对复合系统的兴趣。尽管“Agent”这个术语在AI中已经存在了几十年(特别是在强化学习中),但在后ChatGPT时代,“Agent”已经成为一个松散定义的术语,通常指的是被赋予输出动作(工具调用)并在自治设置中运行的LLM。从LLM到Agent所需的工具使用、自治执行和内存的结合,促使一个新的Agent栈发展。

Agent技术栈的独特之处

与基本的LLM聊天机器人相比,Agent是一个更复杂的工程挑战,因为它们需要状态管理(保留消息/事件历史记录,存储长期记忆,执行多个LLM调用在一个Agent循环中)和工具执行(安全执行LLM输出的动作并返回结果)。

因此,AI Agent栈与标准的LLM栈看起来非常不同。让我们从模型服务层开始,分解今天的AI Agent栈:

模型服务

OpenAI和Anthropic在基于封闭API的模型推理提供商中领先,拥有私有前沿模型。Together.AI、Fireworks和Groq是提供开放权重模型(例如Llama 3)背后的付费API的流行选项。在本地模型推理提供商中,我们最常见到vLLM领先于生产级GPU基础服务负载。SGLang是一个新兴项目,拥有类似的开发者受众。在业余爱好者(“AI爱好者”)中,Ollama和LM Studio是两个流行的选项,用于在您自己的计算机上运行模型(例如M系列Apple Macbooks)。

存储

存储是定义为有状态的Agent的基本构建块——Agent由持久状态定义,如他们的对话历史记录、记忆和外部数据源,他们用于RAG。 像Chroma、Weaviate、Pinecone、Qdrant和Milvus这样的向量数据库很受欢迎,用于存储Agent的“外部记忆”,允许Agent利用数据源和对话历史记录,这些数据太大,无法放入上下文窗口。 Postgres是一个自80年代以来就存在的传统数据库,现在也通过pgvector扩展支持向量搜索。 基于Postgres的公司如Neon(无服务器Postgres)和Supabase也为Agent提供基于嵌入的搜索和存储。

工具和库

标准AI聊天机器人和AI Agent之间的一个主要区别是Agent调用“工具”(或“功能”)的能力。在大多数情况下,这种动作的机制是LLM生成结构化输出(例如JSON对象),指定要调用的函数和提供的参数。Agent工具执行的一个常见混淆点是,工具执行_不是_由LLM提供商本身完成的——LLM只选择要调用的工具和提供的参数。支持任意工具或任意参数输入工具的Agent服务必须使用沙箱(例如Modal、E2B)以确保安全执行。

Agent通过OpenAI定义的JSON模式调用工具——这意味着Agent和工具实际上可以跨不同框架兼容。Letta Agent可以调用LangChain、CrewAI和Composio工具,因为它们都是由相同的模式定义的。因此,对于常见工具,有一个不断增长的工具提供商生态系统。Composio是一个流行的通用工具库,还管理授权。Browserbase是一个专门用于网页浏览的专用工具的例子,Exa提供了一个专门用于搜索网络的专用工具。随着越来越多的Agent被构建,我们预计工具生态系统将增长,并提供现有新功能,如Agent的身份验证和访问控制。

Agent框架

  • 管理Agent的状态:大多数框架引入了一些“序列化”状态的概念,允许Agent通过将序列化状态(例如JSON、字节)保存到文件中,在稍后的时间加载回相同的脚本——这包括状态如对话历史记录、Agent记忆和执行阶段。在Letta中,所有状态都由数据库支持(例如消息表、Agent状态表、内存块表),没有“序列化”的概念,因为Agent状态始终被持久化。这允许轻松查询Agent状态(例如,按日期查找过去的信息)。状态的表示和管理方式决定了Agent应用程序将如何随着更长的对话历史记录或更多的Agent数量进行扩展,以及如何灵活地访问或修改状态。

  • Agent的上下文窗口结构:每次调用LLM时,框架将“编译”Agent的状态到上下文窗口。不同的框架将以不同的方式将数据放入上下文窗口(例如指令、消息缓冲区等),这可能会改变性能。我们建议选择一个使上下文窗口透明的框架,因为这最终是您可以控制您的Agent行为的方式。

  • 跨Agent通信(即多Agent):Llama Index通过消息队列让Agent通信,而CrewAI和AutoGen有明确的抽象器用于多Agent。Letta和LangGraph都支持Agent直接相互调用,这允许集中式(通过监督Agent)和跨Agent的分布式通信。大多数框架现在支持多Agent和单Agent,因为一个设计良好的单Agent系统应该使跨Agent协作易于实现。

  • 内存方法:LLM的基本限制是它们有限的上下文窗口,这就需要管理随时间的记忆。一些框架内置了内存管理,而其他框架则期望开发者自己管理内存。CrewAI和AutoGen完全依赖基于RAG的内存,而phidata和Letta使用额外的技术,如自我编辑内存(来自MemGPT)和递归总结。Letta Agent自动配备了一套内存管理工具,允许Agent通过文本或数据搜索先前的消息,编写记忆,并编辑Agent自己的上下文窗口(您可以在这里阅读更多)。

  • 支持开放模型:模型提供商实际上做了很多幕后技巧,让LLM以正确的格式生成文本(例如用于工具调用)——例如,当它们没有生成适当的工具参数时,重新采样LLM输出,或在提示中添加提示(例如“请输出JSON”)。支持开放模型需要框架处理这些挑战,所以一些框架限制对主要模型提供商的支持。

在今天构建Agent时,正确的框架选择取决于您的应用程序,例如您是否正在构建会话Agent或工作流程,您是否希望在笔记本或作为服务运行Agent,以及您对开放权重模型支持的要求。

我们预计框架之间的主要区别将出现在它们的部署工作流程中,状态/内存管理和工具执行的设计选择变得更加重要。

Agent托管和Agent服务

今天的大多数Agent框架都是为那些不存在于它们编写的Python脚本或Jupyter笔记本之外的Agent设计的。我们相信Agent的未来是将Agent视为一个_服务_,该服务被部署到本地或云基础设施上,可以通过REST API访问。就像OpenAI的ChatCompletion API成为与LLM服务交互的行业标准一样,我们预计最终会有一个赢家为Agent API。但还没有一个……。

部署Agent作为服务比部署LLM作为服务要复杂得多,因为状态管理和安全工具执行的问题。工具及其所需的依赖项和环境需求需要明确存储在数据库中,因为运行它们的环境需要由服务重新创建(这不是一个问题,当您的工具和Agent在同一个脚本中运行时)。应用程序可能需要运行数百万Agent,每个Agent都累积了越来越多的对话历史记录。当从原型转移到生产时,Agent状态不可避免地必须经历一个数据规范化过程,Agent交互必须由REST API定义。今天,这个过程通常是通过开发者编写自己的FastAPI和数据库代码来完成的,但我们预计随着Agent的成熟,这个功能将更多地嵌入到框架中。

结论

Agent技术栈仍然非常早期,我们对生态系统如何扩展和演变感到兴奋。对未来Agent技术栈发展你还有什么补充吗?

https://www.letta.com/blog/ai-agents-stack

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
港媒:“下一波‘中国冲击’很重要,因为它不仅仅是个经济故事”

港媒:“下一波‘中国冲击’很重要,因为它不仅仅是个经济故事”

参考消息
2026-02-25 09:09:04
马筱梅高调晒娃,白白胖胖有8斤,像玥儿小时候,汪爸一碗水端平

马筱梅高调晒娃,白白胖胖有8斤,像玥儿小时候,汪爸一碗水端平

手工制作阿歼
2026-02-24 19:55:11
“小婉君”金铭45岁现状:个子太矮事业受挫,住北京豪宅不婚不育

“小婉君”金铭45岁现状:个子太矮事业受挫,住北京豪宅不婚不育

削桐作琴
2026-01-29 00:03:53
马斯克发帖暗示“辛鲍姆与贩毒集团存在关联”,墨西哥总统:正考虑采取法律行动

马斯克发帖暗示“辛鲍姆与贩毒集团存在关联”,墨西哥总统:正考虑采取法律行动

环球网资讯
2026-02-25 08:58:09
打脸了?2015年专家预测:一旦开放二胎,中国新生人口将会激增

打脸了?2015年专家预测:一旦开放二胎,中国新生人口将会激增

知鉴明史
2025-10-04 18:55:52
WTT大满贯16强诞生!26日赛程出炉,3场中日对决,王楚钦迎复仇战

WTT大满贯16强诞生!26日赛程出炉,3场中日对决,王楚钦迎复仇战

陌识
2026-02-26 00:07:28
上海一日料店,俩女子误认为是自助餐,专门捡贵的点,结账时4302

上海一日料店,俩女子误认为是自助餐,专门捡贵的点,结账时4302

苗苗情感说
2026-02-26 04:31:53
米兰冬奥运动员收入排行,宁忠岩落榜,徐梦桃排不上号,第一是她

米兰冬奥运动员收入排行,宁忠岩落榜,徐梦桃排不上号,第一是她

削桐作琴
2026-02-25 19:06:19
沉寂9天,中方管制准时开始?高市憋出几句话,对华的称呼都变了

沉寂9天,中方管制准时开始?高市憋出几句话,对华的称呼都变了

青烟小先生
2026-02-25 14:24:41
值得珍藏:科技龙头100强+半导体设备+电力+光刻机+培育钻石等

值得珍藏:科技龙头100强+半导体设备+电力+光刻机+培育钻石等

Thurman在昆明
2026-02-25 07:35:26
11年恩爱抵不过残酷现实,32岁昆凌青春正盛,奔50周杰伦年老力衰

11年恩爱抵不过残酷现实,32岁昆凌青春正盛,奔50周杰伦年老力衰

小熊侃史
2026-01-29 07:20:07
曾国藩:遇到阴险小人,千万别翻脸!学会三招,比跟他拼命强百倍

曾国藩:遇到阴险小人,千万别翻脸!学会三招,比跟他拼命强百倍

千秋文化
2026-02-17 14:47:23
万斯称美国已掌握证据表明伊朗试图重建核计划

万斯称美国已掌握证据表明伊朗试图重建核计划

财联社
2026-02-26 07:02:08
巴拿马强行接管长和码头,撕破最后脸面,国家是时候出手了

巴拿马强行接管长和码头,撕破最后脸面,国家是时候出手了

Mr王的饭后茶
2026-02-24 23:07:37
线从天上来 比亚迪大规模安装兆瓦闪充桩:辨识度独一档

线从天上来 比亚迪大规模安装兆瓦闪充桩:辨识度独一档

快科技
2026-02-24 15:14:22
克宫:用核武器武装乌克兰计划违反国际法

克宫:用核武器武装乌克兰计划违反国际法

参考消息
2026-02-24 22:48:05
CCTV5今晚18-05直播:郭士强生死战手握三张王牌

CCTV5今晚18-05直播:郭士强生死战手握三张王牌

许穩很机智
2026-02-26 07:58:59
合肥楼市来势汹汹,2026年合肥政务区房价有望从2.2万变成2.6万

合肥楼市来势汹汹,2026年合肥政务区房价有望从2.2万变成2.6万

有事问彭叔
2026-02-25 15:11:17
中方高规格招待,默茨接过鲜花,走进人民大会堂前,他喊出9个字

中方高规格招待,默茨接过鲜花,走进人民大会堂前,他喊出9个字

兰妮搞笑分享
2026-02-26 08:11:29
14.98万起!日产NX8掀桌,理想L6遭降维打击?

14.98万起!日产NX8掀桌,理想L6遭降维打击?

犯困的蛋挞酱
2026-02-24 19:45:04
2026-02-26 09:35:00
人工智能研究 incentive-icons
人工智能研究
分享深度学习、CV、NLP
297文章数 134关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

中方对日方出口管制措施落地后 高市早苗表态了

头条要闻

中方对日方出口管制措施落地后 高市早苗表态了

体育要闻

勇士爆冷惜败鹈鹕 梅尔顿28分赛季新高

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

房产
游戏
艺术
本地
公开课

房产要闻

海南楼市春节热销地图曝光!三亚、陵水又杀疯了!

《FF7重制版》NS2版克劳德头发有锯齿 官方回应

艺术要闻

一幅眼花缭乱草书:从书法创作到青少年书法教育的思考

本地新闻

津南好·四时总相宜

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版