网易首页 > 网易号 > 正文 申请入驻

深度解析丨智能体架构,利用文件系统重塑上下文工程

0
分享至

智能体架构:利用文件系统重塑上下文工程

在现代 AI 系统设计的宏伟蓝图中,深度智能体的一个核心特征在于它们能够驾驭一套文件系统工具。通过这些工具,深度智能体得以在文件系统中执行读取、写入、编辑、列出目录以及搜索文件等操作。这不仅仅是功能的堆叠,更是智能体认知架构的一次重要升级。

为了理解文件系统的价值,我们必须先审视当下的智能体在哪些环节容易遭遇瓶颈。它们失败通常归结为两个核心原因:模型本身的推理能力不足,或者它们未能获取到正确的上下文信息。


一、 透视上下文工程的本质

Andrej Karpathy 曾形象地将上下文工程描述为一门将恰到好处的信息填入上下文窗口,以进行下一步操作的微妙艺术与科学。理解上下文工程及其失效模式,是构建高可靠性智能体的基石。我们可以通过上下文工程这个视角,来重新审视现代 AI 工程师的工作流程。

在理想状态下,智能体拥有海量的全集上下文,例如所有的支持文档或代码库。为了解决一个具体问题,智能体需要精准定位到其中包含答案的那一部分关键上下文。然而,在智能体抓取上下文并将其拉入上下文窗口的过程中,常常会出现偏差。上下文窗口可以被理解为 AI 的短期记忆容量,其处理信息的带宽是有限的。

从这个角度看,上下文工程导致智能体失效的路径主要有三种:

  • 检索盲区:如果智能体需要的上下文根本不在它能访问的总库里,那它注定失败。

例如客服智能体需要某篇文档来回答问题,但这篇文档根本没被索引。

  • 检索偏差:如果智能体抓取的内容里没有包含它真正需要的信息,它也无法正确回答。

这通常表现为文档虽然存在且被索引,但检索算法未能将其提取。

  • 资源冗余:如果智能体抓取的内容远远多于实际需要的,那就是在浪费资源。

例如客服智能体只需要特定的一页纸,结果它一口气抓了 100 页。这不仅造成 Token 的浪费,过多的噪声还可能干扰模型的判断。

作为智能体工程师,我们的优化目标是让智能体抓取的上下文实际所需的上下文尽可能重合。

二、 工程实践中的四大挑战

在试图精准分离出这部分恰当的上下文时,我们会遇到几个具体的工程挑战:

1. Token 溢出:有些工具(比如网络搜索)会返回大量的 Token。

仅仅几次网络搜索,对话历史中就可能堆积成千上万的 Token。

``你最终可能会遇到 HTTP 400 错误,但在那之前,你的 LLM 账单早就爆炸了,而且推理性能也会显著下降。

2. 超长上下文需求

有时智能体确实需要大量信息才能回答问题。

这种情况导致所需上下文的数量迅速增长,直到超出模型的上下文窗口限制 $$Context_{required} > Context_{window}$$。

3. 长尾信息检索

智能体可能需要引用埋藏在成百上千个文件中的某个冷门信息来处理输入。

如果找不到,那么抓取的上下文就无法支撑问题的解答。

4. 持续学习与记忆

最终用户往往会在互动中隐式或显式地提供线索。

如果智能体无法将这些新知添加到自己的上下文中,那么总上下文就永远无法覆盖实际需要的上下文。

三、 解决方案:文件系统作为认知扩展接口

文件系统提供了一个单一且标准化的接口,通过它,智能体可以灵活地存储、检索和更新无限量的上下文。

这实际上是为智能体挂载了一块无限容量的外部存储器

让我们看看这如何解决上述的每一个场景。

1. 应对 Token 溢出:文件系统即草稿纸

智能体不必将所有的工具调用结果和笔记都塞进对话历史记录里,而是可以将它们写入文件系统,然后在必要时有选择地查找相关信息。

以网络搜索为例。

当工具返回了 1 万个 Token 的原始内容时,大部分数据可能是噪声。

如果直接将其塞入消息历史,这 1 万个 Token 就会一直驻留并推高成本。

但如果我们把这个巨大的结果卸载到文件系统中,智能体就可以像程序员一样,使用grep等工具搜索特定的关键词,只将必要的几行上下文读入对话中。

在这个架构中,智能体有效地将文件系统用作了处理大量上下文的草稿纸,实现了信息的降噪处理。

2. 应对超长上下文:动态存储与检索

当 $$Context_{required} < Context_{window}$$ 这一假设被打破时,文件系统提供了一个极佳的抽象层,允许 LLM 动态地换入换出信息:

  • 长周期任务规划:智能体将制定的计划写入文件,在后续步骤中按需读取,以保持对任务目标的专注。

  • 多智能体协作:子智能体将工作成果写入文件系统,而非直接回传给主智能体。这最大程度地减少了传声筒游戏带来的信息失真。

  • 复杂指令集管理:对于需要大量操作说明的场景,与其填充臃肿的 System Prompt,不如将其作为文件存储,让智能体在需要时动态读取。

3. 精准定位冷门信息:确定性搜索的回归

在 LLM 浪潮早期,语义搜索是主流。

它在通用文本上表现尚可,但在技术文档或代码检索中,由于缺乏精确的字面匹配,效果往往差强人意。

文件系统允许智能体使用lsglobgrep等工具进行确定性搜索。

现代模型已经具备了理解文件系统逻辑的能力,这使得它们能够像熟练的工程师一样遍历目录。

globgrep允许智能体不仅隔离特定的文件,还能定位到特定的行和字符。

配合read_file工具,智能体可以仅读取文

件中最关键的片段。

这种基于文件系统的精确搜索,在特定场景下可以作为语义搜索的有力补充。

4. 实现持续学习:自我更新的系统指令

改进智能体的最佳途径通常是确保它们能访问正确的上下文。

我们认为智能体的指令或技能与它们可能想要处理的任何其他上下文没有什么不同。

文件系统可以作为智能体存储和更新自身指令的地方。

当用户提供反馈或纠正时,智能体可以立即写入自己的配置文件并记住这条重要信息。

这对于记录用户的姓名、偏好或特定的一次性事实非常有效。

这是一种令人兴奋的新模式,它让 LLM 能够随着时间的推移增长自己的技能组合和指令,实现真正意义上的在干中学

Last but not least

将文件系统引入智能体架构,本质上是赋予了 AI 像人类一样的持久化记忆与精确检索能力。

这不仅突破了上下文窗口的物理限制,更为构建真正具备长期规划与持续学习能力的通用智能系统奠定了工程基础。

关注公众号,用极客视角洞察未来!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
薄一波的两位亲家,一个是开国将军,一个官至副国级,他们是谁?

薄一波的两位亲家,一个是开国将军,一个官至副国级,他们是谁?

凡人侃史
2026-05-12 14:39:35
上海地铁打人爆火!两老人施暴女孩,官方怒批倚老卖老,追责难逃

上海地铁打人爆火!两老人施暴女孩,官方怒批倚老卖老,追责难逃

奇思妙想草叶君
2026-05-12 02:14:56
山东37岁女子离婚当天彻底疯了,当场撒泼嘶吼前夫,网友纷纷叫好

山东37岁女子离婚当天彻底疯了,当场撒泼嘶吼前夫,网友纷纷叫好

社会日日鲜
2026-05-12 08:09:39
郑丽文遭当头一棒,中方严正通告,对岸不准参会,傅崐萁临阵倒戈

郑丽文遭当头一棒,中方严正通告,对岸不准参会,傅崐萁临阵倒戈

林子说事
2026-05-12 19:15:50
记者:39岁苏亚雷斯落选乌拉圭世界杯初选名单

记者:39岁苏亚雷斯落选乌拉圭世界杯初选名单

懂球帝
2026-05-12 20:57:09
特朗普访华随行团名单里,藏着一份重要转向密码

特朗普访华随行团名单里,藏着一份重要转向密码

识局Insight
2026-05-12 19:33:20
复旦解剖326名糖尿病逝者,意外发现:得糖尿病的人,大多有5共性

复旦解剖326名糖尿病逝者,意外发现:得糖尿病的人,大多有5共性

芹姐说生活
2026-05-12 15:38:02
女子退礼服被商家曝光后续:女方长相扒出,主动退演,称情绪低落

女子退礼服被商家曝光后续:女方长相扒出,主动退演,称情绪低落

李晚书
2026-05-12 18:54:35
女子结婚不到一周,却因摩洛哥新娘视频导致离婚

女子结婚不到一周,却因摩洛哥新娘视频导致离婚

映射生活的身影
2026-05-12 12:13:28
4.5亿欧元!拉莫斯将收购塞维利亚:变身老板 只差最后一步

4.5亿欧元!拉莫斯将收购塞维利亚:变身老板 只差最后一步

叶青足球世界
2026-05-12 20:26:01
中美关系的潜力、张力、角力|阎学通:战略竞争对手也不应放弃对话的方式

中美关系的潜力、张力、角力|阎学通:战略竞争对手也不应放弃对话的方式

澎湃新闻
2026-05-12 17:04:26
特斯拉宣布停产,震惊全网!

特斯拉宣布停产,震惊全网!

财经三分钟pro
2026-05-12 15:10:58
追觅CEO俞浩:听说某知名科技新贵喜欢看美女,来,满足你

追觅CEO俞浩:听说某知名科技新贵喜欢看美女,来,满足你

财闻
2026-05-12 14:53:07
暴跌65%,中年人最爱的豪车也崩了!

暴跌65%,中年人最爱的豪车也崩了!

蒋东文
2026-05-12 21:16:35
美股全线下跌,超3500只个股走低,中概股普跌;英伟达逆势上扬,再创历史新高!金银下挫,国际油价拉升|美股开盘

美股全线下跌,超3500只个股走低,中概股普跌;英伟达逆势上扬,再创历史新高!金银下挫,国际油价拉升|美股开盘

每日经济新闻
2026-05-12 22:18:42
宇树发布GD01载人变形机甲 定价390万元起

宇树发布GD01载人变形机甲 定价390万元起

财联社
2026-05-12 12:27:07
问界M9尾灯能"画"长城黄河,49.98万起预售

问界M9尾灯能"画"长城黄河,49.98万起预售

硅屿手记
2026-05-12 07:50:33
重庆57岁主任医师车祸致2死6伤!正面照曝出,丈夫身份浮出水面

重庆57岁主任医师车祸致2死6伤!正面照曝出,丈夫身份浮出水面

老猫观点
2026-05-12 06:43:00
姚来英已任中国烟草总公司总经理

姚来英已任中国烟草总公司总经理

界面新闻
2026-05-12 11:12:28
出乎众人预料,中方提前48小时官宣特朗普访华,高市早苗心愿落空

出乎众人预料,中方提前48小时官宣特朗普访华,高市早苗心愿落空

策前论
2026-05-11 18:13:56
2026-05-12 23:52:49
GeekSavvy incentive-icons
GeekSavvy
Geek Savvy是一个聚合AI极客的年轻化社区。用Geek视角见识行业趋势、技术创新和市场动态!
36文章数 4关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

游戏
艺术
亲子
旅游
公开课

LPL第二赛段:又是让一追二,BLG三局战胜IG

艺术要闻

这位画家的油画美人让人惊叹不已!

亲子要闻

dhea什么时候吃最好时间?卵巢早衰做试管成功率高吗?

旅游要闻

湖南张家界天门山景区:5月12日起,景区山顶东线玻璃栈道停止开放

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版