网易首页 > 网易号 > 正文 申请入驻

深度解析丨智能体架构,利用文件系统重塑上下文工程

0
分享至

智能体架构:利用文件系统重塑上下文工程

在现代 AI 系统设计的宏伟蓝图中,深度智能体的一个核心特征在于它们能够驾驭一套文件系统工具。通过这些工具,深度智能体得以在文件系统中执行读取、写入、编辑、列出目录以及搜索文件等操作。这不仅仅是功能的堆叠,更是智能体认知架构的一次重要升级。

为了理解文件系统的价值,我们必须先审视当下的智能体在哪些环节容易遭遇瓶颈。它们失败通常归结为两个核心原因:模型本身的推理能力不足,或者它们未能获取到正确的上下文信息。


一、 透视上下文工程的本质

Andrej Karpathy 曾形象地将上下文工程描述为一门将恰到好处的信息填入上下文窗口,以进行下一步操作的微妙艺术与科学。理解上下文工程及其失效模式,是构建高可靠性智能体的基石。我们可以通过上下文工程这个视角,来重新审视现代 AI 工程师的工作流程。

在理想状态下,智能体拥有海量的全集上下文,例如所有的支持文档或代码库。为了解决一个具体问题,智能体需要精准定位到其中包含答案的那一部分关键上下文。然而,在智能体抓取上下文并将其拉入上下文窗口的过程中,常常会出现偏差。上下文窗口可以被理解为 AI 的短期记忆容量,其处理信息的带宽是有限的。

从这个角度看,上下文工程导致智能体失效的路径主要有三种:

  • 检索盲区:如果智能体需要的上下文根本不在它能访问的总库里,那它注定失败。

例如客服智能体需要某篇文档来回答问题,但这篇文档根本没被索引。

  • 检索偏差:如果智能体抓取的内容里没有包含它真正需要的信息,它也无法正确回答。

这通常表现为文档虽然存在且被索引,但检索算法未能将其提取。

  • 资源冗余:如果智能体抓取的内容远远多于实际需要的,那就是在浪费资源。

例如客服智能体只需要特定的一页纸,结果它一口气抓了 100 页。这不仅造成 Token 的浪费,过多的噪声还可能干扰模型的判断。

作为智能体工程师,我们的优化目标是让智能体抓取的上下文实际所需的上下文尽可能重合。

二、 工程实践中的四大挑战

在试图精准分离出这部分恰当的上下文时,我们会遇到几个具体的工程挑战:

1. Token 溢出:有些工具(比如网络搜索)会返回大量的 Token。

仅仅几次网络搜索,对话历史中就可能堆积成千上万的 Token。

``你最终可能会遇到 HTTP 400 错误,但在那之前,你的 LLM 账单早就爆炸了,而且推理性能也会显著下降。

2. 超长上下文需求

有时智能体确实需要大量信息才能回答问题。

这种情况导致所需上下文的数量迅速增长,直到超出模型的上下文窗口限制 $$Context_{required} > Context_{window}$$。

3. 长尾信息检索

智能体可能需要引用埋藏在成百上千个文件中的某个冷门信息来处理输入。

如果找不到,那么抓取的上下文就无法支撑问题的解答。

4. 持续学习与记忆

最终用户往往会在互动中隐式或显式地提供线索。

如果智能体无法将这些新知添加到自己的上下文中,那么总上下文就永远无法覆盖实际需要的上下文。

三、 解决方案:文件系统作为认知扩展接口

文件系统提供了一个单一且标准化的接口,通过它,智能体可以灵活地存储、检索和更新无限量的上下文。

这实际上是为智能体挂载了一块无限容量的外部存储器

让我们看看这如何解决上述的每一个场景。

1. 应对 Token 溢出:文件系统即草稿纸

智能体不必将所有的工具调用结果和笔记都塞进对话历史记录里,而是可以将它们写入文件系统,然后在必要时有选择地查找相关信息。

以网络搜索为例。

当工具返回了 1 万个 Token 的原始内容时,大部分数据可能是噪声。

如果直接将其塞入消息历史,这 1 万个 Token 就会一直驻留并推高成本。

但如果我们把这个巨大的结果卸载到文件系统中,智能体就可以像程序员一样,使用grep等工具搜索特定的关键词,只将必要的几行上下文读入对话中。

在这个架构中,智能体有效地将文件系统用作了处理大量上下文的草稿纸,实现了信息的降噪处理。

2. 应对超长上下文:动态存储与检索

当 $$Context_{required} < Context_{window}$$ 这一假设被打破时,文件系统提供了一个极佳的抽象层,允许 LLM 动态地换入换出信息:

  • 长周期任务规划:智能体将制定的计划写入文件,在后续步骤中按需读取,以保持对任务目标的专注。

  • 多智能体协作:子智能体将工作成果写入文件系统,而非直接回传给主智能体。这最大程度地减少了传声筒游戏带来的信息失真。

  • 复杂指令集管理:对于需要大量操作说明的场景,与其填充臃肿的 System Prompt,不如将其作为文件存储,让智能体在需要时动态读取。

3. 精准定位冷门信息:确定性搜索的回归

在 LLM 浪潮早期,语义搜索是主流。

它在通用文本上表现尚可,但在技术文档或代码检索中,由于缺乏精确的字面匹配,效果往往差强人意。

文件系统允许智能体使用lsglobgrep等工具进行确定性搜索。

现代模型已经具备了理解文件系统逻辑的能力,这使得它们能够像熟练的工程师一样遍历目录。

globgrep允许智能体不仅隔离特定的文件,还能定位到特定的行和字符。

配合read_file工具,智能体可以仅读取文

件中最关键的片段。

这种基于文件系统的精确搜索,在特定场景下可以作为语义搜索的有力补充。

4. 实现持续学习:自我更新的系统指令

改进智能体的最佳途径通常是确保它们能访问正确的上下文。

我们认为智能体的指令或技能与它们可能想要处理的任何其他上下文没有什么不同。

文件系统可以作为智能体存储和更新自身指令的地方。

当用户提供反馈或纠正时,智能体可以立即写入自己的配置文件并记住这条重要信息。

这对于记录用户的姓名、偏好或特定的一次性事实非常有效。

这是一种令人兴奋的新模式,它让 LLM 能够随着时间的推移增长自己的技能组合和指令,实现真正意义上的在干中学

Last but not least

将文件系统引入智能体架构,本质上是赋予了 AI 像人类一样的持久化记忆与精确检索能力。

这不仅突破了上下文窗口的物理限制,更为构建真正具备长期规划与持续学习能力的通用智能系统奠定了工程基础。

关注公众号,用极客视角洞察未来!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
第三次赌局:欧洲在等待俄罗斯的“自毁时刻”

第三次赌局:欧洲在等待俄罗斯的“自毁时刻”

民间胡扯老哥
2026-04-11 05:48:44
伊朗征收过境费是否合理?白宫、联合国、海湾邻国一致谴责要求“无条件开放”

伊朗征收过境费是否合理?白宫、联合国、海湾邻国一致谴责要求“无条件开放”

财联社
2026-04-10 12:48:08
宋庆龄爱女隋永清离世,常年烟不离手,68岁结局令人痛心

宋庆龄爱女隋永清离世,常年烟不离手,68岁结局令人痛心

TVB的四小花
2026-02-28 11:30:39
“迟重瑞与陈丽华年轻时合影”系误传,照片当事人回应:张冠李戴,有的还加上黑白滤镜,这是对陈丽华女士的不尊重

“迟重瑞与陈丽华年轻时合影”系误传,照片当事人回应:张冠李戴,有的还加上黑白滤镜,这是对陈丽华女士的不尊重

极目新闻
2026-04-11 08:56:29
《乘风2026》孙怡拿祭天剧本哭上热搜,输了比赛,赢了人心!

《乘风2026》孙怡拿祭天剧本哭上热搜,输了比赛,赢了人心!

日落于西
2026-04-11 09:54:37
杨尚昆晚年回忆道:党内那么多人,山头也多,只有毛主席能拢得住

杨尚昆晚年回忆道:党内那么多人,山头也多,只有毛主席能拢得住

史韵流转
2026-04-08 09:42:46
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
越来越多人得病,医生提醒:洗碗时的这几个坏习惯,看看你有吗?

越来越多人得病,医生提醒:洗碗时的这几个坏习惯,看看你有吗?

白话电影院
2026-04-09 14:32:27
一场双加时血战让前8再次洗牌!辽宁被钉死在第9,山东不幸遭波及

一场双加时血战让前8再次洗牌!辽宁被钉死在第9,山东不幸遭波及

后仰大风车
2026-04-11 06:10:10
长沙运钞车实线加塞别车后续!交警出手处置,网友直言太解气

长沙运钞车实线加塞别车后续!交警出手处置,网友直言太解气

奇思妙想草叶君
2026-04-10 21:29:17
印尼首富花48亿买下游球队,2年杀进欧冠区

印尼首富花48亿买下游球队,2年杀进欧冠区

篮坛第一线
2026-04-10 20:52:13
夏克立遭爆「狂传对镜自慰裸照」!2女被迫上床 前经纪人心痛发声

夏克立遭爆「狂传对镜自慰裸照」!2女被迫上床 前经纪人心痛发声

ETtoday星光云
2026-04-09 12:22:15
哈梅内伊家族有多富?

哈梅内伊家族有多富?

律法刑道
2026-04-09 11:45:27
赛力斯、余承东和友商“齐心协力” 一把把问界M6预订20万辆干掉了

赛力斯、余承东和友商“齐心协力” 一把把问界M6预订20万辆干掉了

三农老历
2026-04-10 03:44:46
视频丨日本学者:石油供应趋紧或致日本物价进一步上涨

视频丨日本学者:石油供应趋紧或致日本物价进一步上涨

国际在线
2026-04-10 19:15:52
肖战领衔《十日终焉》开机 中式无限流悬疑即将来袭

肖战领衔《十日终焉》开机 中式无限流悬疑即将来袭

娱乐圈今天火了吗
2026-04-10 16:58:23
恶意抹黑失效!C罗阿拉冠进球争议,权威发声一锤定音!

恶意抹黑失效!C罗阿拉冠进球争议,权威发声一锤定音!

田先生篮球
2026-04-10 09:41:11
走进人民大会堂前,郑丽文团中现“特殊人物”,台当局撒弥天大谎

走进人民大会堂前,郑丽文团中现“特殊人物”,台当局撒弥天大谎

福建睿平
2026-04-11 09:54:07
斯诺克世锦赛资格赛:傅家俊10-9绝杀戴维斯,3杆破百,险胜晋级

斯诺克世锦赛资格赛:傅家俊10-9绝杀戴维斯,3杆破百,险胜晋级

侧身凌空斩
2026-04-11 05:34:12
中央定调!6月1日起全国统一执行,家家户户用水将迎7大变化

中央定调!6月1日起全国统一执行,家家户户用水将迎7大变化

桑启红原
2026-04-11 04:41:21
2026-04-11 11:16:49
GeekSavvy incentive-icons
GeekSavvy
Geek Savvy是一个聚合AI极客的年轻化社区。用Geek视角见识行业趋势、技术创新和市场动态!
33文章数 4关注度
往期回顾 全部

科技要闻

阿尔忒弥斯2号成功溅落,隔热罩惊险过关

头条要闻

牛弹琴:伊朗很悲壮 向美国提高了"要价"

头条要闻

牛弹琴:伊朗很悲壮 向美国提高了"要价"

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情!聚会细节被扒

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

家居
健康
数码
旅游
游戏

家居要闻

复古风格 自然简约

干细胞抗衰4大误区,90%的人都中招

数码要闻

联想推出2026款来酷斗战者“战7000”笔记本,7699元起

旅游要闻

《凡人修仙传》取景地 粤港澳文旅大咖的贵州旅居生活

开发者称《老头环》画面仍是顶级!靠的是想象力

无障碍浏览 进入关怀版