网易首页 > 网易号 > 正文 申请入驻

深度解析丨智能体架构,利用文件系统重塑上下文工程

0
分享至

智能体架构:利用文件系统重塑上下文工程

在现代 AI 系统设计的宏伟蓝图中,深度智能体的一个核心特征在于它们能够驾驭一套文件系统工具。通过这些工具,深度智能体得以在文件系统中执行读取、写入、编辑、列出目录以及搜索文件等操作。这不仅仅是功能的堆叠,更是智能体认知架构的一次重要升级。

为了理解文件系统的价值,我们必须先审视当下的智能体在哪些环节容易遭遇瓶颈。它们失败通常归结为两个核心原因:模型本身的推理能力不足,或者它们未能获取到正确的上下文信息。


一、 透视上下文工程的本质

Andrej Karpathy 曾形象地将上下文工程描述为一门将恰到好处的信息填入上下文窗口,以进行下一步操作的微妙艺术与科学。理解上下文工程及其失效模式,是构建高可靠性智能体的基石。我们可以通过上下文工程这个视角,来重新审视现代 AI 工程师的工作流程。

在理想状态下,智能体拥有海量的全集上下文,例如所有的支持文档或代码库。为了解决一个具体问题,智能体需要精准定位到其中包含答案的那一部分关键上下文。然而,在智能体抓取上下文并将其拉入上下文窗口的过程中,常常会出现偏差。上下文窗口可以被理解为 AI 的短期记忆容量,其处理信息的带宽是有限的。

从这个角度看,上下文工程导致智能体失效的路径主要有三种:

  • 检索盲区:如果智能体需要的上下文根本不在它能访问的总库里,那它注定失败。

例如客服智能体需要某篇文档来回答问题,但这篇文档根本没被索引。

  • 检索偏差:如果智能体抓取的内容里没有包含它真正需要的信息,它也无法正确回答。

这通常表现为文档虽然存在且被索引,但检索算法未能将其提取。

  • 资源冗余:如果智能体抓取的内容远远多于实际需要的,那就是在浪费资源。

例如客服智能体只需要特定的一页纸,结果它一口气抓了 100 页。这不仅造成 Token 的浪费,过多的噪声还可能干扰模型的判断。

作为智能体工程师,我们的优化目标是让智能体抓取的上下文实际所需的上下文尽可能重合。

二、 工程实践中的四大挑战

在试图精准分离出这部分恰当的上下文时,我们会遇到几个具体的工程挑战:

1. Token 溢出:有些工具(比如网络搜索)会返回大量的 Token。

仅仅几次网络搜索,对话历史中就可能堆积成千上万的 Token。

``你最终可能会遇到 HTTP 400 错误,但在那之前,你的 LLM 账单早就爆炸了,而且推理性能也会显著下降。

2. 超长上下文需求

有时智能体确实需要大量信息才能回答问题。

这种情况导致所需上下文的数量迅速增长,直到超出模型的上下文窗口限制 $$Context_{required} > Context_{window}$$。

3. 长尾信息检索

智能体可能需要引用埋藏在成百上千个文件中的某个冷门信息来处理输入。

如果找不到,那么抓取的上下文就无法支撑问题的解答。

4. 持续学习与记忆

最终用户往往会在互动中隐式或显式地提供线索。

如果智能体无法将这些新知添加到自己的上下文中,那么总上下文就永远无法覆盖实际需要的上下文。

三、 解决方案:文件系统作为认知扩展接口

文件系统提供了一个单一且标准化的接口,通过它,智能体可以灵活地存储、检索和更新无限量的上下文。

这实际上是为智能体挂载了一块无限容量的外部存储器

让我们看看这如何解决上述的每一个场景。

1. 应对 Token 溢出:文件系统即草稿纸

智能体不必将所有的工具调用结果和笔记都塞进对话历史记录里,而是可以将它们写入文件系统,然后在必要时有选择地查找相关信息。

以网络搜索为例。

当工具返回了 1 万个 Token 的原始内容时,大部分数据可能是噪声。

如果直接将其塞入消息历史,这 1 万个 Token 就会一直驻留并推高成本。

但如果我们把这个巨大的结果卸载到文件系统中,智能体就可以像程序员一样,使用grep等工具搜索特定的关键词,只将必要的几行上下文读入对话中。

在这个架构中,智能体有效地将文件系统用作了处理大量上下文的草稿纸,实现了信息的降噪处理。

2. 应对超长上下文:动态存储与检索

当 $$Context_{required} < Context_{window}$$ 这一假设被打破时,文件系统提供了一个极佳的抽象层,允许 LLM 动态地换入换出信息:

  • 长周期任务规划:智能体将制定的计划写入文件,在后续步骤中按需读取,以保持对任务目标的专注。

  • 多智能体协作:子智能体将工作成果写入文件系统,而非直接回传给主智能体。这最大程度地减少了传声筒游戏带来的信息失真。

  • 复杂指令集管理:对于需要大量操作说明的场景,与其填充臃肿的 System Prompt,不如将其作为文件存储,让智能体在需要时动态读取。

3. 精准定位冷门信息:确定性搜索的回归

在 LLM 浪潮早期,语义搜索是主流。

它在通用文本上表现尚可,但在技术文档或代码检索中,由于缺乏精确的字面匹配,效果往往差强人意。

文件系统允许智能体使用lsglobgrep等工具进行确定性搜索。

现代模型已经具备了理解文件系统逻辑的能力,这使得它们能够像熟练的工程师一样遍历目录。

globgrep允许智能体不仅隔离特定的文件,还能定位到特定的行和字符。

配合read_file工具,智能体可以仅读取文

件中最关键的片段。

这种基于文件系统的精确搜索,在特定场景下可以作为语义搜索的有力补充。

4. 实现持续学习:自我更新的系统指令

改进智能体的最佳途径通常是确保它们能访问正确的上下文。

我们认为智能体的指令或技能与它们可能想要处理的任何其他上下文没有什么不同。

文件系统可以作为智能体存储和更新自身指令的地方。

当用户提供反馈或纠正时,智能体可以立即写入自己的配置文件并记住这条重要信息。

这对于记录用户的姓名、偏好或特定的一次性事实非常有效。

这是一种令人兴奋的新模式,它让 LLM 能够随着时间的推移增长自己的技能组合和指令,实现真正意义上的在干中学

Last but not least

将文件系统引入智能体架构,本质上是赋予了 AI 像人类一样的持久化记忆与精确检索能力。

这不仅突破了上下文窗口的物理限制,更为构建真正具备长期规划与持续学习能力的通用智能系统奠定了工程基础。

关注公众号,用极客视角洞察未来!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北大医院官宣:大幅上调夜班费,高达300元/班次,覆盖医护技!12万人研究发现医务人员离职主因是夜班!夜班津贴是正常薪资构成,名正言顺

北大医院官宣:大幅上调夜班费,高达300元/班次,覆盖医护技!12万人研究发现医务人员离职主因是夜班!夜班津贴是正常薪资构成,名正言顺

梅斯医学
2026-05-12 07:53:51
第1现场|俄乌对峙下的红场阅兵:36年来首次未见坦克

第1现场|俄乌对峙下的红场阅兵:36年来首次未见坦克

澎湃新闻
2026-05-09 21:40:28
领导让我帮他辅导一下他的儿子,三个月后他发现,他儿子考了全校第一

领导让我帮他辅导一下他的儿子,三个月后他发现,他儿子考了全校第一

麦子情感故事
2026-05-12 00:11:12
内娱嘴亲烂了也没他俩眼神动人!道哥实锤:这才是真CP感

内娱嘴亲烂了也没他俩眼神动人!道哥实锤:这才是真CP感

可乐谈情感
2026-05-11 20:53:09
放生还是造孽?广州公园捞出70cm剧毒怪鱼,差点击沉一座池塘

放生还是造孽?广州公园捞出70cm剧毒怪鱼,差点击沉一座池塘

小陆搞笑日常
2026-05-12 02:17:10
李讷左手拉着大孙女右手抱着小孙女,儿子王效芝儿媳王伟围在身边

李讷左手拉着大孙女右手抱着小孙女,儿子王效芝儿媳王伟围在身边

大江
2026-05-12 11:09:07
一特斯拉Model 3服役7年跑了61万公里后,实测续航缩水34.2%

一特斯拉Model 3服役7年跑了61万公里后,实测续航缩水34.2%

IT之家
2026-05-10 21:38:29
少吃莲藕红薯,立夏后多吃它,一清热,二养心,三祛湿,四增免疫

少吃莲藕红薯,立夏后多吃它,一清热,二养心,三祛湿,四增免疫

小茉莉美食记
2026-05-12 12:43:35
俞敏洪两次“口无遮拦”,陈行甲两次微笑沉默:谁赢了?

俞敏洪两次“口无遮拦”,陈行甲两次微笑沉默:谁赢了?

亿通电子游戏
2026-05-12 11:49:48
现货黄金跌破4700美元

现货黄金跌破4700美元

鲁中晨报
2026-05-12 15:02:03
3万入刑,不是针对一线小医生的,你不配

3万入刑,不是针对一线小医生的,你不配

医护健康科普
2026-05-12 09:08:08
采访了100个娶了小三的男人,他们几乎都说了同一句话,让人恍然

采访了100个娶了小三的男人,他们几乎都说了同一句话,让人恍然

千秋文化
2026-04-15 20:18:32
走不出广东的嘉顿面包,一年狂捞60亿

走不出广东的嘉顿面包,一年狂捞60亿

白熊消费
2026-05-11 10:30:18
深海探测器偶遇36米巨型海蛇,操作员崩溃:它不是海蛇!

深海探测器偶遇36米巨型海蛇,操作员崩溃:它不是海蛇!

纸鸢奇谭
2026-04-27 16:21:08
退休后和老伴在深圳住了30天,我发现:深圳人,和我们真的不一样

退休后和老伴在深圳住了30天,我发现:深圳人,和我们真的不一样

原广工业
2026-05-12 12:34:35
第00001号电视剧

第00001号电视剧

新科文
2026-05-11 18:00:07
“大空头”:美股或将崩盘,科技股飙升重现2000年泡沫

“大空头”:美股或将崩盘,科技股飙升重现2000年泡沫

华尔街见闻官方
2026-05-12 06:33:43
难怪能把国乒女队逼到绝境,背后“操盘者”不简单:马琳师兄!

难怪能把国乒女队逼到绝境,背后“操盘者”不简单:马琳师兄!

十点街球体育
2026-05-11 21:34:06
史无前例!日本拟正式定调:中国是“威胁”,安保政策彻底变天!

史无前例!日本拟正式定调:中国是“威胁”,安保政策彻底变天!

阿离家居
2026-05-12 13:40:36
山东女孩放学回家路上失踪,连续5天给母亲托梦:我就在锅里

山东女孩放学回家路上失踪,连续5天给母亲托梦:我就在锅里

纸鸢奇谭
2025-01-26 17:18:28
2026-05-12 15:43:00
GeekSavvy incentive-icons
GeekSavvy
Geek Savvy是一个聚合AI极客的年轻化社区。用Geek视角见识行业趋势、技术创新和市场动态!
36文章数 4关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

女子立遗嘱遗产归弟弟 其女起诉两人返还857万及房产

头条要闻

女子立遗嘱遗产归弟弟 其女起诉两人返还857万及房产

体育要闻

总是掉链子的“倒霉蛋”,闯进了欧战决赛

娱乐要闻

刘涛晒妈祖诞辰活动照 评论区变许愿池

财经要闻

黄仁勋真是被白宫彻底封杀了

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

时尚
旅游
本地
游戏
军事航空

征集|| 她们也太会买裙子了!边看边种草

旅游要闻

出游的黄金窗口期来了!机票均价跌超40%,人流少、体验好

本地新闻

用苏绣的方式,打开江西婺源

任天堂官方贴心提醒!购买会员需注意 很快涨价

军事要闻

知情人士披露:美国或考虑恢复对伊朗军事行动

无障碍浏览 进入关怀版