网易首页 > 网易号 > 正文 申请入驻

一个import让AI代理成本暴跌93%,作者做了什么

0
分享至

每周一早晨,我的LangChain代理都在重复同一件事:为三家固定客户生成安全周报。同样的上下文,同样的推理结构,同样的输出格式。而我每次都要付完整的Anthropic API费用。

查完日志后,数字触目惊心。45次运行,三类重复工作流——安全审计、发票处理、周报——生成的计划结构几乎完全一致。大模型每次都在重新推导同一个骨架。93%的token开销是冗余的。


这不是提示工程能解决的问题。是结构性问题。


主流代理框架——LangChain、LangGraph、CrewAI、AutoGen——默认都是无状态的。每次调用从零开始,没有上一次执行的记忆。一次性查询没问题,但重复工作流意味着永远付全款。

提示缓存(Anthropic和OpenAI的内置功能)能帮上忙,但只针对完全相同的输入提示。输入稍有变化就失效,而且不消除API调用,对下游的推理和计划生成毫无作用。

真正需要的是执行缓存——在计划层面缓存,而非提示层面。

核心思路:首次运行时,为执行计划生成指纹并存储为片段。后续遇到相同或语义相似的目标,直接从缓存调取计划,跳过LLM。

两种模式并行:

System 1——精确匹配。对目标+上下文+输入做SHA-256指纹。匹配成功则在约2.66毫秒内从本地SQLite重建。零API调用,零token。

System 2——语义匹配。目标相似但不完全相同——同一工作流,不同客户名或日期。通过嵌入相似度匹配存储计划,比对片段差异,只重生成变化部分。只为增量付费,而非完整计划。

后台有个叫Retrospector的进程,会把失败的片段隔离,确保错误模式不会被复用。信号总线追踪每类工作流的延迟基线和失败率,反馈回来强化或弱化缓存模式。缓存会随时间变聪明,不只是变大。

接入方式极简:


import mnemon
mnemon.init()
# 以下代码完全不变
from langchain_anthropic import ChatAnthropic
llm = ChatAnthropic(model="claude-sonnet-4-6")
response = llm.invoke("Generate weekly security report for Acme Corp")

mnemon.init()在导入时即修补BaseChatModel.invoke和ainvoke。首次调用走LLM并缓存,后续相同或语义等效的目标直接从本地SQLite响应。

如需显式控制缓存范围,可传入自定义函数和缓存键策略。框架保持对底层客户端的零侵入,不破坏原有代码结构。

作者实测:三类重复工作流的token成本下降93%,延迟从数百毫秒降至个位数毫秒。代价是首次运行的缓存建立开销,以及约15MB的本地SQLite存储。

这个方案指向一个被忽视的优化空间——代理框架的"计划层"长期被当作黑盒,默认每次重新推理。但当工作流呈现明显周期性时,推理结果本身就是可缓存的资产。

代价也有:缓存失效策略需要精细设计,语义匹配的阈值调参需要迭代,失败片段的隔离机制增加了系统复杂度。但对于高频重复场景,收益远超成本。

更深的问题在于,为什么主流框架默认无状态?可能源于通用性与场景优化的张力——框架设计者优先保证任意查询的灵活性,而非特定模式的效率。这留下了垂直优化的窗口。

mnemon的解法不是替代LangChain等框架,而是寄生式增强:一行导入,透明拦截,原有代码无需改动。这种"非侵入式补丁"的架构选择,降低了采纳门槛,也限制了深度整合的可能性。

作者最后提到,Retrospector的反馈机制让缓存具备有限的学习能力——这不是静态的查询结果缓存,而是带质量评估的执行计划复用系统。方向有趣,但长期效果仍需观察。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
73岁车田正美再执笔,圣斗士星矢天界篇第一话正式登场!

73岁车田正美再执笔,圣斗士星矢天界篇第一话正式登场!

坠入二次元的海洋
2026-05-14 18:04:37
父母的无效人脉能让人多恼火?网友:亲戚水电,两代人都踩雷了!

父母的无效人脉能让人多恼火?网友:亲戚水电,两代人都踩雷了!

另子维爱读史
2026-05-14 20:24:27
上海楼市爆了!

上海楼市爆了!

地产观点
2026-05-14 18:00:07
俄总统新闻秘书:只要美国不再把经贸合作与乌克兰问题挂钩,俄愿同美开展商业往来

俄总统新闻秘书:只要美国不再把经贸合作与乌克兰问题挂钩,俄愿同美开展商业往来

极目新闻
2026-05-14 09:58:58
成本超2亿,票房仅41万,收手吧黄渤,别让百亿影帝成一个笑话

成本超2亿,票房仅41万,收手吧黄渤,别让百亿影帝成一个笑话

靠谱电影君
2026-05-14 18:02:24
入朝前夕,毛主席听取林帅建议:换掉13兵团主将!两年后才知高明

入朝前夕,毛主席听取林帅建议:换掉13兵团主将!两年后才知高明

搜史君
2026-05-08 13:00:16
美国胃有多爱中餐?特朗普给出在美中餐馆数据,直呼“惊人”

美国胃有多爱中餐?特朗普给出在美中餐馆数据,直呼“惊人”

澎湃新闻
2026-05-14 21:07:15
醒醒吧中国导演!看完《给阿嬷的情书》,才知资方是影视搅屎棍

醒醒吧中国导演!看完《给阿嬷的情书》,才知资方是影视搅屎棍

秋姐居
2026-05-12 19:26:44
南京一市民在湖边晨练时,发现湖面上有条一米多长的大蛇:这边看到这么大的蛇确实不多见;网友调侃:“白素贞”也出来晨练

南京一市民在湖边晨练时,发现湖面上有条一米多长的大蛇:这边看到这么大的蛇确实不多见;网友调侃:“白素贞”也出来晨练

台州交通广播
2026-05-14 15:50:46
上海乒羽主任:樊振东是国乒独一无二的领军人物 比王楚钦高出一块

上海乒羽主任:樊振东是国乒独一无二的领军人物 比王楚钦高出一块

818体育
2026-05-14 23:56:01
刘和平:蹲过2年大牢却混成副书记,还被百姓称为“青天大老爷”

刘和平:蹲过2年大牢却混成副书记,还被百姓称为“青天大老爷”

云霄纪史观
2026-05-14 17:59:05
三个月交易超7亿美元?特朗普“炒股账本”曝光,硅谷和华尔街巨头一个不少

三个月交易超7亿美元?特朗普“炒股账本”曝光,硅谷和华尔街巨头一个不少

华尔街见闻官方
2026-05-15 05:44:51
从未来可期到万年不红,被卖还数钱的陈瑶,才是娱乐圈一股清流

从未来可期到万年不红,被卖还数钱的陈瑶,才是娱乐圈一股清流

好贤观史记
2026-05-13 14:50:58
5月16日午后开始,连续6天!北京开启多雨模式

5月16日午后开始,连续6天!北京开启多雨模式

新浪财经
2026-05-15 00:25:49
黄仁勋被问英伟达是否会向华为出售芯片:这是个多么奇怪的问题啊

黄仁勋被问英伟达是否会向华为出售芯片:这是个多么奇怪的问题啊

泡泡网
2026-05-14 17:50:15
刚向191国发出通知,大陆转头放行台当局,郑丽文公开力挺一中

刚向191国发出通知,大陆转头放行台当局,郑丽文公开力挺一中

千羽解读
2026-05-14 10:17:47
原来老一辈才是最敢买的!网友:一旦有了条件就开始放飞自我!

原来老一辈才是最敢买的!网友:一旦有了条件就开始放飞自我!

夜深爱杂谈
2026-05-14 20:28:51
枪声响起!小马科斯大势已去,菲军方紧急切割,中菲关系或迎转机

枪声响起!小马科斯大势已去,菲军方紧急切割,中菲关系或迎转机

影孖看世界
2026-05-14 23:06:05
暴涨95%!“最大芯片”公司成功上市!英伟达要当心了

暴涨95%!“最大芯片”公司成功上市!英伟达要当心了

EETOP半导体社区
2026-05-15 07:32:03
特朗普访华代表团集体使用一次性手机,禁止连接中国公共WiFi

特朗普访华代表团集体使用一次性手机,禁止连接中国公共WiFi

桂系007
2026-05-15 00:05:27
2026-05-15 09:07:00
我是一个养虾人
我是一个养虾人
有态度网友ytd
2746文章数 29关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

数码
游戏
亲子
本地
公开课

数码要闻

雷蛇发布2026款灵刃18游戏本,聚焦细节升级

万字解析:大叔萝莉的组合为什么经久不衰?"/> 主站 商城 论坛 自运营 登录 注册 万字解析:大叔萝莉的组合为什么经久不衰? 神堡薛师傅 2026-0...

亲子要闻

“67岁自然怀孕”的天赐妈妈,现状曝光:7年前的预言,正在应验

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版