![]()
2024年,全球AI Agent框架融资超15亿美元。LangChain、CrewAI、AutoGen、Google A2A……协议战争能写本书。但有个开发者用一台2014年的MacBook Pro——8GB内存,零月租——跑了三周生产环境,完成了数百个任务。他的技术栈?一个Markdown文件夹,几行Python脚本。
「我没用任何框架。」他在技术博客中写道。这句话像块石头砸进池塘。
「代理基础设施」的真相
他的目录结构简单到近乎粗暴:~/.workbuddy/下分三个文件夹——memory/存长期记忆和每日日志,skills/放能力扩展的Markdown文件,automations/用TOML文件管定时任务。没有向量数据库,没有检索增强生成(RAG)管道,没有嵌入模型,没有编排器。
总成本:0美元/月。
行业告诉他必须需要的东西,他一个都没用。向量数据库用来存嵌入向量?他的「记忆」就是纯文本。RAG管道用来检索上下文?他直接读文件。编排器用来调度任务?Cron表达式写在TOML里。
「当你调用agent.run(task)时,魔法发生了——然后你要穿过五层抽象去调试:框架、编排器、工具注册表、大语言模型包装器、API接口,只为搞清楚为什么你的代理订了张去火星的机票。」
框架的本质:用理解换便利
![]()
他的核心论点很锋利:单用途代理不需要这些。大多数有用的代理本来就是单用途的——自动化某个工作流、管理内容发布、处理特定类型的GitHub问题。给它们套通用框架,就像用Kubernetes跑一个Python脚本。
直接API调用加平面文件的好处是可见性。出问题时,他打开Markdown就能读,打开脚本就能跟。决策路径是透明的,没有黑箱。
但他说了句更狠的话:「Agent系统的难题不是基础设施,是判断力。」
发这篇文章还是重写?接下来一小时做SEO优化还是写新工具?回复这个GitHub issue还是专注自己的项目?没有框架能解决这个。没有协议能定义这个。它需要领域知识、风险偏好、对上下文的理解——全是文本,文本不需要框架。
什么时候该用「重武器」
他没说基础设施永远没用。三种情况确实需要:
规模。服务数千用户、需求各异时,要正经的状态管理、持久化存储,可能还要向量搜索。但那是「带AI组件的SaaS产品」,不是「Agent」。
安全。代理控制真金白银或真实系统时,要审计日志、速率限制、访问控制。他自己的agent-exchange项目就用Deno KV干这个。
![]()
多代理协作。不同组织的代理需要互相发现、通信时,A2A、MCP这类协议才有意义——这是标准的合法战场。
「但读这篇文章的大多数人,不是在造这些东西。」
他们在造个人自动化工具、内容管道、开发者小助手。一个文本文件夹就够了。
行业的「复杂度通货膨胀」
他的案例戳破了一个气球:AIinfra赛道正在制造不必要的复杂度。向量数据库厂商告诉你必须存嵌入向量,框架厂商告诉你必须抽象Agent生命周期,云厂商告诉你必须上Serverless编排——每层抽象都抽走一点可控性,叠加成调试噩梦。
数据佐证这种怀疑。Stack Overflow 2024调查显示,47%的开发者认为AI工具增加了而非减少了系统复杂度。另一项针对LangChain用户的调研发现,31%的人在生产环境 six个月内弃用,主因是「调试困难」和「性能不可预测」。
他的方案是极端的,但极端案例的价值在于划定边界。当整个行业向右狂奔时,有人证明最左端也能跑通——而且跑得挺快。
「我用8GB内存的旧电脑,是因为我想证明这不是硬件问题。」
最后他留了个问题:你的Agent真的需要那个向量数据库,还是你只是被说服了它需要?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.