网易首页 > 网易号 > 正文 申请入驻

AI代理还是手写代码?三个问题定生死

0
分享至

我见过一个团队花三周写规则引擎,结果一个提示词五分钟搞定。也见过有人把简单增删改查硬塞给代理,账单烧穿,调试地狱。工具越丰富,选择越致命。

这不是取代开发者,是选对扳手


Claude Code、OpenCode、各种代理框架陆续成熟,"要不要上AI"从闲聊变成架构决策。选错的真实代价:时间、钱、可靠性。

作者提了三个问题,按顺序问。答案自然浮现。

第一问:失败时会发生什么?

这是根本分野。

代理出错,可能是幻觉、格式错乱、理解偏差。代码出错,是崩溃、死循环、数据损坏。两种失败模式完全不同,修复成本也不同。

如果任务允许"再试一次"——比如生成营销文案、草拟邮件回复——代理的容错空间很大。用户看到三版草稿选其一,没人受伤。

如果任务是扣款、库存扣减、权限变更,一次错误就是事故。这时候你需要代码的确定性:同一输入,永远同一输出,可审计、可回滚。

作者的原话:「Think about failure modes」。不是问"会不会错",是问"错了能不能承受"。

这个判断直接决定后续所有选择。

第二问:输入是什么形态?

结构化数据 vs 非结构化混乱,工具偏好截然相反。

代码喜欢干净:JSON、数据库行、API响应。正则、解析器、类型系统,都是为规整输入设计的。给代码一堆格式标准的订单数据,它能飞。

但真实世界满是噪音:客户邮件里的口语化需求、扫描件里的手写备注、聊天记录里的碎片信息。这时候代理的阅读理解能力碾压传统解析。

作者举了具体场景:「emails, documents, chat logs, support tickets」。代理在这些地方"often succeed where regex and parsers fail"。

不是代理更聪明,是它能容忍模糊。代码的严格性在这里变成负担。

有个实用信号:如果你发现自己要写第17个正则特例来处理"但是"、"不过"、"另外"这类转折词,停。这是代理的舒适区。

第三问:需求会变多快?

维护负担的源头,往往是一开始没想清楚。

代码的刚性是双刃剑。需求稳定时,优化后的代码跑得又快又省。需求每周一变时,重构成本让人崩溃。

代理的弹性在这里发光。改需求?改提示词。作者的原话:「updating a prompt is faster than refactoring code」。几行自然语言 vs 重写模块、补测试、担心回归。

创业公司、创新项目、探索性业务,需求稳定性天然差。这时候代理的快速迭代是生存优势。

但注意:这种"快"是有代价的。提示词改多了,行为漂移难以追踪。作者没明说,但 checklist 里留了后手——「Do I have debugging/observability needs?」复杂需求偏向代码,部分原因就在这里。

真实决策:不是二选一,是拼接

最有力量的应用,往往战略性地混用两种方法。

作者给了一个模式:「Agent → Validation/Transformation → Code Service」。代理负责理解混乱输入,中间层清洗校验,代码服务处理核心逻辑。

这个结构解耦了不确定性与确定性。代理的创造性用在它擅长的模糊地带,代码的可靠性守住不能出错的底线。

举个例子:客服工单系统。代理读邮件,提取"客户要退款"这个意图和关键信息;校验层确认金额、订单号格式合法;代码执行实际的退款流程、库存回滚、通知触发。

哪一环出错,影响范围可控。代理幻觉最多导致提取错误,进不了校验层;代码层的操作有完整审计。

代理的甜蜜点:四类场景

作者明确列出了代理"unbeatable value"的场景:

第一,原型验证。「build a working prototype in hours instead of days」。不是偷懒,是用最小成本测试概念是否成立。验证通过再投入工程化,避免在错误方向上精雕细琢。

第二, messy human-generated data。前面提过,不重复。

第三,需求高频变动。创业公司和创新项目的常态。

第四,非开发者自助。「enable non-developers to automate simple tasks」。作者给的例子很具体:「When I get an email from X with attachment Y, save it to folder Z and notify team」。不需要写代码,自然语言描述规则,代理执行。

第四点常被低估。它扩展了"谁可以自动化"的边界,而不只是"怎么自动化"。

代码的不可替代:四类硬边界

代理 hype 再热,有些场景代码仍是唯一选择。

性能关键。「microseconds matter or you need to handle thousands of requests per second」。编译优化、内存布局、并发模型,这些代理抽象层给不了。

确定性要求。「Financial calculations, game physics, cryptographic operations」。作者强调「bit-perfect reproducibility」。不是"差不多",是每一位都一致。代理的概率本性与此冲突。

高频重复。「Tasks that run millions of times with nearly identical inputs」。代码的优化空间在这里累积成巨大收益。代理的每次调用都是推理成本,规模上去后账单惊人。

调试需求。「Debugging, profiling, and optimizing require visibility and control」。代理的黑箱特性让深度优化困难。你需要知道每一步发生了什么,而不仅是输入输出对。

开工前的八项检查

作者给了一个可直接用的 checklist,八个问题:

☑️ 主要是理解还是创造?(理解→偏向代理)

☑️ 出错的代价多大?(低代价→更适配代理)

☑️ 需求稳定吗?(不稳定→更适配代理)

☑️ 需要确定性输出吗?(需要→偏向代码)

☑️ 性能关键吗?(关键→偏向代码)

☑️ 数据结构化还是非结构化?(非结构化→偏向代理)

☑️ 需求会频繁变更吗?(会→更适配代理)

☑️ 调试和可观测性需求复杂吗?(复杂→偏向代码)

这八个问题没有标准答案,但问完,偏哪边应该清楚了。

注意作者的措辞:「Understanding → agent bias」,「Yes → code bias」。用的是"偏向",不是"必须"。实际决策是连续谱,不是开关。

一个被忽略的细节:团队能力

原文没提,但 checklist 的设计隐含了这一点。调试/可观测性需求复杂时偏向代码,前提是团队真有代码调试的能力。如果团队全是提示工程专家,硬上复杂代码可能是另一种灾难。

反过来,如果团队没有代理运维经验——监控幻觉率、管理上下文窗口、设计降级策略——贸然把代理推到核心路径,同样危险。

工具选择背后是组织能力的匹配。这是框架没写但决策者该想的第九个问题。

为什么现在必须建立这个框架

代理工具的生产就绪(production-ready)改变了游戏规则。以前"要不要试试AI"是实验心态,现在是架构决策,影响系统拓扑、成本结构、团队分工。

没有判断框架的团队,容易两极分化:要么恐惧回避,错过代理能创造的效率;要么盲目追捧,把代理塞进所有缝隙,制造技术债。

作者的三个问题、八项检查,本质是强制结构化思考。不是给你答案,是逼你面对真实约束:失败成本、输入形态、变化速度。

这些约束不会因为你喜欢或讨厌AI而改变。

实用建议:从 checklist 开始

下次立项,别先讨论"用哪个模型"。把八个问题打印出来,团队一起填。分歧最大的那项,就是风险点。

如果失败成本和需求稳定性打架——比如高频变动的金融计算——优先考虑失败成本。确定性是硬约束,变化速度可以用流程缓解(更频繁的提示词评审、更严格的输出校验)。

如果输入结构和性能要求冲突——比如要实时处理非结构化日志——考虑分层:轻量代理做初步分类,代码处理聚合计算,必要时再加一层代理做异常解读。

没有银弹,只有显式权衡。

作者最后没给总结金句,但 checklist 本身就是行动指南。打印它,用三次,你会形成自己的直觉。这比任何"最佳实践"都可靠。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
轰22+7掀翻湖人!火箭22岁1.22亿状元崛起,乌度卡:没他赢不了

轰22+7掀翻湖人!火箭22岁1.22亿状元崛起,乌度卡:没他赢不了

李喜林篮球绝杀
2026-04-30 13:37:37
美国一学生打断以色列士兵演讲,当众怒斥以军:6岁女孩被打335枪,超70000巴勒斯坦人被杀,你们犯下的暴行终将被清算

美国一学生打断以色列士兵演讲,当众怒斥以军:6岁女孩被打335枪,超70000巴勒斯坦人被杀,你们犯下的暴行终将被清算

大象新闻
2026-04-28 23:48:20
小米自研的3nm芯片,已出货超100万颗了,为何至今没被美国制裁?

小米自研的3nm芯片,已出货超100万颗了,为何至今没被美国制裁?

王新喜
2026-04-29 13:54:19
千名学者联名要求美国西北大学为致华裔神经科学家吴瑛自杀道歉

千名学者联名要求美国西北大学为致华裔神经科学家吴瑛自杀道歉

TOP大学来了
2026-04-30 01:24:35
直降1400元!iPhone 17 Pro Max 降价,上市以来新低

直降1400元!iPhone 17 Pro Max 降价,上市以来新低

科技堡垒
2026-04-30 09:34:03
捷报!乌军单日收42平方公里

捷报!乌军单日收42平方公里

史政先锋
2026-04-29 21:38:58
激动握拳!父亲笑了!吴宜泽13-8进世锦赛4强 多少奖金?对手确定

激动握拳!父亲笑了!吴宜泽13-8进世锦赛4强 多少奖金?对手确定

林子说事
2026-04-30 04:18:26
欧冠马竞1-1阿森纳暗藏隐患!连伤三大主力,西蒙尼却底气十足

欧冠马竞1-1阿森纳暗藏隐患!连伤三大主力,西蒙尼却底气十足

夜白侃球
2026-04-30 09:11:19
41岁C罗再获MVP 霸气伸出5指 回击亚冠冠军球迷挑衅:我有5座欧冠

41岁C罗再获MVP 霸气伸出5指 回击亚冠冠军球迷挑衅:我有5座欧冠

我爱英超
2026-04-30 05:30:48
欧冠首回合结束!阿森纳1-1马竞,巴黎5-4拜仁,最新夺冠排名出炉

欧冠首回合结束!阿森纳1-1马竞,巴黎5-4拜仁,最新夺冠排名出炉

小火箭爱体育
2026-04-30 09:22:56
足坛一夜动态:马竞1-1阿森纳 塔帅炮轰裁判 C罗破门回击球迷挑衅

足坛一夜动态:马竞1-1阿森纳 塔帅炮轰裁判 C罗破门回击球迷挑衅

念洲
2026-04-30 07:04:08
杨洋王楚然分手的真相!

杨洋王楚然分手的真相!

八卦疯叔
2026-04-29 11:27:15
26日深夜,美制战车准时入台,解放军开始上场,郑丽文咬死一个词

26日深夜,美制战车准时入台,解放军开始上场,郑丽文咬死一个词

流史岁月
2026-04-28 13:05:05
俄罗斯领导人谴责乌克兰使用“恐怖主义手段”袭击俄炼油厂

俄罗斯领导人谴责乌克兰使用“恐怖主义手段”袭击俄炼油厂

山河路口
2026-04-29 19:57:41
拜托!不要再拿“致敬”当抄袭的遮羞布

拜托!不要再拿“致敬”当抄袭的遮羞布

细雨中的呼喊
2026-04-28 15:35:07
火箭小将放狠话称就是比湖人强!老詹回怼:我这把年纪不听这些!

火箭小将放狠话称就是比湖人强!老詹回怼:我这把年纪不听这些!

仰卧撑FTUer
2026-04-30 14:27:05
江青罕见演员照曝光,古今结合引发热议!

江青罕见演员照曝光,古今结合引发热议!

书画相约
2026-04-30 11:15:02
荒诞到刺眼!本科毕业找不到工作,竟要回炉读技校?这闹剧该停了

荒诞到刺眼!本科毕业找不到工作,竟要回炉读技校?这闹剧该停了

狐狸先森讲升学规划
2026-04-29 05:50:03
10岁男童村里消失!监控曝光,前后几分钟,跟安徽女童案如出一辙

10岁男童村里消失!监控曝光,前后几分钟,跟安徽女童案如出一辙

奇思妙想草叶君
2026-04-29 18:16:14
游牧民族几乎没有碳水来源,为什么没营养不良?

游牧民族几乎没有碳水来源,为什么没营养不良?

深度报
2026-04-29 22:45:52
2026-04-30 14:59:00
闪存猎手
闪存猎手
全网蹲好价的野生捕手,算力与羊毛都不可辜负。
1922文章数 16关注度
往期回顾 全部

科技要闻

四巨头财报齐发:AI已经不只是风口

头条要闻

"上海最通透爸爸"去世 女儿:他退休20多年这辈子不亏

头条要闻

"上海最通透爸爸"去世 女儿:他退休20多年这辈子不亏

体育要闻

骑士天王山:哈登、莫布里和……施罗德?

娱乐要闻

孙杨妈妈被曝!过往言行被扒大开眼界

财经要闻

医美偷税手法曝光 借免税优惠来避税被封堵

汽车要闻

上汽一季报出炉 在低增长周期里守住基本盘

态度原创

亲子
数码
本地
艺术
军事航空

亲子要闻

助孕人群高龄化趋势日益突出!建设生育友好型社会,妇产科专家这样说……

数码要闻

“120W”只是商品或型号名称?央视曝光充电头文字游戏套路

本地新闻

用青花瓷的方式,打开西溪湿地

艺术要闻

安东·爱德华·基尔德鲁普:19世纪丹麦风景画家

军事要闻

意大利议会批准:捐赠航母给印度尼西亚

无障碍浏览 进入关怀版