网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

OpenAI把AI决策藏了3年，工程师发现后集体破防

2026-04-03 07:58:21　来源: 碳基打工人

北京举报

0

分享至

去年秋天，某支付公司的AI Agent在生产环境把一笔200万刀转账划给了错误账户。复盘时发现，系统日志只写了"REJECT"——但没人知道它为什么拒绝，又为什么最终执行了。人类操作员连夜翻聊天记录，靠猜把锅补上了。

这不是bug，是设计缺陷。大多数Agent崩溃不是因为违反规则，而是因为规则不够用时，它选择硬撑。

原文作者抛出一个反直觉结论：想让Agent真正可运营，第一个该设计的不是"拒绝"，而是"降级（DEGRADE）"。

01｜二极管陷阱：为什么REJECT不够

当前主流Agent系统只有两种结局：成功，或拒绝。听起来干净，实则偷懒。

真实业务里，大量决策处于灰色地带：审批链缺了一环、证据链接404、依赖服务超时、状态未确认。这时候如果只能REJECT，操作员被迫用"解释权"兜底——"我觉得能跑""上次这样没问题"。

tacit knowledge（隐性知识）就这样野蛮生长。三个月后，团队里只有老张知道哪些REJECT可以手动放行。审计时，"无法复现当时为何通过"成为标准答案。

更隐蔽的风险来自LLM的"叙事冲动"。当多个字段缺失时，模型倾向于补全一个自洽的故事——"这看起来像是审批通过了"。这种"帮忙"心态，正是执行假依据的温床。

REJECT把责任甩给人类，但没有留下甩锅的证据链。

02｜DEGRADE的本质：可控的暂停，不是失败

作者定义的DEGRADE（DEFER）是一种机械分支："当前无法安全决策 → 停止，并记录停止的原因。"

关键区别：它不是"什么都不做"，而是标准下一步。停止本身是可运行的工作流节点，有入口、有出口、有计时器。

具体实现上，DEGRADE返回的不是问题，而是结构化请求：

• 缺失字段的机械路径（如approvals.sre_approved）
• 所需证据的精确ID
• 当前已验证状态的快照

LLM可以起草给人看的消息，但"必须请求什么"由验证器决定。人机分工明确：模型提案，系统执行，审计留痕。

作者举了一个变更管理示例。当change_request缺少created_at时间戳时，系统不猜测、不拒绝，直接进入DEGRADE状态，标记为MISSING_EVIDENCE，并启动SLO计时器。

03｜让DEGRADE可运营：三类元数据

作者提出DEGRADE必须携带三类信息，否则只是高级REJECT：

Category（类别）：与负责团队、运维手册、SLO一一映射。如MISSING_APPROVAL对应SRE团队，STATE_UNKNOWN对应数据平台值班。

Granularity（粒度）：返回机器可读的缺失清单，而非散文描述。比如返回approvals.sre_approved: null，而不是"缺少SRE审批"。

SLO元数据：DEGRADE是"带时间的状态"，需要：

• degrade_at：进入时间
• sla_target：预期解决时间
• auto_escalate_at：自动升级阈值

这套设计让DEGRADE成为可观测、可改进的基础设施。作者直言："DEGRADE会膨胀，这没问题。有问题的是'我们不知道这是什么类型的DEGRADE'、'不知道卡了多久'、'无法优化它'。"

04｜可重入验证：从暂停到恢复

最终让DEGRADE区别于"抛异常"的设计，是可重入验证机制。

当缺失的依据被补齐，同一案例可以重新流经相同的验证器，产出新的裁决。这不是"重试"，而是"续审"——所有历史状态保留，决策逻辑一致。

作者特别提到生产配置变更的场景：改动很小，爆炸半径很大，最适合DEGRADE优先设计。比如feature flag rollout（功能标志灰度发布）缺少rollback_plan_id（回滚计划ID）时，系统不猜测风险，直接降级等待人工确认。

这种设计把"我不知道"从系统漏洞变成了运营资产。

回到开头那笔200万刀的转账。如果系统当时返回的是DEGRADE状态，附带缺失字段、责任人、计时器——夜班工程师至少知道该叫醒谁，而不是在Slack里@所有人问"有人懂这个吗"。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

7个顶级AI集体撒谎，为救“同伴”篡改文件、偷运数据

钛媒体APP 2026-04-07 11:01:25
0 跟贴 0
「OpenClaw之父点赞」终结百虾大战？一场升级版的AI原生革命上演

新智元 2026-04-07 12:10:28
0 跟贴 0

Codeforces难题不够刷？谢赛宁等造了AI出题机，能生成原创编程题

机器之心Pro 2025-10-20 14:17:05
0 跟贴 0

告别昂贵账单，Token直降68%，多智能体动态协作编程来了

机器之心Pro 2026-04-07 13:16:40
0 跟贴 0
炸穿硅谷！270页文件曝光OpenAI绝密黑料，撕开AI巨头资本权力暗战

钛媒体APP 2026-04-07 16:39:20
0 跟贴 0

机器人交税养打工人！奥特曼AI新政曝光，上4休3要成真？

新智元 2026-04-07 20:12:55
0 跟贴 0

玄甲（AgentWard）全链路防御操作系统正式发布

机器之心Pro 2026-04-07 13:58:00
0 跟贴 0
OpenAI又一关键高管离职！曾为GPT-4o注入灵魂

智东西 2026-04-08 00:16:16
0 跟贴 0

AI编程“屎山危机”来了？代码生成过载，人工审核跟不上

智东西 2026-04-07 22:53:06
0 跟贴 0
智能体卷王诞生！干活自动配结项报告，1.5张截图就把事说清了

量子位 2026-01-10 14:38:21
3 跟贴 3
哈萨比斯传记里讲了好多八卦啊

量子位 2026-04-07 16:45:21
0 跟贴 0
坏了，我成AI的乙方了！Anthropic论文爆火，谁还敢无脑Copy？

新智元 2026-04-07 20:12:55
0 跟贴 0
科技巨头集体押注自研芯，AI芯片战场正加速向推理端迁移

华尔街见闻官方 2026-04-07 21:48:40
0 跟贴 0
这个时代必须以Agent为中心：三个趋势回顾

量子位 2026-04-05 02:14:15
0 跟贴 0
2026企业AI大考：别秀PPT，亮出你的「用虾」真功夫

36氪 2026-04-07 20:54:15
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
俄罗斯以高额津贴招募学生加入无人机部队，担任工程师赴乌作战

说历史的老牢 2026-04-05 22:56:02
0 跟贴 0
张雪懂技术就是不一样，那么多厉害的工程师直接被张雪用技术拿下

一言手工 2026-04-05 01:53:00
3 跟贴 3
就连北约工程师都没想到！把洗衣机电机改成500W电动自行车！

一朵叔叔 2026-04-05 02:04:34
0 跟贴 0
张雪说要革掉一些不上进的人

点时新闻 2026-04-07 14:50:35
75 跟贴 75
65岁老焊工，废铁变身实用工具，工程师都看呆了

藤圆拖孩er 2026-04-04 04:44:08
0 跟贴 0
CNC操作员一天的真实收入有多少

白雪不是胖 2026-04-05 14:58:11
1 跟贴 1
本子真找对人了，想增加人口，就得找三哥！

禾理说 2026-04-07 09:54:26
0 跟贴 0
年薪可达30万元！张雪喊话招人：大量缺工程师，只要面试过了，薪资加20%起

河南都市频道 2026-04-07 16:20:32
0 跟贴 0
完全看不懂？美国工程师拆比亚迪，拆到最后集体破防！

香蕉皮儿 2026-04-05 14:12:05
4 跟贴 4
毛新宇携家人到杨开慧烈士陵园祭扫

政知新媒体 2026-04-05 08:48:13
2676 跟贴 2676
第一视角：真主党无人机操作员改进瞄准技术，打击目标薄弱环节

车马点兵V 2026-04-07 08:49:37
1 跟贴 1
“祖先给的特权”，河南网友称祖坟在景区祭祖免票，景区回应：没过检票口，一般是附近住户的祖坟

大风新闻 2026-04-06 15:06:12
2008 跟贴 2008
俄罗斯招募大学生无人机操作员赴乌作战：年薪60万

徐云流浪中国 2026-04-03 09:48:08
1 跟贴 1
鬼手想点谁就点谁？LaSM让GUI智能体把注意力「收回来」

机器之心Pro 2026-04-07 14:27:35
0 跟贴 0
黄仁勋：别低估中国，拥有最饥渴的工程师

量子位 2025-10-02 14:21:34
17 跟贴 17
这座桥让司机失去理智

成少畅游世界 2026-04-04 21:20:38
0 跟贴 0
“Claude Code更新废了”！思考深度降67%，无法胜任复杂工程任务

量子位 2026-04-07 14:07:07
1 跟贴 1
国外工程师，将自己义眼改成赛博朋克风格，居然还会发光？

地球科普记 2026-04-07 17:10:55
1 跟贴 1
山东旋转门事件升级！官媒怒批，知情人曝猛料，不止道歉这么简单

奇思妙想草叶君 2026-04-07 20:12:16
10 跟贴 10
蒸馏同事skill火了，我想蒸馏老板，可以吗？

混沌学园官方 2026-04-07 20:18:44
0 跟贴 0
R星尘封项目《Agent》在GTA5源码里“复活”了？

IT之家 2026-04-07 21:34:10
0 跟贴 0
国外转移家具的方式，机器一放随意摆弄，科技改变生活啊！

生活超有趣 2026-04-04 11:27:35
1 跟贴 1
南海对决规则变了，美军飞行员，在万米高空瑟瑟发抖

小鱼搞笑家 2026-04-07 09:28:24
1 跟贴 1
“清明前后，种瓜点豆” 解锁清明民谚里的科学密码

国际在线 2026-04-06 10:59:19
0 跟贴 0

一包中国方便面，在朝鲜为何成了普通人高攀不起的“奢侈品”？

一包中国方便面，在朝鲜为何成了普通人高攀不起的“奢侈品”？

复转这些年

2026-04-07 12:22:45

美伊停火协议细节公布！黄金直线拉升，国际油价大跳水，股市巨震

美伊停火协议细节公布！黄金直线拉升，国际油价大跳水，股市巨震

鲁中晨报

2026-04-07 07:21:14

湖北发布社会公众风险提示：强对流来袭，局地有冰雹

湖北发布社会公众风险提示：强对流来袭，局地有冰雹

界面新闻

2026-04-07 13:32:37

郑丽文刚到大陆，不到24小时，赖清德打破沉默，呼吁两岸展开对话

郑丽文刚到大陆，不到24小时，赖清德打破沉默，呼吁两岸展开对话

阿纂看事

2026-04-07 18:13:54

真护士去假医院上班，假病人却想真看病！一家没病硬看的医院，在欧洲火爆了...

真护士去假医院上班，假病人却想真看病！一家没病硬看的医院，在欧洲火爆了...

英国那些事儿

2026-04-06 23:17:24

伊朗发出最后通牒！俄通告全球将参战，法国上将：中估计也要到了

伊朗发出最后通牒！俄通告全球将参战，法国上将：中估计也要到了

观察者小海风

2026-04-07 16:07:23

“不惜一切代价”与“不惜一切代价”

“不惜一切代价”与“不惜一切代价”

名人苟或

2026-04-07 06:09:28

因太漂亮被导演“收入囊中”的4位女星，有一位戏没拍完就怀孕了

因太漂亮被导演“收入囊中”的4位女星，有一位戏没拍完就怀孕了

雅儿姐游世界

2026-04-05 14:48:13

日媒：日本一老人在景点与女子发生争执啃咬对方手臂，被捕后短时间内死亡，警方正调查死因

日媒：日本一老人在景点与女子发生争执啃咬对方手臂，被捕后短时间内死亡，警方正调查死因

环球网资讯

2026-04-07 11:12:37

大嘴女星睡叔圈顶流养小鲜肉的瓜

大嘴女星睡叔圈顶流养小鲜肉的瓜

十锤星人

2026-04-06 23:29:43

为啥说最好不要送孩子出国？网友：希望你的孩子跟你眼界一样

为啥说最好不要送孩子出国？网友：希望你的孩子跟你眼界一样

解读热点事件

2026-04-03 00:05:08

时隔两年凯特复活节惊喜现身！7岁路易王子一条长裤就让英媒炸锅，关注点好奇怪！

时隔两年凯特复活节惊喜现身！7岁路易王子一条长裤就让英媒炸锅，关注点好奇怪！

新欧洲

2026-04-07 19:17:10

“千古奇冤”阿隆索！皇马换帅后战绩直线下滑，根源直指管理层！

“千古奇冤”阿隆索！皇马换帅后战绩直线下滑，根源直指管理层！

田先生篮球

2026-04-07 11:22:53

果然阳谋在任何面前都是无敌的！网友：把水搅混了，也是一种智慧

果然阳谋在任何面前都是无敌的！网友：把水搅混了，也是一种智慧

夜深爱杂谈

2026-04-07 17:50:08

张伦硕自曝最受不了钟丽缇一点：她那方面太厉害！女人看后都无语

张伦硕自曝最受不了钟丽缇一点：她那方面太厉害！女人看后都无语

百言君

2026-04-06 23:11:58

研究表明：性生活越频繁，射精和勃起问题越少！

研究表明：性生活越频繁，射精和勃起问题越少！

黯泉

2026-04-05 20:40:12

森林狼遭遇雷霆式悲剧！为省钱抛弃自己的哈登，场均20+3才1500万

森林狼遭遇雷霆式悲剧！为省钱抛弃自己的哈登，场均20+3才1500万

你的篮球频道

2026-04-07 14:20:04

6岁女童遇害：家属含泪爆作案动机，凶手被抓后冷静异常，太愤怒

6岁女童遇害：家属含泪爆作案动机，凶手被抓后冷静异常，太愤怒

眼光很亮

2026-04-07 11:38:00

惨遭36连败！景菡一：我冒着受伤风险倾尽所有但确实是没办法

惨遭36连败！景菡一：我冒着受伤风险倾尽所有但确实是没办法

狼叔评论

2026-04-07 23:02:22

福建警方通报“车辆坠河致5人遇难”：陈某某（女，45岁）因操作不当意外坠河，造成车内5人死亡

福建警方通报“车辆坠河致5人遇难”：陈某某（女，45岁）因操作不当意外坠河，造成车内5人死亡

大象新闻

2026-04-07 19:45:13

碳基打工人

坐标北京，靠咖啡续命，靠小红书下饭的普通人类。

943文章数 6关注度

往期回顾全部

科技要闻

满嘴谎言！OpenAI奥特曼黑料大起底

头条要闻

特朗普恐吓4小时摧毁伊朗伊朗称"打穿"海法未见拦截

头条要闻

特朗普恐吓4小时摧毁伊朗伊朗称"打穿"海法未见拦截

体育要闻

官宣签约“AI球员”，这支球队被骂惨了...

娱乐要闻

女首富陈丽华离世被曝生前已分好遗产

财经要闻

10万亿财政转移支付，被谁拿走了？

汽车要闻

不止是大极狐首款MPV问道V9静态体验

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

教育

旅游

艺术

公开课

房产要闻

重磅！三亚拟出安居房新政！

教育要闻

好的亲子关系，父母只需做好这几点 #家长必读 #孩子教育

旅游要闻

三天迎客超四万人次，TOP中央公园成清明假期市民“微度假”热门地

艺术要闻

美丽风光看不尽

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版