「不是每一步都需要批准,而是要知道哪一步该批准。」——这句话来自奥莱利(O'Reilly)技术雷达的最新观察,戳中了当前AI架构设计中最尴尬的矛盾。
企业AI正从「建议工具」变成「自主执行体」,但治理思路还停留在人工审核时代。结果?要么系统慢到没法用,要么工程师偷偷绕过控制。这篇文章拆解了生产环境中真实的解法:不是取消控制,而是把控制拆成「快路径」和「慢路径」。
![]()
「同步审批」幻觉的崩塌
![]()
第一代企业AI很简单:模型出建议,人类点确认。治理可以慢、可以人工、可以偶尔为之。
现在的智能体(agentic)系统完全不同。它们分解任务、调用工具、检索数据、协调行动——决策不再是离散事件,而是持续执行循环的一部分。
一旦把治理框架为「每一步都要批准」,架构就会滑向两种结局:要么慢到不可用,要么团队悄悄绕过控制保运行。两种都不安全。
关键错误在于把治理当成「同步闸门」而非「调节机制」。真正的问题不是「要不要管」,而是「哪些决策真的需要同步控制」。
全面中介为何必然失败
让每个决策都过一遍控制平面,听起来更安全,直到工程师真去搭。
成本立刻显现:
延迟在多步推理循环中累积;控制系统变成单点故障;误报阻断正常行为;协调开销拖垮吞吐量。
更隐蔽的是组织层面的腐蚀。当控制成为瓶颈,团队会创造「影子流程」绕过它。治理没有消失,只是变得不可见、不可审计。
奥莱利的作者指出,这不是技术债,是设计哲学的根本错误:把治理等同于审批,而非反馈。
快路径与慢路径的切分逻辑
生产系统的实际解法是分层治理。核心洞察:不同决策对延迟和审查的敏感度完全不同。
快路径留给低风险的自主执行。特征很明确:上下文受限、工具边界清晰、错误成本可控、可快速回滚。比如格式化输出、标准API调用、已知模式的数据检索。
这些不需要实时审批。治理后置:日志记录、采样审计、异常触发审查。
慢路径保留给高风险的同步控制。触发条件包括:涉及敏感数据、调用外部系统、不可逆操作、偏离历史行为模式。这时才启动人工审批或自动策略检查。
切分标准不是技术性的,是业务性的。同样一个工具调用,在测试环境走快路径,在生产环境可能走慢路径。同一生产环境里,对普通用户快,对VIP账户慢。
治理作为反馈问题
传统思路把治理画成流水线:输入→审批→执行。这假设我们能预判所有风险。
实际系统用的是反馈回路:执行→观测→评估→调整。治理不阻止行动,而是塑造行动分布。
具体做法包括:实时行为画像,标记偏离基线的模式;影响分级,自动匹配审查深度;事后归因,把结果反馈到策略更新;渐进式放行,新行为先小流量验证。
这种设计承认一个事实:我们无法预先知道所有坏情况,但可以快速识别和响应。
架构层面的具体实现
![]()
快路径的实现依赖几个技术选择:
本地策略引擎替代远程调用,把决策延迟从毫秒级压到微秒级;预授权令牌,对已知安全模式提前签发凭证;执行沙箱,限制快路径能触及的资源边界;结构化输出约束,用JSON Schema等机制在生成阶段就限制可能空间。
慢路径则强调可观测性:决策链路追踪,记录为什么某个调用被标记为高风险;人工审查队列,设计优先级和升级机制;策略版本控制,确保审计时能还原当时的判断依据。
关键设计原则:两条路径必须共享同一套身份、同一套审计日志、同一套策略语言。否则快路径会变成治理黑洞。
组织配合:比技术更难的部分
技术切分只是开始。真正的摩擦在组织层面:
谁有权定义快/慢标准?通常是跨部门的「AI治理委员会」,但执行效率往往堪忧。
误报怎么处理?安全团队倾向宁可错杀,业务团队倾向宁可放过。需要明确的升级协议和定期复盘机制。
影子流程怎么消除?不是加更多锁,而是让正式流程快到不需要绕路。
奥莱利的观察很直接:治理系统的可用性决定其有效性。如果工程师需要走流程的时间超过写绕过代码的时间,绕过就会发生。
一个具体场景的推演
假设一个客服智能体,需要决定是否给客户退款。
快路径场景:金额低于50美元、客户历史信誉良好、产品类别在预授权列表里。系统直接执行,事后抽样审计。
慢路径触发:金额超过阈值、客户有争议记录、产品属于高欺诈品类、或智能体的置信度评分低于历史基线。转人工审批,同时冻结相关账户权限。
边界情况:金额刚好在阈值边缘。这时不是简单四舍五入,而是启动「增强观测」模式——执行,但实时标记,缩短审计周期,自动通知风控团队。
这个设计的聪明之处:没有试图预判所有风险,而是建立快速识别和响应的能力。
为什么现在必须面对这个问题
早期AI系统可以靠堆人解决治理。模型输出不多,人工审得过来。
多智能体环境改变了算术。一个任务可能触发数十次工具调用,跨多个系统,持续数分钟甚至数小时。同步审批在数学上就不可能。
更紧迫的是竞争压力。延迟每增加100毫秒,转化率就掉一点。完全受控的系统和完全自主的系统之间,存在一个巨大的商业空间,属于那些能找到正确切分点的团队。
奥莱利的作者最后抛出一个判断:未来12-18个月,「快路径/慢路径」会成为AI架构的标准词汇,就像当年的「微服务」或「事件驱动」。不是因为这个词多优雅,而是因为问题太普遍,而现有方案太糟糕。
你的团队现在是怎么处理这个张力的?是硬上同步审批,还是已经摸索出了某种分层策略?或者更诚实一点——你们有没有发现工程师在偷偷绕过控制?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.