你的AI代理能干活，但组织不让它干|大多数|自动化|承包商|ai代理

你的AI代理能干活，但组织不让它干

2026-05-19 03:17:28　来源: 摸鱼算法

北京举报

分享至

有个问题藏在每次AI代理评估的底层：它能做什么？两年前这是对的问法，因为那时候代理能力确实受限，组织需求和技术交付之间的差距很大。现在这个差距已经大幅缩小，但大多数组织运行的代理远低于技术可能性——它们用来回答和分流，却止步于查询信息、执行操作或解决复杂的多步骤问题。

标准解释是AI还不够好，要么模型需要改进，要么厂商需要推出更多功能。但在研究了跨行业积极扩展AI自动化的组织后，我们发现这种解释成立的情况比人们假设的要少。观察到的团队主要受限于AI能做什么，而是受限于组织结构允许它做什么。

AI"就绪度"分为五种类型，大多数组织只具备其中一部分。内容就绪度：能否清晰一致地解释产品和政策，大多数公司能做到。范围就绪度：是否定义了边界——AI何时介入、何时退出？边缘情况会倍增，意图因客户群体而异，敏感话题会在对话中途出现，但大多数团队努力一下能搞定。

程序就绪度开始变难：能否把流程表达得足够清晰，让非人类、没有多年隐性知识的东西也能遵循？正常路径很少是问题，麻烦的是失败路径、决策分支、那些从未被写下来、一直只存在于某人脑袋里的变体。数据就绪度是第一道真正的悬崖：能否在需要做决定的时刻可靠地识别正确的用户、账户或对象？数据实时可信吗？API稳定、可访问且真正连通了吗？对大多数组织来说，诚实的答案是"部分可以，但我们不确定什么时候会崩"。

执行就绪度是最高的门槛。不只是技术上（代理能做出变更吗？），更是组织上的：处理错误退款时谁负责？谁发现？谁恢复？有权限的人真的愿意承担风险吗？大多数公司有前两种就绪度，一些有第三种，具备第四和第五种的更少。

我们研究了六个行业的公司——能源、医疗、电商、游戏、金融服务、物业管理——都在尝试扩展代理的能力。模式是：团队出发去自动化真正的操作，查询账户状态、处理变更、处理交易。在大多数情况下，AI技术上能做到。但当他们深入时，撞上的不是模型限制，而是组织限制。

一个金融服务团队想授权代理处理特定类型的退款。技术上可行，但合规要求每笔退款都需要人工复核——不是因为他们不信任AI，而是因为监管框架要求"有意义的人工参与"。他们花了三个月争取例外，最终发现改变合规解释比改变技术更难。

一个物业管理团队想让代理处理租户维护请求，直接派工单给承包商。数据就绪度问题：租户身份在三个系统中不一致，承包商资格状态在第四个系统中，而工单系统需要第五个系统的登录凭证。每个系统单独看都"能用"，但实时协调它们需要六个月的数据工程，而团队只被批准了六周。

一个电商团队尝试让代理处理部分退货授权。范围就绪度问题：他们定义了"标准退货"的规则，但"标准"在实际操作中不断漂移——VIP客户有不同阈值，促销商品有不同窗口，某些SKU因为供应商协议根本不能退。每次他们以为覆盖全了，客服主管就会举出一个新例外，而这个例外之所以存在，是因为三年前某个具体事件。

这些故事有个共同点：团队带着技术问题的假设出发，最终发现是组织问题。不是"AI能做到吗？"而是"我们允许AI做吗？"

这解释了为什么这么多组织卡在回答和分流上。不是因为他们测试过更深的功能发现AI失败，而是因为他们从未完成让更深功能成为可能的前期工作。内容、范围、程序、数据、执行——每一层都需要特定的组织投资，而大多数投资流向了技术层。

我们观察到的成功团队有个模式：他们不是先问"AI能做什么？"，而是先问"我们想授权什么？"然后反向工作，识别需要改变什么才能授权它。有时这意味着数据工程。有时意味着流程文档化。有时意味着合规重新解释。有时意味着接受风险并明确谁拥有它。

技术能力现在是真实的。限制因素已经转移。问题不再是代理能做什么，而是组织准备好让它做什么。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.