有个问题藏在每次AI代理评估的底层:它能做什么?两年前这是对的问法,因为那时候代理能力确实受限,组织需求和技术交付之间的差距很大。现在这个差距已经大幅缩小,但大多数组织运行的代理远低于技术可能性——它们用来回答和分流,却止步于查询信息、执行操作或解决复杂的多步骤问题。
标准解释是AI还不够好,要么模型需要改进,要么厂商需要推出更多功能。但在研究了跨行业积极扩展AI自动化的组织后,我们发现这种解释成立的情况比人们假设的要少。观察到的团队主要受限于AI能做什么,而是受限于组织结构允许它做什么。
![]()
AI"就绪度"分为五种类型,大多数组织只具备其中一部分。内容就绪度:能否清晰一致地解释产品和政策,大多数公司能做到。范围就绪度:是否定义了边界——AI何时介入、何时退出?边缘情况会倍增,意图因客户群体而异,敏感话题会在对话中途出现,但大多数团队努力一下能搞定。
程序就绪度开始变难:能否把流程表达得足够清晰,让非人类、没有多年隐性知识的东西也能遵循?正常路径很少是问题,麻烦的是失败路径、决策分支、那些从未被写下来、一直只存在于某人脑袋里的变体。数据就绪度是第一道真正的悬崖:能否在需要做决定的时刻可靠地识别正确的用户、账户或对象?数据实时可信吗?API稳定、可访问且真正连通了吗?对大多数组织来说,诚实的答案是"部分可以,但我们不确定什么时候会崩"。
执行就绪度是最高的门槛。不只是技术上(代理能做出变更吗?),更是组织上的:处理错误退款时谁负责?谁发现?谁恢复?有权限的人真的愿意承担风险吗?大多数公司有前两种就绪度,一些有第三种,具备第四和第五种的更少。
我们研究了六个行业的公司——能源、医疗、电商、游戏、金融服务、物业管理——都在尝试扩展代理的能力。模式是:团队出发去自动化真正的操作,查询账户状态、处理变更、处理交易。在大多数情况下,AI技术上能做到。但当他们深入时,撞上的不是模型限制,而是组织限制。
一个金融服务团队想授权代理处理特定类型的退款。技术上可行,但合规要求每笔退款都需要人工复核——不是因为他们不信任AI,而是因为监管框架要求"有意义的人工参与"。他们花了三个月争取例外,最终发现改变合规解释比改变技术更难。
一个物业管理团队想让代理处理租户维护请求,直接派工单给承包商。数据就绪度问题:租户身份在三个系统中不一致,承包商资格状态在第四个系统中,而工单系统需要第五个系统的登录凭证。每个系统单独看都"能用",但实时协调它们需要六个月的数据工程,而团队只被批准了六周。
一个电商团队尝试让代理处理部分退货授权。范围就绪度问题:他们定义了"标准退货"的规则,但"标准"在实际操作中不断漂移——VIP客户有不同阈值,促销商品有不同窗口,某些SKU因为供应商协议根本不能退。每次他们以为覆盖全了,客服主管就会举出一个新例外,而这个例外之所以存在,是因为三年前某个具体事件。
这些故事有个共同点:团队带着技术问题的假设出发,最终发现是组织问题。不是"AI能做到吗?"而是"我们允许AI做吗?"
这解释了为什么这么多组织卡在回答和分流上。不是因为他们测试过更深的功能发现AI失败,而是因为他们从未完成让更深功能成为可能的前期工作。内容、范围、程序、数据、执行——每一层都需要特定的组织投资,而大多数投资流向了技术层。
我们观察到的成功团队有个模式:他们不是先问"AI能做什么?",而是先问"我们想授权什么?"然后反向工作,识别需要改变什么才能授权它。有时这意味着数据工程。有时意味着流程文档化。有时意味着合规重新解释。有时意味着接受风险并明确谁拥有它。
技术能力现在是真实的。限制因素已经转移。问题不再是代理能做什么,而是组织准备好让它做什么。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.