绝大多数企业现在卡在同一个地方:他们部署了能总结文档、回答常见问题的大模型对话界面,把这些“能聊天的系统”误认作真正的自主能力。从“聊工作”到“做工作”,不是换个提示词就能直线升级——它需要一场架构、风险与治理方式的根本重构。
如果你还把代理式AI当作“更好的提示工程”,那你其实正在忽视一个系统级危险:当你给了大模型生产环境写入权限后,一次参数幻觉就可能变成一次云端基础设施的删除操作。聊天框里编造一个事实是小事,代理发出错误的 DELETE 指令则是灾难。
![]()
这种转变的关键,在于系统范式从线性请求-响应转向了闭环的目标迭代。生成式AI是一条直线:你给输入,模型给输出,本质上是个高级自动补全。代理式AI则是一个循环——它接收目标、制定计划、通过工具执行动作、观察结果,再持续迭代直到完成任务。人的角色从“编曲者”变成“治理者”,AI自己成了编曲者。
正因为此,多数企业的AI试点才无法规模化。它们建在请求-响应范式上,拿概念验证当完整产品,一遇到要求自主规划、感知状态、管理副作用的场景就崩盘。要让组织安全跨过这个坎,需要一个清晰的成熟度模型,让企业从“人盯人的监督”逐步过渡到“人设边界、AI跑完”的治理结构。
我们梳理出四个成熟度等级,帮助团队判断自己离真正的自主还有多远。
第一级:辅助级(人牵头,AI撑腰)
AI扮演的是熟练文员。它负责低风险的草拟和信息检索,所有步骤都由人主推。比如客服人员利用AI根据知识库草拟回复内容。控制方式是人在回路中全程主导,核心考核指标是“首次草稿耗时降低多少”。
第二级:增强级(AI提议,人批准)
AI进一步,不仅能给文字,还能提出具体动作,比如一笔交易的参数或一项配置变更。人依然是最后守门员。一个典型例子是AI分析客户账户后建议为服务中断退款20美元,客服人员必须点击“批准”才能触发退款。此时的控制是人在回路中做审批关,核心指标变成“提议被接受的比率”。
第三级:委托级(AI在护栏内执行)
文章进一步提出了第三级委托,AI开始在预设护栏内自主执行,人从操作审批转向边界管理。不过原报告中对这一级及后续第四级的详细控制方式和关键指标尚未完整展开,但这已指向人不再盯着每一次操作、而是管控例外和边界的治理形态。
从第一级到更高阶段,不是在修修补补中堆叠功能,而是重新分配人与机器的决策权。当企业看清这套成熟度阶梯,就不会再把能聊天的界面当作落地自主AI的终点。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.