去年,某SaaS公司把GPT-4接进客服系统,三个月后悄悄下线了。不是模型变笨了,是销售团队发现了一个尴尬事实——AI能写出完美的 escalation 流程(升级处理流程),却连一条真实的 Case 状态都改不了。
这像极了那个经典场景:你问朋友"怎么追女生",他能聊三小时心理学;你真让他帮你发微信,他连手机都不敢碰。
大型语言模型(LLM,大语言模型)的局限,就藏在这种"能说不能做"的裂缝里。
01 为什么AI看起来什么都懂
LLM的核心机制很简单:根据上下文预测下一个词。它不是在"理解"问题,而是在模仿人类表达的模式。
当你问"如何处理高优先级Salesforce工单",它不会真的登录你的Service Cloud查看配置,不会检查升级规则,不会读取实时数据。它只是生成一段在训练数据中出现过的、听起来合理的回答。
这个回答可能对,可能错,可能半对半错。三种结果来自同一个机制。
但问题是——它说得太好了。结构清晰,术语准确,甚至能引用你公司的内部缩写。这种"拟态智能"让人产生一个危险幻觉:它好像真的在操作我的系统。
幻觉的代价很具体。某金融科技公司曾让LLM自动生成合规报告,模型输出了12页专业文档,引用条款、标注风险点,格式无可挑剔。直到审计时发现,它把2023年已废止的法规当成现行标准,还"自信地"编了三条不存在的司法解释。
没人教它撒谎。它只是在做自己最擅长的事:生成看起来像正确答案的内容。
02 从"说话"到"做事"的断层
真正的业务动作需要改变系统状态。创建工单、更新库存、触发审批、发送通知——这些不是语言任务,是执行操作。
LLM天生不具备这种能力。它不连接API,不管理事务,不处理并发,也不持久化记忆。每次对话都是独立的上下文窗口,关掉页面就归零。
这就解释了为什么"AI客服"demo总是惊艳,上线后却让用户抓狂。它能解释退货政策,但无法真的发起退货;它能描述故障排查步骤,但无法远程诊断设备;它能写代码,但无法部署到生产环境。
某云厂商的产品经理跟我吐槽:"我们给客户演示时,AI回答准确率92%。上线两周后跌到34%,因为demo问题是筛选过的,真实用户的问题它没见过。"
差距不在模型能力,在场景复杂度。实验室里的对话是封闭的、可控的;真实业务是开放的、动态的、需要跨系统协作的。
03 Agent架构:给语言模型装上手脚
解决思路不是换更大的模型,是改变架构。Agent(智能体)设计的核心,就是把LLM从"独白者"变成"执行者"。
具体怎么做?给模型三个新能力:工具调用、规划推理、记忆管理。
工具调用让模型能操作外部系统。不是生成一段"建议你去更新数据库"的文字,而是真的调用SQL接口执行UPDATE。规划推理让它把复杂任务拆解成可执行的步骤序列,比如"查库存→锁库存→生成订单→触发物流"。记忆管理则解决上下文丢失问题,让跨会话的业务流程能持续追踪。
但这引入了新的工程挑战。工具调用需要精确的权限控制,你不能让AI随便删生产数据。规划推理需要容错机制,某一步失败了怎么回滚、怎么重试、怎么通知用户。记忆管理则涉及数据安全和隐私合规——AI记住的敏感信息存在哪、谁有权访问、保留多久,都是实打实的架构决策。
某头部CRM厂商的架构师透露,他们把GPT-4接入内部系统时,花了70%的时间在"安全沙箱"和"人工确认节点"上,只有30%精力在调模型。"LLM是容易的部分,让它安全地做事才是硬仗。"
04 2024年的现实:还在搭脚手架
Agent概念火了,但落地还在早期。目前主流方案分两类:一类是"编排式Agent",用确定性工作流包裹LLM,模型只负责特定决策点;另一类是"自主式Agent",给模型更大自由度,但配套更重的监控和拦截机制。
两类方案都在进化。LangChain、LlamaIndex等框架降低了开发门槛,但生产环境的稳定性、可观测性、成本可控性,仍是大多数团队的头号痛点。
一个被低估的事实是:Agent不是让AI更"聪明",而是让系统更"可控"。企业真正需要的不是能聊天的AI,是能被审计、被回滚、被问责的自动化。
某制造业CIO的说法很直接:"我不在乎AI是不是理解了业务流程,我在乎的是它改数据时有没有留痕、出错时能不能一键回退、审计时能不能解释为什么这么做。"
这些需求,纯LLM架构满足不了。
回到开头那个Salesforce案例。那家公司最终怎么解决的?他们没有放弃AI,而是重构了架构:LLM负责理解用户意图、提取关键信息,真正的系统操作交给传统的规则引擎和API网关。AI成了"翻译官"和"调度员",而不是"执行者"。
准确率回到了可用区间,虽然体验不如纯AI方案"丝滑",但至少不会擅自把VIP客户的工单标记为"已解决"。
这个妥协本身说明了一个问题:当技术演示和业务落地之间出现鸿沟时,你选择填坑还是换路?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.