十二个月前,三位工程师盯着同一块 Datadog 仪表板,每月烧掉 4200 美元 AI 基础设施费,居然没一个人能说清楚这些钱被哪个功能花掉了。两个监控工具、一个仪表板,统统只能回答“花了多少”——却没人追问“哪个功能在烧钱”“哪个用户触发的”“哪个服务调用的”。当账单开始失控时,这三个数字才是唯一值得看的。
那个下午,他们终于给每一次大模型调用打上了功能、服务和用户标签。48 小时的数据跑出来,团队立刻意识到自己之前的直觉错得离谱。不到半杯咖啡的时间,每个功能的真实成本赤裸裸摊在眼前,和大家的“感觉排名”完全相反。
![]()
先来看看这六项接入 GPT-4o 的功能:合同分析器,上传文档时自动提取条款并标记风险;执行摘要生成器,用户主动请求时按需运行;智能搜索,跨文档库做语义检索;合规检查器,每次文档保存都跑一遍;内联红线建议器,选中文本时触发;审计跟踪叙述器,每晚为文档生成人类可读的审计日志。团队原以为合同分析器最烧钱,其次是智能搜索,剩下几个不过是零头。收入影响方面,他们也笃定合同分析器和执行摘要生成器是推动用户升级的主力。结果,两样全都猜反了。
实际归因数据甩在脸上:
合规检查器,月费 1890 美元,吞掉总预算的 45%,平均每次调用 0.087 美元;
审计跟踪叙述器,月费 1102 美元,占 26%,每次 0.24 美元;
合同分析器,672 美元,仅占 16%,每次 0.31 美元;
执行摘要生成器,294 美元,7%,每次 0.18 美元;
智能搜索,168 美元,4%,每次 0.021 美元;
内联红线建议器,74 美元,2%,每次不到一美分。
被团队寄予厚望、花了两周拼命优化的合同分析器,只排在第三。而两个从未在任何一次成本复盘会上被提起的功能,正联手吞掉 71% 的预算。
合规检查器,月耗 1890 美元,零报错,零超时,零失败请求,没有任何一条告警被触发。每一条日志都干净得像教科书。它通过设计完美地浪费钱:文档自动保存间隔设为 30 秒,40 个活跃企业用户意味着每小时 4800 次调用,每个工作日开足马力。功能并没有“坏掉”,坏掉的是设计——堆栈里没有任何机制能区分“正确运行”和“昂贵运行”,因为在响应层面它们长得一模一样。修复干净到只有一行代码:把合规检查从每次自动保存的钩子拆下来,改成只在手动触发和文档提交时运行。月费应声断崖式下跌,从 1890 美元变成 190 美元。
审计跟踪叙述器的账单同样骇人:每月 1102 美元,至少 60% 纯属浪费。它按计划夜间运行,为所有有活动记录的文档生成完整叙述,包括那些被自动化流程、系统集成、后台作业摸过的文档。这意味着大约六成文档的审计日志根本没有任何人类读者——他们在为空无一人的观众席写散文,夜夜如此。修复方案很朴素:只对由人工操作触发的活动生成叙述,且至少积累三次人工编辑后再运行。成本随即收缩到原来的零头。
最讽刺的地方在于:当团队以为自己在死磕最耗钱的功能时,真正的吞金兽正安静地趴在最不起眼的角落里,从不触发警报,从不出错,每月稳稳收走一大笔账单。数据归因之前,所有的优化冲动都打在棉花上,花两周死磕合同分析器,不如一行代码把自动保存的钩子松开。
工具链不能只会统计总量,必须回答“哪个功能”“哪个用户”“哪个服务”——账单攀高时,缺了这三个数字的任何成本复盘都是瞎子摸象。那 48 小时的归因数据,比三个月的人肉直觉值钱得多。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.