拉斯维加斯Google Cloud Next大会期间,一个数字让在场的企业技术负责人感到紧迫:云计算用了十年才成熟的FinOps(云成本管理)体系,AI时代只有一年时间来重建。
Finout联合创始人兼CEO Roi Ravhon在这场对话中抛出了这个判断。他的公司与Google Cloud FinOps负责人Pathik Sharma同台,讨论一个正在发生的转变——当AI推理成本以token为单位流动时,传统的云成本管控方法正在失效。
![]()
问题的核心在于token经济学带来的双重不确定性。一方面,尽管token单价持续下降,企业AI支出却在攀升。Ravhon指出,Anthropic和OpenAI近期发布的新旗舰模型"思考量达到3倍",完成相同任务消耗的token更多。另一方面,同一问题的两次提问可能产生截然不同的token消耗——"你问同一个问题两次,每次的token用量都不一样,这怎么规模化?"
CFO们的态度已经转向。Ravhon描述了这一轮周期的变化:起初是"无限预算,先创新再说",现在话题回到了ROI。Google的Sharma用一个比喻回应这种焦虑:别动不动就拿起雷神之锤。他提到有客户"所有场景都用Gemini Pro模型"——写邮件、总结邮件、优化表达——但这些任务完全可以用更小更便宜的Flash模型完成。
真正的FinOps不是让员工背诵哪个模型适合什么任务,而是在底层构建编排层,自动把每个请求路由到能可靠完成任务的最低成本模型。Sharma进一步拆解了AI账单的构成:LLM API支出只是其中一块,GPU和TPU(仍然稀缺)、训练算力、推理算力、数据存储,以及组织层面落地AI的成本都在列。他援引斯坦福大学的最新研究印证了一个早期发现:每1美元的有形技术投资,企业可能要在无形环节花掉多达10美元。
对于刚接触FinOps的人,两人给出了相同的建议:先去FinOps Foundation学习框架,而不是直接找供应商。这个领域变化太快,地基比工具更重要。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.