Serverless(无服务器架构)曾承诺让工程师告别运维噩梦。一家公司的账单却从每月400美元暴涨到1.8万美元——涨幅45倍。
他们最终把核心服务迁回了最原始的虚拟机。这个决定背后,是一整套被行业叙事掩盖的成本真相。
「我们以为在省钱,直到看到账单」
2023年初,这家公司的技术栈全面转向AWS Lambda。动机很典型:消除服务器管理负担,让团队专注业务代码。
Lambda的计费模型按请求数和执行时间收费。单价看起来便宜:每百万请求0.20美元,每GB-秒0.0000166667美元。
问题出在规模曲线的拐点之后。
当业务增长、请求量激增时,Lambda的成本结构呈现指数级上升。该公司没有公开具体业务量,但透露了一个关键数字:同等负载下,Lambda账单是原EC2(弹性计算云,亚马逊虚拟机服务)方案的45倍。
更隐蔽的是冷启动延迟。Lambda函数闲置后重新加载需要数百毫秒,高并发场景下用户体验明显受损。团队被迫引入Provisioned Concurrency(预置并发)来保持函数常驻——这本质上是在为"无服务器"支付服务器费用,单价还更高。
AWS的定价页面不会告诉你这些。它展示的是理想场景: sporadic(零星)请求、短执行时间、无需持续运行。
迁回EC2:一场「开倒车」的技术决策
2024年,团队开始将核心服务从Lambda迁出。目标架构出人意料地朴素:EC2实例配合自动扩缩容组。
这个选择在当时的技术社区近乎政治不正确。Serverless被视为云原生演进方向,主动退回虚拟机管理像是承认失败。
但财务数据提供了强硬论据。迁移完成后,基础设施月成本从1.8万美元降至400美元。运维人力并未显著增加——因为现代EC2配合容器编排工具,已经大幅简化了传统服务器管理的复杂度。
团队负责人后来复盘:「我们高估了Serverless的免运维收益,低估了可预测成本的价值。」
这个案例的讽刺性在于时间线。2014年Lambda发布时,它的核心卖点正是替代EC2的复杂管理。十年后,同一家公司用EC2替代了Lambda。
被忽略的「Serverless税」
成本失控通常源于三个被低估的因素。
第一,请求粒度计费的双刃剑效应。 微服务架构下,单次用户操作可能触发数十个Lambda调用。每个调用单独计费,叠加后远超单体应用的资源占用。
第二,数据传输费用。Lambda与VPC(虚拟私有云)内资源的通信、跨可用区流量、与S3等存储服务的交互,都会产生额外账单。AWS的带宽定价 notoriously( notoriously 此处保留英文副词,因无精准中文对应且为行业惯用语)复杂,常被排除在初期成本估算之外。
第三,调试与可观测性成本。分布式追踪、日志聚合、性能监控在Serverless架构中更难实现,需要额外购买CloudWatch、X-Ray等服务。这些工具费用在规模扩大后同样可观。
一位云成本分析师指出,AWS的定价设计天然有利于「先上车后补票」。入门门槛极低,但规模扩张后的退出成本极高——数据迁移、架构重构、团队技能重塑都需要投入。
行业叙事的裂缝
这个案例并非孤例。2023至2024年间,多家技术公司公开或私下调整了Serverless策略。
Basecamp(原37signals)在2023年将云服务支出从320万美元/年压缩到不足50万美元,核心手段正是从AWS托管服务迁出自有服务器。DHH(David Heinemeier Hansson,Ruby on Rails创始人)在博客中写道:「云计算的按量付费是个心理陷阱,它让你忽视资源的真实利用率。」
Netflix的技术博客则展示了另一条路径。他们保留了Lambda用于特定场景——事件驱动、突发流量、短时任务——但核心流媒体服务仍运行在自研的容器平台上。
关键区分在于工作负载特征。 不可预测、稀疏的请求适合Serverless;持续高负载、延迟敏感的服务,传统架构反而更经济。
AWS自身的产品演进也暗示了这一点。2024年推出的Lambda SnapStart(快照启动)针对的是Java函数的冷启动问题,本质上是在无服务器架构里模拟服务器的常驻状态。
成本优化的真正战场
该公司最终的架构并非简单复古。EC2实例运行容器化应用,配合KEDA(Kubernetes事件驱动自动扩缩容)实现响应式扩展——这是Serverless理念与传统基础设施的混合体。
他们的经验被总结为一条原则:「没有银弹,只有权衡矩阵。」成本、延迟、运维复杂度、供应商锁定风险,需要根据业务阶段动态调整权重。
这个决策的后续影响仍在发酵。团队开始重新评估其他托管服务——RDS(关系型数据库服务)是否比自管数据库更贵?S3的智能分层是否真的省钱?
一位参与迁移的工程师在内部文档里写道:「我们花了18万美元学费,学到的不是技术选型,而是如何阅读AWS账单的脚注。」
当云厂商的定价页面越来越像信用卡条款时,技术团队的核心竞争力或许正在从「选对新工具」转向「算清旧账单」。你的团队最近一次完整审计云支出是什么时候?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.