周一裁掉700人,周四公布3.94亿美元季度亏损,周五因为一座建筑过热,整整7小时无法处理任何一笔交易。这是Coinbase过去一周的真实写照。
这家刚告诉剩余工程师"AI能在几天内完成数周工作"的加密货币交易所,在周末到来前因基础设施故障全面停摆。故障源于亚马逊云服务(AWS)位于弗吉尼亚州北部的数据中心发生热失效,从新加坡时间周五上午9点左右持续到下午4点,所有交易、转账及核心交易所功能全部暂停,面向普通用户的应用也出现性能下降。
![]()
Coinbase将问题归咎于AWS美东1区(US-EAST-1)的单个可用区use1-az4,但故障迅速蔓延至多个可用区,压垮了原本设计用于应对单区失效的弹性机制。这个区域是AWS最古老、负载最重的云区域,作为许多客户的默认区域,承载着互联网基础设施的相当大份额。一旦出问题,波及范围远超单一客户。
![]()
过热影响的不仅是Coinbase。据报告,芝加哥商品交易所集团(CME Group)和博彩平台FanDuel同样遭受冲击。AWS表示,单个数据中心内部温度上升,导致弹性计算云(EC2)实例和弹性块存储(EBS)卷出现电力相关中断,冷却系统容量恢复耗时超出预期。
丹麦已因AI基础设施压垮电网而暂停新数据中心并网,弗吉尼亚的热失效则从另一角度揭示了同一根本问题:数据中心产生巨量热量,散热系统一旦失效,服务器便会关机。美国公用事业计划到2030年投入1.4万亿美元为AI数据中心供电,但投资集中于电力供应,而非防止电力转化为热能事件的冷却基础设施——正是这类热事件让Coinbase陷入瘫痪。
![]()
这是AWS七个月内第二次重大故障。2025年10月,同一美东1区因域名系统(DNS)故障停摆15小时,波及2500余家公司,估计造成11亿美元经济损失。那次源于两套自动化系统同时更新同一数据,这次则源于建筑过热。失效模式不同,结果相似:互联网的重要部分因单一物理节点故障而离线。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.