电网断电时,不间断电源并未正常启动。
谷歌透露,其中一个谷歌云服务区最近遭遇了持续六小时的中断,原因是不间断电源未能正常工作。
这次中断始于 3 月 29 日,导致 us-east5-c 服务区内 20 多种谷歌云服务出现了“服务质量下降或不可用”的情况。
谷歌的美国东部服务区以俄亥俄州哥伦布市为中心。
谷歌的事故报告指出,这次中断始于“受影响服务区的市电中断”。
超大规模计算企业在搭建系统时为了应对这种情况,通常使用不间断电源(UPS),这种电源在电网断电时能够立即供电,并且在柴油发电机启动前持续供电数小时。
然而,谷歌的 UPS 遇到了“严重的电池故障”,未能提供任何电力。它们还似乎阻止了发电机提供的电力输送到谷歌的机架,工程师不得不绕过失效的 UPS,然后通过发电机恢复供电。
工程师们于太平洋时间 12 点 54 分接到事故警报,并在 14 点 49 分使发电机成功恢复供电。
事故报告指出:“大多数谷歌云服务随后很快恢复正常”,不过“少数几项服务的恢复时间较长,原因是在某些情况下需要手动操作才能完全恢复。”
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.