2025 年 10 月 20 日,下午 3点11分, 美国东部 US-EAST-1 (弗吉尼亚北部),亚马逊云服务最大的核心机房确认出现重大故障!
马上到晚上高峰期了,我们的应用无法登陆注册,现有服务无法自动扩容,坑死人了!影响的服务每10分钟增加6个,非常恐怖!3点55时候是9个,目前36个!如图。
亚马逊在这个事故通告里,没有说清楚到底是什么原因造成了这次大范围的故障。
官方只是说他们正在积极抢修,并承诺会努力去“理解”到底是什么根本原因导致了问题。45分钟同步一次问题。
已确认的现象是:很多服务都出现了错误率和延迟增加的情况。
事故影响范围
这次出问题的区域是美国东部 US-EAST-1,这个地方是亚马逊云服务最大的核心机房。
受影响的服务数量非常多,开始21个,半小时后26个,目前29个!
其中,被称为“数据库基石”的 DynamoDB 被标记为红色,这是最严重的一个。
其他二十个受影响的关键服务包括:
EC2(租给用户的虚拟电脑,服务器)
IAM 和 STS(负责身份验证、授权和登录的“数字身份证系统”)
CloudFront(负责网站加速的全球分发网络)
CloudWatch(负责监控系统的眼睛)
Support API/Center(连用户向亚马逊提交“维修工单”的系统都受影响了)
这次核心服务的故障,会让数百万依赖这个区域的公司网站和App都出现了卡顿、报错、登录失败等问题。影响范围是全球性的,非常巨大。
回复【aws】一起技术讨论,蹲问题原因。#AWS服务中断 #AWS全球服务问题
![]()
![]()
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.