亚马逊云服务(AWS)近日披露,其美国东部(弗吉尼亚北部)区域(US-East-1)发生的一次服务中断,根源在于一个单一可用区内出现的运营问题。该问题进一步引发了一次“热事件”,并最终导致了电力供应中断。
此次事件并非由外部因素或大规模基础设施故障引起,而是局限于特定可用区的内部运营环节。流程中的异常状况触发了设备过热,进而造成断电,影响了该区域部分服务的可用性。AWS的声明明确了故障链条:从运营问题到热事件,再到电力损失。
作为亚马逊公司旗下关键的云计算部门,AWS此次运营波动再次凸显了超大规模数据中心在物理基础设施管理与自动化运维流程协同方面所面临的复杂性。尽管事件被控制在单个可用区内,但其引发的服务影响仍引起了广泛关注。
精彩评论