文章摘要
AWS在阿联酋ME-CENTRAL-1区域遭遇电力问题,导致多个服务中断,包括EC2网络相关API出现错误。AWS建议客户重试失败请求、明确指定参数或使用其他区域,并预计数小时内恢复。事故源于数据中心遭物体撞击导致电力中断。
文章总结
AWS服务健康状态报告 - 2026年3月1日
运营问题 - 多服务中断(阿联酋地区)
核心事件: ME-CENTRAL-1区域(mec1-az2可用区)于PST时间凌晨4:30遭遇外部物体撞击数据中心,引发火花和火灾。消防部门切断了该设施电源,目前仍在等待恢复供电许可。
影响范围: 1. 主要受影响服务: - EC2网络相关API(AllocateAddress/AssociateAddress等) - 描述性API(DescribeRouteTable等) - 45项AWS服务出现异常(包括Lambda/ElastiCache/RDS等)
- 当前状态:
- 受影响可用区仍处于断电状态
- 跨可用区部署的应用不受影响
- 其他可用区因流量激增出现延迟
应对建议: 1. 立即措施: - 显式指定区域/实例ID进行API调用 - 失败请求建议自动重试机制 - 关键业务建议使用其他AWS区域
- 恢复方案:
- 通过EBS快照恢复数据
- 在未受影响可用区启动替代资源
- 考虑使用备用实例类型
恢复进展: - 预计完全恢复仍需数小时 - 已部署配置变更缓解部分API错误 - 网络接口描述功能需待电力恢复
服务状态分类: 1. 中断服务(1项): - Amazon EC2
受影响服务(45项):
- 涵盖计算/数据库/网络/分析等多类服务
已恢复服务(26项):
- 包括CloudFront/CloudWatch/S3等核心服务
注:所有时间均为PST时区,下次更新预计PST下午3:30前发布。建议用户持续关注AWS健康仪表板获取实时状态。
评论总结
这篇评论主要围绕亚马逊AWS数据中心遭遇袭击事件展开讨论,观点可分为以下几类:
- 对事件原因的猜测
- 有用户质疑是军事打击:"God forbid we'd ever say that it was struck by a missile or a munition in an act of war"(eptcyka)
- 也有用户认为可能是误操作:"I wonder if this was bad targeting job or intentional"(Shank)
- 关于数据中心容灾能力的讨论
- 有用户指出多AZ部署的优势:"Customers who were running their applications redundantly across the AZs are not impacted"(ejdyksen)
- 但故障转移存在问题:"the system didn't switch over gracefully"(boxedemp)
- 对数据中心作为军事目标的担忧
- 有用户提出理论:"how much are datacenters becoming military target"(p-o)
- 建议使用更安全区域:"It's best for people to use safer regions than the middle east"(Imustaskforhelp)
- 关于基础设施防护的设想
- 提议建设地下数据中心:"can explosives not be used to create underground datacenters"(Imustaskforhelp)
- 关注海底电缆安全:"blowing these up leads to internet downtime"(Imustaskforhelp)
- 其他相关讨论
- 有用户报告欧洲网络问题:"In Southern Europe some smaller web servers are intermittently not working"(general1465)
- 商业用户的选择:"defaulted to us-west-2 since these particular applications are not latency sensitive"(anonu)