Hacker News 中文摘要

RSS订阅

运营问题——多项服务(阿联酋) -- Operational issue – Multiple services (UAE)

文章摘要

AWS在阿联酋ME-CENTRAL-1区域遭遇电力问题,导致多个服务中断,包括EC2网络相关API出现错误。AWS建议客户重试失败请求、明确指定参数或使用其他区域,并预计数小时内恢复。事故源于数据中心遭物体撞击导致电力中断。

文章总结

AWS服务健康状态报告 - 2026年3月1日

运营问题 - 多服务中断(阿联酋地区)

核心事件: ME-CENTRAL-1区域(mec1-az2可用区)于PST时间凌晨4:30遭遇外部物体撞击数据中心,引发火花和火灾。消防部门切断了该设施电源,目前仍在等待恢复供电许可。

影响范围: 1. 主要受影响服务: - EC2网络相关API(AllocateAddress/AssociateAddress等) - 描述性API(DescribeRouteTable等) - 45项AWS服务出现异常(包括Lambda/ElastiCache/RDS等)

  1. 当前状态:
    • 受影响可用区仍处于断电状态
    • 跨可用区部署的应用不受影响
    • 其他可用区因流量激增出现延迟

应对建议: 1. 立即措施: - 显式指定区域/实例ID进行API调用 - 失败请求建议自动重试机制 - 关键业务建议使用其他AWS区域

  1. 恢复方案:
    • 通过EBS快照恢复数据
    • 在未受影响可用区启动替代资源
    • 考虑使用备用实例类型

恢复进展: - 预计完全恢复仍需数小时 - 已部署配置变更缓解部分API错误 - 网络接口描述功能需待电力恢复

服务状态分类: 1. 中断服务(1项): - Amazon EC2

  1. 受影响服务(45项):

    • 涵盖计算/数据库/网络/分析等多类服务
  2. 已恢复服务(26项):

    • 包括CloudFront/CloudWatch/S3等核心服务

注:所有时间均为PST时区,下次更新预计PST下午3:30前发布。建议用户持续关注AWS健康仪表板获取实时状态。

评论总结

这篇评论主要围绕亚马逊AWS数据中心遭遇袭击事件展开讨论,观点可分为以下几类:

  1. 对事件原因的猜测
  • 有用户质疑是军事打击:"God forbid we'd ever say that it was struck by a missile or a munition in an act of war"(eptcyka)
  • 也有用户认为可能是误操作:"I wonder if this was bad targeting job or intentional"(Shank)
  1. 关于数据中心容灾能力的讨论
  • 有用户指出多AZ部署的优势:"Customers who were running their applications redundantly across the AZs are not impacted"(ejdyksen)
  • 但故障转移存在问题:"the system didn't switch over gracefully"(boxedemp)
  1. 对数据中心作为军事目标的担忧
  • 有用户提出理论:"how much are datacenters becoming military target"(p-o)
  • 建议使用更安全区域:"It's best for people to use safer regions than the middle east"(Imustaskforhelp)
  1. 关于基础设施防护的设想
  • 提议建设地下数据中心:"can explosives not be used to create underground datacenters"(Imustaskforhelp)
  • 关注海底电缆安全:"blowing these up leads to internet downtime"(Imustaskforhelp)
  1. 其他相关讨论
  • 有用户报告欧洲网络问题:"In Southern Europe some smaller web servers are intermittently not working"(general1465)
  • 商业用户的选择:"defaulted to us-west-2 since these particular applications are not latency sensitive"(anonu)