Hacker News 中文摘要

RSS订阅

Webhooks事件 -- Incident with Webhooks

文章摘要

GitHub的Webhooks服务出现故障,部分功能如Actions和Notifications出现延迟或性能下降。经过逐步修复,所有服务现已恢复正常。团队表示将尽快分享详细的事故原因分析。

文章总结

GitHub服务中断事件报告

事件状态:已解决

【事件概述】 2025年10月9日14:45 UTC起,GitHub出现多服务异常,主要涉及: - Git操作 - Webhooks - API请求 - Issues - Pull Requests - Actions - Pages

【处理时间线】 14:45 首次发现Webhooks服务异常 15:09 多服务同时出现性能下降 15:25 确认故障原因为网络组件异常并移除 16:02 大部分服务恢复,但Actions和通知仍有延迟 16:40 所有服务完全恢复

【关键节点】 1. 故障根源:发现并移除了故障网络组件 2. 分阶段恢复: - 最先恢复:API请求、Issues、Pull Requests - 最后恢复:Actions和通知服务 3. 完整恢复耗时:约2小时

【后续处理】 官方承诺将提供详细的根本原因分析报告,并对用户耐心等待表示感谢。

注:本次事件未影响Git核心数据安全,主要造成服务延迟和临时性功能降级。技术团队通过分段恢复策略优先保障了核心服务的稳定性。

评论总结

以下是评论内容的总结:

  1. 关于GitHub服务中断的抱怨

    • 多位用户报告了推送失败、PR创建失败、CI流水线故障等问题。
      • "Getting failed pushes, failed PR creation, failed CI pipelines." (评论1)
      • "Can't merge PRs atm" (评论2)
    • 有用户指出GitHub状态页面显示正常,但实际存在问题。
      • "everything was green...then I realized 'GitHub Enterprise Cloud'" (评论3)
  2. 对GitHub可靠性的质疑

    • 用户批评GitHub频繁中断,并质疑微软的管理能力。
      • "seems like Microsoft can't keep this thing from crashing at least three times a month." (评论11)
      • "GitHub outages are so common these days" (评论7)
    • 有人担心即将进行的Azure迁移会带来更多问题。
      • "I'm not looking forward to the Azure migration and potential for more issues" (评论12)
  3. 关于自托管Git服务的讨论

    • 有用户建议企业考虑自托管Git服务。
      • "Why Self-Host?...How long before moderately sized companies start hosting their own git servers" (评论6,7)
    • 批评GitHub试图集成过多功能而影响稳定性。
      • "Having everything in one service...definitely decreases stability" (评论8)
  4. 对GitHub Actions的批评

    • 有用户表示已停止使用GitHub Actions,认为它浪费时间。
      • "I stopped using Actions...things are simpler now" (评论10)
    • 也有用户推荐本地运行Actions的工具。
      • "To run your github actions locally...with this tool" (评论13)
  5. 幽默和讽刺的评论

    • 有用户以幽默方式表达对GitHub问题的无奈。
      • "Oh it's that time of the week again." (评论9)
      • "It's kind of funny that the top two posts right now are: 1. Why Self-Host? 2. GitHub Issues" (评论6)