文章摘要
Backblaze发布2025年第三季度硬盘统计数据,管理硬盘总数达332,915块,其中数据盘328,348块。报告探讨了硬盘故障的定义问题,并预告将举办数据研讨会深入分析统计结果。
文章总结
Backblaze 2025年第三季度硬盘统计数据报告
核心数据概览
截至2025年6月30日,Backblaze管理着332,915块硬盘,其中3,970块为启动盘,328,348块为数据存储盘。本季度重点关注以下数据趋势:
故障率变化
- 季度年化故障率(AFR)从Q2的1.36%上升至1.55%,接近2024年度AFR(1.57%)
- 终身AFR保持稳定在1.31%(连续三个季度波动不超过0.01%)
零故障硬盘俱乐部
四款硬盘实现零故障:- 希捷4TB(HMS5C4040BLE640)
- 希捷8TB(ST8000NM000A,连续4个季度仅1次故障)
- 东芝16TB(MG09ACA16TE)
- 东芝24TB(MG11ACA24TE,新加入型号)
异常高故障率型号
通过Tukey四分位法分析,AFR>5.88%的异常型号:- 希捷10TB(ST10000NM0086)7.97%(服役超7年)
- 希捷14TB(ST14000NM0138)6.86%(历史故障率高)
- 东芝16TB(MG08ACA16TEY)16.95%(固件升级导致临时性统计偏差)
技术深度解析
故障判定标准
- 通过Smartmontools监控SMART属性,主要依据不可纠正介质错误(uncorrectable medium errors)
- SAS与SATA架构采用不同容错机制
- 数据工程层通过SQL自动化判断:连续30天离线且未出现在维修工单中的硬盘记为故障
东芝16TB异常值原因
本季度对该型号实施固件优化升级,主动下架部分硬盘导致统计异常。预计后续季度故障率将回归正常水平(历史AFR约2%)。
容量趋势
- 20TB+硬盘数量季度新增7,936块,总数达67,939块(占总量21%)
- 新增2,400块东芝24TB硬盘(尚未纳入终身统计)
数据开放声明
完整数据集可在Backblaze官网免费获取,使用需遵守: 1. 注明数据来源 2. 使用者自负责任 3. 禁止转售原始数据
(注:原文中关于哲学讨论、图表说明等非核心内容已精简,保留关键数据结论和技术细节)
评论总结
评论总结:
- 高度赞赏Backblaze的数据共享文化(评论1)
- 认为Backblaze提供的大规模数据中心硬件数据和分析非常珍贵且免费,这种文化值得钦佩
- 担心未来股东可能出于成本考虑停止这类报告
引用:"What Backblaze is doing here is so underrated...they provide it completely for free"
"I fear the day...someone wringing their hands see the decommissioned pennies they can save"
- 关注行业数据短缺的影响(评论2)
- 提出超大规模数据中心即将面临的数据短缺问题,好奇这会如何影响Backblaze 引用:"Given the upcoming 2 year enterprise data shortage...how this will affect Backblaze"
- 对数据实用性的质疑(评论3)
- 认为数据虽然有趣但实际作用有限,因为最低故障率的型号往往很快售罄
- 建议购买策略是分散采购不同品牌而非依赖报告数据
引用:"The skus with the lowest number immediately get bought out...not very actionable"
"When buying drives I just...get 1/3rd from each of the manufacturers"