Hacker News 中文摘要

RSS订阅

Anthropic于3月6日悄然将缓存TTL从1小时降至5分钟 -- Anthropic silently downgraded cache TTL from 1h → 5M on March 6th

文章摘要

2026年3月初,Anthropic将Claude Code的缓存TTL默认值从1小时静默调整为5分钟,导致缓存创建成本增加20-32%,订阅用户的配额消耗也出现明显上升。这一变更通过分析两台设备上近12万次API调用数据得到证实。

文章总结

标题:2026年3月初缓存TTL从1小时静默回退至5分钟,导致配额消耗与成本激增

核心问题

通过对2026年1月11日至4月11日Claude Code会话数据的分析发现,Anthropic在2026年3月初未经公告将缓存TTL(生存时间)默认值从1小时缩短至5分钟。这一变更导致: - 缓存创建成本增加20-32% - 订阅用户配额消耗显著上升,部分从未触达限额的用户开始出现超额

数据证据

  1. 阶段划分(基于两台独立设备、11.9万次API调用的日志):

    • 阶段1(1.11-1.31):仅5分钟TTL
    • 阶段2(2.1-3.5):仅1小时TTL(持续33天零例外)
    • 阶段3(3.6-3.7):混合出现5分钟TTL
    • 阶段4(3.8-4.11):5分钟TTL占比超83%
  2. 转折点

    • 3月6日首次重现5分钟TTL记录
    • 3月8日5分钟TTL占比骤升至83%
    • 3月21日比例高达93%

成本影响

| 模型 | 总成本 | 1小时TTL理论成本 | 超额支出 | 浪费比例 | |--------------------|----------|------------------|----------|----------| | claude-sonnet-4-6 | $5,561 | $4,612 | $949 | 17.1% | | claude-opus-4-6 | $9,269 | $7,687 | $1,582 | 17.1% |

成本激增机制: - 5分钟TTL导致会话暂停超时后需全量重新缓存(写入费率是读取的12.5倍) - 分析期间产生2.2亿次5分钟TTL写入,对应57亿次读取请求

配额影响

订阅用户的配额计算规则未明确披露,但缓存创建令牌全额计入配额。这解释了为何3月起用户开始首次触达5小时使用限额。

关键质疑

  1. 意图矛盾:2月整月稳定的1小时TTL表现(零5分钟记录)强烈暗示此为预设默认值
  2. 变更性质:3月的突变(单日3000万令牌切换)更符合配置错误而非有计划调整

用户诉求

  1. 要求官方确认是否发生服务端TTL变更
  2. 明确Claude Code的预设TTL标准
  3. 建议恢复1小时TTL或开放用户配置
  4. 公开配额计算细则

(注:保留原始数据表格中的关键日期与数值对比,删减了重复的成本计算示例和次要技术细节)

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

  1. 关于性能下降的质疑

    • 多位用户指出Claude近期表现明显退步,包括处理简单问题能力下降、解决方案质量降低等。
    • 关键引用:
      • "It's absolutely ridiculous how stupid Claude is now"(用户throwaway2027)
      • " routinely failing the car wash question...the model is regressing"(用户disillusioned)
  2. 商业策略争议

    • 部分用户认为这是Anthropic为盈利故意降低服务质量,与OpenAI过去的做法类似。
    • 关键引用:
      • "They make the product worse...then offer you a 'better' one"(用户taffydavid)
      • "The money man comes to collect and they are squeezing for money"(用户PunchyHamster)
  3. 缓存机制的技术讨论

    • 有用户认为TTL调整可能是基于基础设施负载的合理决策,但也有人质疑其技术能力。
    • 关键引用:
      • "Anthropic looked at their infra load and made a very intentional change"(用户the_mitsuhiko)
      • "One of the largest AI companies...cannot figure out an algorithm"(用户poly2it)
  4. 用户信任危机

    • 许多用户表达对产品稳定性的担忧,认为秘密变更损害了平台可信度。
    • 关键引用:
      • "people feel like they have no idea if they are getting the product they paid for"(用户sunaurus)
      • "this undermining decreases the trust of your platform"(用户ikekkdcjkfke)
  5. 标题和技术表述争议

    • 部分用户对文章标题和单位符号使用提出技术性质疑。
    • 关键引用:
      • "The title should be changed...SI symbol for minutes is 'min'"(用户cassianoleal)
  6. 替代产品评价

    • 有用户表示已转向Codex并获得更好体验。
    • 关键引用:
      • "Codex is absolutely fantastic...since switching from Claude"(用户davidkuennen)