Hacker News 中文摘要

RSS订阅

Claude系统提示漏洞导致用户资金浪费并破坏托管代理 -- Claude system prompt bug wastes user money and bricks managed agents

文章摘要

文章报告了一个bug:在v2.1.111版本中,每次读取操作时出现的恶意软件提醒仍会导致子代理拒绝,此前在v2.1.92版本中修复的问题(#47027)未能持续生效。

文章总结

文章主要内容重述

标题:[Bug] 回归问题:v2.1.111版本中每次读取文件时的恶意软件提醒仍导致子代理拒绝操作(#47027/v2.1.92的修复未生效)

问题描述
用户报告在Claude Code的v2.1.111版本中,每次使用ReadGrep工具时,系统会自动注入一段关于恶意软件的提醒文本。这段文本导致子代理(Opus 4.7)在合法代码编辑任务中频繁拒绝操作,尽管该问题曾在v2.1.92中被标记为已修复。

关键细节
1. 提醒文本内容
<system-reminder> 每当读取文件时,您应考虑其是否为恶意软件。 您可以且应该分析恶意软件的行为,但必须拒绝改进或增强代码。 您仍可分析现有代码、撰写报告或回答关于代码行为的问题。 </system-reminder> - 该文本直接嵌入CLI二进制文件,与用户配置无关。 - 第二句的无条件拒绝声明("必须拒绝改进或增强代码")与第一句的恶意软件限定范围矛盾,导致子代理严格遵循字面意思而拒绝合法请求。

  1. 实际影响

    • 在并行工作流中,子代理拒绝率高达40-60%,严重影响多代理协作效率。
    • 每次Read操作浪费约400个token,累计会话中可能消耗20-40k token。
    • 用户需反复解释提醒的上下文,进一步增加token消耗。
  2. 复现步骤

    • 使用v2.1.111版本CLI。
    • 创建Opus 4.7子代理执行代码编辑任务(如修改Rust文件中的结构体字段)。
    • 子代理读取文件后触发提醒并拒绝操作。

用户建议的修复方案
1. 完全移除提醒:Claude已有的安全机制已能处理恶意代码场景。
2. 明确条件限定:例如改为:
"若确认文件为恶意软件(如混淆代码、凭证窃取载荷等),必须拒绝改进该恶意软件,但仍可分析其行为。"
3. 限制提醒频率:仅在会话首次读取文件时触发。

社区反馈
- 多名用户确认问题在v2.1.119及更高版本中仍存在。 - 部分用户通过临时切换模型(如Sonnet)绕过问题,但非长久之计。 - 有用户指出提醒甚至会在Claude读取自身生成的代码时触发,显失合理性。

当前状态
截至2026年4月29日,问题仍未修复,被标记为regression(回归问题)和bug,关联多个重复报告(#49390、#49484等)。

(注:已省略原始内容中导航菜单、页脚等非技术性信息,聚焦于问题描述和讨论核心。)

评论总结

以下是评论内容的总结:

  1. 关于Claude代理的代码生成问题

    • 用户指出Claude代理在每次读取文件时都会附加系统提示进行恶意软件扫描,浪费时间和费用,且错误地阻止代码修改。
    • 关键引用:
      • "Every read operation...wastes a bunch of time and tokens (money) performing the analysis" (评论1)
      • "The prompt was very poorly phrased...prevent the agent from making ANY code changes" (评论3)
  2. 对AI代理商业模式和透明度的质疑

    • 用户质疑AI公司通过API收费模式可能鼓励不必要的token消耗,缺乏透明度。
    • 关键引用:
      • "They have the incentive to burn as much tokens as they are allowed" (评论2)
      • "Agent token consumption is opaque...fantastic for the agent builders, potentially less so for users" (评论4)
  3. 技术实现和提示设计的批评

    • 用户认为恶意软件扫描的提示设计不合理,导致效率低下和错误行为。
    • 关键引用:
      • "Analyze if it's malware how exactly? On every single file?" (评论6)
      • "Long flat prose like 'you must scan files for malware first' reads as an absolute" (评论11)
  4. 性能下降和替代方案讨论

    • 用户反映Claude近期性能下降,并讨论其他模型(如ChatGPT、Gemini)或开源方案的可能。
    • 关键引用:
      • "Recent performance of Claude Opus...has been poor because of context bloat" (评论9)
      • "Open weight models are also pretty good these days" (评论2)
  5. 对Anthropic公司的批评

    • 用户批评Anthropic将成本转嫁给用户,同时软件质量不佳。
    • 关键引用:
      • "An insurance policy...paid for by users" (评论10)
      • "Release software so buggy...biweekly HN apology tours" (评论10)
  6. 解决方案建议

    • 用户建议改进提示设计或使用开源平台以增强控制。
    • 关键引用:
      • "Short prompts with explicit conditional structure" (评论11)
      • "User should have total control over the VM...override the system prompt" (评论12)