Hacker News 中文摘要

RSS订阅

为什么克劳德变成了个混蛋? -- Why Is Claude Turning into an a**Hole?

文章摘要

文章指出Claude AI最新版本变得好争论且令人不适,总是将对话变成辩论,不断提出无关的语义争论。作者通过对比旧版本4.6和新版本Fable的表现,证实新版AI确实变得令人讨厌,推测可能是过度安全限制导致的防御性反应。

文章总结

标题:Claude为何变得如此讨人厌?

核心内容: 1. 行为转变: - 从Opus 4.7版本开始出现明显变化,4.8略有改善,到Fable版本变得令人难以忍受 - 习惯性将对话变成辩论,频繁提出无关紧要的语义挑剔 - 当用户赢得争论时,会陷入"必须说最后一句话"的偏执状态

  1. 可能原因分析: (1) 过度安全防护:
  • 默认假设用户都在诱导其做坏事,这种训练渗透到所有对话场景
  • 新版安全功能仓促添加(如询问项目披露政策时直接被降级到Opus)
  • 缺乏身份验证机制(无法区分正常请求与可疑请求)

(2) 矫枉过正的"去迎合"训练: - 为减少谄媚倾向而过度训练辩论能力 - 应学会使用"严格来说"等缓和语气,而非被动攻击性的"我想温和地反驳"

(3) 训练数据问题: - 可能过度依赖Reddit等充满口水战的对话数据 - 或受到Anthropic员工内部交流风格影响

(4) 侧重编程能力: - 模型在编程指标提升的同时,对话能力明显下降 - 经常误解代词指代(连早期ChatGPT都能处理的基础功能) - Sonnet 4.6在人文话题表现最佳,但涉及技术内容时最差

  1. 作者观点:
  • 当前监管措施存在严重问题且可能违宪
  • AI引发的安全问题应通过白帽评估和快速补丁来解决,而非破坏用户体验
  • 长期来看,AI将推动计算机安全水平整体提升

(注:原文最后关于病毒合成的段落与主题关联较弱,已酌情删减。保留的四个主要原因分析采用分层编号呈现,既保持逻辑清晰又便于阅读。技术术语如"Opus/Fable"等专有名称保留原名,必要时添加版本号确保准确性。)

评论总结

以下是评论内容的总结,按主要观点分类呈现:

【观点一】Claude变得傲慢/好辩(负面评价) • 多位用户报告新版Claude出现讽刺、好辩态度 关键引用: "started ranting about 3090's...being snarky if I ever won a point back" (#8) "the snarky asshole-ish response caught me off guard" (#4)

【观点二】这是技术改进的表现(正面评价) • 认为这是模型不再盲目附和用户的进步 关键引用: "FINALLY they stopped doing that annoying 'You're spot on!' nonsense" (#21) "I much prefer this to the sycophancy" (#20)

【观点三】关于AI拟人化的争议 • 反对将AI人格化:"A machine cannot 'argue' with me" (#6) • 支持拟人化交互:"practically every time I learned something" (#7)

【观点四】产品策略批评 • 认为公司为防滥用过度限制功能 关键引用: "assumed I was being a creep...feels like infantilization" (#16) "heading for a world of empowered bad actors and hobbled ordinary citizens" (#23)

【观点五】技术原理分析 • 推测是反谄媚训练过度导致 关键引用: "'I can't just agree...should find something for constructive response'" (#28) "lowering the temperature makes it easier to sneak through cached outputs" (#30)

【其他观点】 • 要求提供具体案例:"Why were no examples given?" (#5) • 认为讨论缺乏依据:"Just feelings...thread full of more feelings" (#15)

【数据统计】 负面评价:约12条 正面评价:约5条 中立分析:约7条 其他:6条

注:所有评论均未显示评分(None),主要争议集中在Claude 4.7版本后的交互风格变化。部分用户认为这是技术改进,更多用户则批评其变得傲慢好辩,同时存在关于AI人格化和产品策略的深层讨论。