Hacker News 中文摘要

RSS订阅

大型语言模型对异常情况极度恐惧 -- LLMs are mortally terrified of exceptions

原文链接 | HN讨论 | 2025-10-10 08:28:43

文章摘要

AI研究员Andrej Karpathy指出，当前实验室在强化学习训练中对大语言模型过于严苛，导致模型对任何微小可能的异常情况都过度恐惧。他认为异常本是开发生命周期的正常部分，呼吁改善模型在异常情况下的奖励机制。

文章总结

安德烈·卡帕西（Andrej Karpathy）在X平台上发表观点称，大型语言模型（LLMs）在强化学习（RL）过程中被训练得对任何微小概率的异常情况都极度恐惧。他认为异常本是生活和健康开发流程中的正常现象，并呼吁改善LLMs在遇到异常时的奖励机制，发起了一项"LLM福利请愿"。

（注：根据要求，已删除与主题无关的社交媒体趋势内容和推广信息，仅保留核心观点陈述。原文中的表情符号、转发量数据和无关话题标签均未保留。）

评论总结

评论总结：

对代码安全性的质疑：

认为这类"偏执的健全性检查"是"安全剧场"(security-theater)，实际效用存疑引用："Even when they're not AI slop, these kinds of 'paranoid sanity checks' are the software equivalent of security-theater."
指出代码逻辑不一致，如除零检查与epsilon比较的矛盾引用："division by zero can't occur, because if b=0 then abs(b) < sys.float_info.epsilon"

对AI编程风格的批评：

认为AI倾向于生成过度防御性代码，影响可读性引用："LLMs tend to produce defensive code to a fault. Lots of unnecessary checks"
指出这是AI对编程语言设计缺陷的反映引用："AI trying to tell us how bad we designed our programming languages"

安全关键领域的必要性：

认为在航空航天、医疗等关键领域需要这种谨慎引用："If you are actually doing safety critical software...then this is a good precaution"
但指出这类领域不会使用Python 引用："you will not be writing in Python"

对代码性质的争议：

部分用户认为代码是讽刺性作品引用："it's clearly satirical?"
作者澄清这是夸张的玩笑引用："the code itself is just a joke illustrating the point"

编程实践建议：

建议减少异常使用，增加前置验证引用："why not perform pre-flight/pre-validation checks"
反对过度防御，主张让关键错误直接抛出引用："Just let stuff blow up on me if something is wrong"

对提示词的关注：

多个评论关注生成代码的具体提示词引用："what's the prompt that led to this output?"
推测提示可能要求"处理所有边界情况" 引用："generate a division function...that handles all possible edges cases"