Hacker News 中文摘要

文章摘要

该研究指出，当用户委托大型语言模型(LLMs)处理文档时，模型可能会对文档内容造成损坏或篡改。这一发现提醒人们在使用LLMs处理重要文档时需要保持警惕。

文章总结

论文标题：《委托工作时大型语言模型会破坏你的文档》

核心内容： 1. 研究背景： - 大型语言模型(LLMs)正在改变知识工作模式 - 委托式工作(如vibe coding)成为新兴交互范式 - 委托工作需要信任基础，要求LLMs能准确执行任务而不引入错误

研究方法：

开发DELEGATE-52测试平台
模拟52个专业领域(编程、晶体学、音乐记谱等)的长期委托工作流程
评估文档深度编辑过程中的模型表现

主要发现：

测试19个LLMs显示当前模型存在文档破坏问题
前沿模型(Gemini 3.1 Pro/Claude 4.6 Opus/GPT 5.4)平均破坏25%文档内容
错误特征：稀疏但严重，会随交互时长累积
恶化因素：文档体积、交互时长、干扰文件存在

补充结论：

工具使用不能改善DELEGATE-52表现
当前LLMs作为委托代理不可靠

研究意义：

首次系统评估LLMs在委托工作流中的可靠性
揭示现有技术在实际应用中的潜在风险

研究团队：Philippe Laban, Tobias Schnabel, Jennifer Neville 发表平台：arXiv 学科分类：计算与语言处理(cs.CL)、人机交互(cs.HC) DOI：10.48550/arXiv.2604.15597

（注：已过滤网页导航元素、机构标识、参考文献格式等非核心内容，保留研究实质信息）

评论总结

以下是评论内容的总结，平衡呈现不同观点并保留关键引用：

评估方法的认可与质疑
- 正面评价：jonmoore赞赏通过可逆步骤链测试保真度的方法，指出前沿模型在计算机友好任务上仍会积累错误
- 质疑延伸性："if the stronger results on Python are not just an artefact of the Python-specific evaluation"（jonmoore）
内容退化的普遍现象
- 核心观点：多用户观察到AI处理会导致"语义消融"（semantic ablation），类似JPEG多次压缩的退化效应
- 典型引用："Each pass of the LLMs degrades the intent...a little bit of precision is lost"（timacles）
- 实践观察："AI-washing any text will degrade it, compounding with each pass"（causal）
错误类型的讨论
- 错误特征：adampunk指出错误与难度无关且普遍存在，"mistakes at all levels of operation"
- 错误分布：woeirua关注错误发生阶段，"Are they happening in the forward pass or the inverse pass?"
工具使用的争议
- 实验设计质疑：simonw认为结果反映的是工具设计而非模型能力，"the results reflect more on the design of the harness"
- 优化建议：应使用现代编辑工具如"str_replace and insert commands"（simonw）
实验方法的局限性
- 现实对比：threethirtytwo指出实验方式不符合实际使用场景，"not inline with how current agentic AI is used"
- 人类对比："The DOCUMENT would DEGRADE even more"（threethirtytwo）
改进可能性
- 工程优化：carterschonwald认为可通过工具设计改善，"ways for improving text faithfulness through harness tool designs"
- 根本局限："this kind of error is fundamentally incorrigible"（adampunk）

关键矛盾点集中在：实验设计是否合理（5条相关评论）vs 模型固有缺陷（4条相关评论），其中3条评论强调工具设计的关键作用。

委托大语言模型处理文档时可能损坏内容 -- LLMs Corrupt Your Documents When You Delegate

文章摘要

文章总结

评论总结