Hacker News 中文摘要

RSS订阅

今日的公关垃圾信息如同2000年代初的电子邮件垃圾信息 -- PR spam today looks like email spam in the early 2000s

文章摘要

对OpenClaw仓库的拉取请求统计研究发现,AI编码工具导致PR数量激增(从每周2个增至3400个),合并率从48%骤降至9.3%,大量低质量PR如同早期垃圾邮件,未来开源贡献将需要发送者信誉机制。

文章总结

好的,这是根据您的要求,对原文主要内容进行的中文重述,保留了核心细节,并删减了与主题无关的冗余信息。


标题:对 OpenClaw 仓库拉取请求的统计分析

核心发现: 随着 AI 编码代理的普及,开源贡献正面临“垃圾 PR”泛滥的挑战,这从根本上改变了项目维护的方式。

现象描述: OpenClaw 仓库在短时间内经历了爆发式增长,其 PR 提交量从去年12月的每周2个,飙升至今年2月的每周3400个。然而,合并率却从之前的48%骤降至9.3%以下。大量PR是低质量的“垃圾贡献”,很多由AI代理生成。例如,有贡献者在一天内提交了106个PR,其中位提交间隔仅为3秒。

三个关键观察:

  1. PR 将需要“发送者信誉”机制。

    • 当前的 PR 垃圾信息与2000年代初的电子邮件垃圾信息类似。当发送成本趋近于零时,平台信任度下降,恶意行为增加。
    • 解决方案也类似:引入黑名单、基于置信度的过滤器以及信誉基础设施。就像电子邮件一样,你的 PR 能否被接受,将取决于“你是谁”和“你的历史贡献记录”。
    • 数据已显示这一趋势:首次贡献者的PR合并率为8.2%,而有5次以上贡献记录的贡献者合并率则达到18.6%。
    • 案例:Ghostty 项目的创建者 Mitchell Hashimoto 因不堪 AI 生成 PR 的骚扰,开发了名为 Vouch 的信誉管理系统。未获信任的用户无法贡献,恶意行为者会被标记。这本质上是开源领域的“发送者信誉评分”。
  2. 如果所有贡献者思维趋同,更多贡献者也无济于事。

    • 林纳斯定律(“足够多的眼睛,所有错误都是浅显的”)的前提是思维的多样性。但当所有人都依赖相同的 AI 编码代理(如 Claude、Codex、Cursor)时,这种多样性正在丧失。
    • 在 OpenClaw 中,出现了大量重复的 PR:4人提交了标题完全相同的“添加 SearXNG 搜索提供商”的PR;6人独立修复了同一个 Brave 搜索本地化错误,其中两个PR的提交时间仅相隔94分钟;5人独立发现了同一个代理运行器中的超时死锁问题。
    • 结论:如果大多数贡献者使用相同的AI工具和提示词,他们的贡献也会趋于同质化。开源的优势——思想的多样性——正在被削弱。
  3. 真正被合并的是什么?

    • 数据显示,功能类 PR 的合并率仅为 9%,而重构类 PR 的合并率高达 35%。需要深入理解现有代码库的贡献,其合并率是新颖功能贡献的近4倍。
    • 这印证了当前的观点:思考远比打字重要。AI 可以高效地生成代码,但无法替代对系统架构的深刻理解。
    • 案例:claude-mem 项目将 Claude Code 的工具流映射到其自身的 Agent SDK 中,这是一个需要深刻理解两个系统的非显而易见架构决策。一个理解此决策的开发者可以将其提炼为检查清单,从而显著提升AI代理的输出质量。而一个被提示“构建一个记忆系统”的代理,无法独立完成此任务。
    • 类比:200年前,建筑的设计者和建造者是同一个人(总建筑师)。随着技术进步,这个角色分化为建筑师和施工方。软件领域也类似:那些能通过审查的贡献,越来越依赖于对现有系统的深度理解(架构),而非新颖的构建(施工)。

未来展望: OpenClaw 的案例展示了开源社区前所未有的构建速度。但随之而来的问题——身份、信誉和贡献验证——需要更好的基础设施来解决。开源社区此前解决过更棘手的问题,相信这次也能找到答案。

评论总结

根据评论内容,总结如下:

主要观点与论据:

  1. 反对AI生成的PR/问题:多位评论者认为AI生成的代码贡献(如PR)是“垃圾”,应被禁止。例如,runarberg表示“我更喜欢全面禁止AI代理创建的PR和问题”,并已关闭一个此类PR;j2kun则要求新贡献者通过非文本形式与维护者会面后再合并PR。

  2. 建议技术或规则限制:giancarlostoro询问GitHub是否有规则集限制PR提交;guidoiaquinti提到GitHub已新增可配置的PR限制功能;janalsncm建议维护者更新仓库设置以阻止AI提交。

  3. 对AI反垃圾措施的质疑:benj111质疑“用AI代理对抗AI垃圾”的逻辑,认为反垃圾代理应直接处理问题而非增加中间环节;Retr0id提出更直接的方案:让用户直接向开源项目捐赠代币积分,由维护者决定用途。

  4. 历史类比与经验:alexpotato和elzbardico将当前AI垃圾问题类比为早期互联网垃圾邮件,认为营销思维破坏了良好生态;andix指出邮件垃圾依赖服务器信誉,而PR/问题无法直接套用此模式。

  5. 个人项目与工具分享:othmanosx分享了自己因AI代码导致PR管理混乱的经历,并推广其开发的Pyor Review工具,声称能加速PR合并。

不同观点平衡:

  • 支持AI贡献者:无明确支持AI生成PR的评论,但othmanosx承认AI代码的实用性,同时强调仍需人工审查。
  • 反对AI贡献者:多数评论者持反对态度,主张严格限制或禁止。
  • 中立/技术方案:部分评论者关注具体解决方案(如PR限制、捐赠机制),而非直接否定AI。

关键引用(保留中英文):

  • runarberg: “I much prefer a blanket ban on PRs and issues created by AI agents” / “我更喜欢全面禁止AI代理创建的PR和问题”
  • benj111: “Why can the anti spam agents not just do the work directly???” / “为什么反垃圾代理不能直接做这项工作?”
  • Retr0id: “Maybe we should cut out the middle-man and make it easy for people to donate token credits to open-source projects” / “也许我们应该去掉中间人,让人们更容易向开源项目捐赠代币积分”