Hacker News 中文摘要

文章摘要

文章探讨了如何将大型语言模型(LLM)应用于更大规模的代码库，指出应重点投资于"指导"(提供上下文环境)和"监督"(验证模型选择的能力)，以充分发挥AI工具在软件工程中的作用。这是关于LLM在工程中应用系列文章的第三部分。

文章总结

将大语言模型应用于大型代码库的规模化实践

作者：Kieran Gill

系列文章背景

本文是"大语言模型在软件工程中的应用"系列第三篇。前两篇分别探讨了大语言模型与遗传学的共性（第一部分），以及大语言模型真正能提升的工程领域（第二部分）。

规模化应用的核心策略

将大语言模型应用于大型代码库时，关键在于对"指导"和"监督"两个方面的投资：

1. 指导（Guidance）

指为模型提供充分的上下文和环境信息，包括： - 建立提示词库（Prompt Library）：收集代码库文档、最佳实践和架构说明 - 优化代码环境：保持代码模块化、命名清晰、逻辑封装良好 - 典型案例：在Django项目中通过_api.py文件实现功能封装

2. 监督（Oversight）

指确保团队具备引导、验证和决策的能力，包括： - 提升团队设计能力：通过阅读经典代码、复制优秀项目来培养架构直觉 - 建立自动化检查：编写脚本检查架构约定（如导入规则） - 保持产品深度理解：避免构建错误解决方案

实施建议

提高"一次命中"率： - 完善提示词库，记录每次偏差的修正方案 - 保持代码库整洁（技术债务会降低模型表现） - 建立自动化安全检查机制

验证环节优化： - 降低手动QA的门槛 - 改进测试数据创建流程 - 将常见PR反馈文档化

为什么大语言模型擅长新项目？

在新项目中表现优异的原因： - 无需考虑已有上下文和模式 - 决策风险较低 - 随着项目规模扩大，一致性变得至关重要

总结

有效应用大语言模型需要： 1. 为其提供清晰的指导框架 2. 建立强大的技术监督能力 3. 保持代码库质量

这种方法既能发挥AI工具的潜力，又能确保软件工程质量，而不是简单地用自动化取代工程师。

查看作者更多工程实践

评论总结

以下是评论内容的总结：

LLM使用策略与迭代优化
- 通过迭代优化提示词库（prompt library）能显著提高LLM效果
- 关键引用：
  "Making a prompt library useful requires iteration... this is the single highest ROI practice"（评论3）
  "Simply smashing enter over and over... will just burn tokens"（评论3）
代码库结构化的重要性
- 结构化/模块化的代码库更利于LLM理解
- 关键引用：
  "If your codebase is hard to understand for a human, it will be the same for an LLM"（评论15）
  "Biggest change... break down projects to smaller parts using libraries"（评论12）
人类监督的必要性
- LLM需要明确的人类指导和结果验证
- 关键引用：
  "Human judge correctness... LLM as planner/architect... LLM as implementor"（评论13）
  "You have to resist letting the implementor improvise"（评论13）
当前局限性
- LLM在专业领域存在幻觉问题
- 关键引用：
  "when I ask about things I have expert knowledge on they consistently fail"（评论17）
  "Having a way to check correctness is not the same as finding a solution"（评论11）
工作流程优化
- 分阶段处理（研究/计划/执行）效果更好
- 关键引用：
  "[Research]-[Plan]-[execute plan]-[review & test]框架"（评论9）
  "supervising a very fast junior engineer"（评论13）
成本效益考量
- 需平衡token消耗与产出价值
- 关键引用：
  "Letting the LLM churn... will make your token quota evaporate"（评论3）
  "not sure I can justify the expense long term"（评论14）

将大型语言模型扩展至更大规模代码库 -- Scaling LLMs to Larger Codebases