文章摘要
作者Peter Steinberger分享了他利用智能代理工程高效开发的经验。他目前独自开发一个包含30万行TypeScript代码的多平台项目,通过优化工作流程,智能代理已能完成他几乎所有的代码编写。他强调与其纠结复杂方案,不如直接与AI对话解决问题,并推荐参考他之前关于最优AI工作流的文章。
文章总结
标题:直接对话——高效智能体工程实践 | Peter Steinberger
作者近期专注于一个大型项目开发,通过实践总结出一套高效的智能体工程工作流。以下为文章核心内容:
技术栈与工作环境
- 项目规模:30万行TypeScript代码的React应用,包含Chrome扩展、CLI工具、Tauri客户端和Expo移动应用
- 部署:Vercel平台实现网站2分钟快速部署,其他应用暂未自动化
核心工作流
- 并行处理:使用3-8个并行终端运行
codexCLI工具,采用原子提交保持代码库整洁 - 模型选择:主要使用GPT-5 Codex中档配置,平衡智能与速度
- 变更管理:采用"爆炸半径"概念评估修改影响范围,及时干预耗时任务
工具对比
- Codex优势:
- 23万token上下文容量(Claude仅15.6万)
- 更高效token使用和消息队列功能
- Rust重写带来显著速度提升
- 交互体验更接近工程师思维模式
- 其他工具:
- 认为多数工具(如amp、Factory)只是现有模型的包装层
- 开源工具opencode和crush更有潜力
实践技巧
- 提示工程:Codex下提示更简洁,50%提示附带截图辅助定位
- 代码维护:20%时间用于重构(重复代码检测、死代码清理等)
- 测试策略:要求AI在功能完成后立即编写测试
- 特殊命令:仅保留/commit、/automerge等少数实用命令
经验总结
- 避免过度设计:无需复杂RAG或子智能体架构
- 培养工程直觉:管理AI智能体与管理工程师团队类似
- 保持批判思维:AI工具仍会出错,需保持监督
作者强调,优秀软件工程的核心仍是系统设计和用户体验,AI只是提升效率的工具。文章最后特别说明全文为人工撰写,保留了作者原始风格。
(注:原文包含大量技术细节和工具对比,本文在保留核心观点的基础上进行了适当精简,去除了部分社交媒体引用和次要工具讨论。)
评论总结
以下是评论内容的总结,平衡呈现不同观点并保留关键引用:
1. 对AI编程效率的质疑
- 认为多AI协作可能比传统编程更耗精力: "this multi-AI approach would be significantly more tiring"(squirrel)
- 质疑代码质量与数量: "300k LOC also isn’t impressive if it should have been 10k"(sarchertech) "he admits to code being slop...agents also refactor it?"(hansmayer)
2. 工具功能比较(Claude Code vs Codex)
- 肯定Claude的Hooks功能: "Hooks let you codify guardrails...a killer feature"(philipp-gayret)
- 对Codex的怀疑: "I am dubious Whether it's actually superior or it's 'organic marketing'"(N_Lens)
- 实际体验对比: "A simple task...9m+ and still 'inspecting specific directory'"(pqdbr)
3. 适用场景讨论
- 简单任务效果好: "AI does a great job, it's all pretty shallow"(barrkel)
- 复杂任务不可靠: "Making changes requires a lot of thought...can't trust it"(barrkel)
- 个人使用差异: "I'm not even close to claiming that AI writes 50% of my code"(srameshc)
4. 对高生产力案例的怀疑
- 质疑项目真实性: "checkout their dozens of unconnected, half finished repos"(sarchertech)
- 成本效益问题: "costs you 1000 dollars a month for this experience?"(codyb)
- 希望看到实际演示: "I'd love to be able to watch people work"(bigblind)
5. 技术细节质疑
- 数据库管理问题: "how they handle schema changes?...a disaster looming"(cruffle_duffle)
- 内存消耗问题: "process blows up to gigabytes of memory"(aredox)
- 代码审查可行性: "You can generate more code than you can read"(esafak)
6. 中立/积极评价
- 承认工具价值: "The tools certainly are useful...OP is happy"(mherrmann)
- 英语错误引发的思考: "it says something about fundamentals"(aredox)
关键争议点集中在:AI生成代码的质量/数量比、不同工具的实效对比、复杂场景的适用性,以及高调案例的真实性。支持者肯定效率提升,怀疑者则关注隐藏成本和技术局限性。