Hacker News 中文摘要

RSS订阅

与它对话——一种能动工程方法 -- Just talk to it – A way of agentic engineering

文章摘要

作者Peter Steinberger分享了他利用智能代理工程高效开发的经验。他目前独自开发一个包含30万行TypeScript代码的多平台项目,通过优化工作流程,智能代理已能完成他几乎所有的代码编写。他强调与其纠结复杂方案,不如直接与AI对话解决问题,并推荐参考他之前关于最优AI工作流的文章。

文章总结

标题:直接对话——高效智能体工程实践 | Peter Steinberger

作者近期专注于一个大型项目开发,通过实践总结出一套高效的智能体工程工作流。以下为文章核心内容:

技术栈与工作环境

  • 项目规模:30万行TypeScript代码的React应用,包含Chrome扩展、CLI工具、Tauri客户端和Expo移动应用
  • 部署:Vercel平台实现网站2分钟快速部署,其他应用暂未自动化

核心工作流

  1. 并行处理:使用3-8个并行终端运行codex CLI工具,采用原子提交保持代码库整洁
  2. 模型选择:主要使用GPT-5 Codex中档配置,平衡智能与速度
  3. 变更管理:采用"爆炸半径"概念评估修改影响范围,及时干预耗时任务

工具对比

  • Codex优势
    • 23万token上下文容量(Claude仅15.6万)
    • 更高效token使用和消息队列功能
    • Rust重写带来显著速度提升
    • 交互体验更接近工程师思维模式
  • 其他工具
    • 认为多数工具(如amp、Factory)只是现有模型的包装层
    • 开源工具opencode和crush更有潜力

实践技巧

  1. 提示工程:Codex下提示更简洁,50%提示附带截图辅助定位
  2. 代码维护:20%时间用于重构(重复代码检测、死代码清理等)
  3. 测试策略:要求AI在功能完成后立即编写测试
  4. 特殊命令:仅保留/commit、/automerge等少数实用命令

经验总结

  • 避免过度设计:无需复杂RAG或子智能体架构
  • 培养工程直觉:管理AI智能体与管理工程师团队类似
  • 保持批判思维:AI工具仍会出错,需保持监督

作者强调,优秀软件工程的核心仍是系统设计和用户体验,AI只是提升效率的工具。文章最后特别说明全文为人工撰写,保留了作者原始风格。

(注:原文包含大量技术细节和工具对比,本文在保留核心观点的基础上进行了适当精简,去除了部分社交媒体引用和次要工具讨论。)

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

1. 对AI编程效率的质疑

  • 认为多AI协作可能比传统编程更耗精力: "this multi-AI approach would be significantly more tiring"(squirrel)
  • 质疑代码质量与数量: "300k LOC also isn’t impressive if it should have been 10k"(sarchertech) "he admits to code being slop...agents also refactor it?"(hansmayer)

2. 工具功能比较(Claude Code vs Codex)

  • 肯定Claude的Hooks功能: "Hooks let you codify guardrails...a killer feature"(philipp-gayret)
  • 对Codex的怀疑: "I am dubious Whether it's actually superior or it's 'organic marketing'"(N_Lens)
  • 实际体验对比: "A simple task...9m+ and still 'inspecting specific directory'"(pqdbr)

3. 适用场景讨论

  • 简单任务效果好: "AI does a great job, it's all pretty shallow"(barrkel)
  • 复杂任务不可靠: "Making changes requires a lot of thought...can't trust it"(barrkel)
  • 个人使用差异: "I'm not even close to claiming that AI writes 50% of my code"(srameshc)

4. 对高生产力案例的怀疑

  • 质疑项目真实性: "checkout their dozens of unconnected, half finished repos"(sarchertech)
  • 成本效益问题: "costs you 1000 dollars a month for this experience?"(codyb)
  • 希望看到实际演示: "I'd love to be able to watch people work"(bigblind)

5. 技术细节质疑

  • 数据库管理问题: "how they handle schema changes?...a disaster looming"(cruffle_duffle)
  • 内存消耗问题: "process blows up to gigabytes of memory"(aredox)
  • 代码审查可行性: "You can generate more code than you can read"(esafak)

6. 中立/积极评价

  • 承认工具价值: "The tools certainly are useful...OP is happy"(mherrmann)
  • 英语错误引发的思考: "it says something about fundamentals"(aredox)

关键争议点集中在:AI生成代码的质量/数量比、不同工具的实效对比、复杂场景的适用性,以及高调案例的真实性。支持者肯定效率提升,怀疑者则关注隐藏成本和技术局限性。