文章摘要
Cursor公司实验让多个AI编程代理长期并行协作,在单一项目上编写了百万行代码。研究发现单个代理适合专注任务,但复杂项目需要动态协调多个代理的工作,而非预先规划。团队通过让代理平等互动来学习协作,探索如何突破AI编程的边界。
文章总结
标题:规模化长期自主编程的探索
来源:https://cursor.com/blog/scaling-agents 发布时间:2026年1月14日
我们持续数周进行自主编程代理的实验,旨在探索如何突破代理编程的极限,完成通常需要人类团队数月才能完成的项目。本文将分享我们在单个项目上运行数百个并发代理、协调其工作并观察其编写超百万行代码的实践经验。
单一代理的局限性 当前代理擅长处理聚焦任务,但对复杂项目效率低下。我们尝试让多个代理并行工作,但协调成为主要挑战。
协调机制的演进 初始采用动态协调方案:代理通过共享文件自我协调,使用锁机制避免任务冲突。但出现以下问题: 1. 锁机制成为瓶颈,20个代理的实际吞吐量仅相当于2-3个 2. 系统脆弱性:锁未释放、重复获取锁等问题频发
改用乐观并发控制后,系统更稳健,但仍存在代理回避困难任务、缺乏整体责任感等问题。
分层架构突破 我们建立分层体系: - 规划者:持续探索代码库并创建任务,可递归生成子规划者 - 执行者:专注完成任务,不参与全局协调 - 评审代理:决定是否进入下一迭代周期
这种架构解决了协调问题,使大规模项目开发成为可能。
实践成果 1. 浏览器开发:一周内生成100万行代码(1000个文件) 2. Solid到React迁移:3周完成26.6万行代码修改 3. 产品优化:Rust版本使视频渲染速度提升25倍 4. 其他项目:Java语言服务器(55万行)、Win7模拟器(120万行)、Excel克隆(160万行)
关键发现 1. 模型选择至关重要:GPT-5.2在长期任务中表现更优 2. 简化优于复杂:去除冗余的集成角色后效率提升 3. 提示词设计是关键:直接影响代理的协调能力和长期专注度
未来方向 虽然当前系统已能支持数百代理数周的协作,但仍有优化空间: - 实现任务完成的动态唤醒 - 解决代理运行时长控制问题 - 防止思维固化和目标偏离
这些技术将逐步融入Cursor的代理能力。我们诚邀对AI辅助软件开发感兴趣的英才加入(hiring@cursor.com)。
评论总结
以下是评论内容的总结:
对AI编码能力的认可
- 认为AI代理通过分工协作可以完成复杂项目,类似人类团队工作方式
- "They mention loads of parallel agents... akin to how humans work in teams" (jphoward)
- "any large piece of software... will be able to be quickly rewritten by coding agents" (ZitchDog)
对浏览器项目的质疑
- 质疑"从零开始"的说法,指出依赖大量现有库
- "Define 'from scratch'... has over 100 crates as dependencies" (mk599)
- 代码质量存疑,测试失败但PR仍被合并
- "code seems filled with errors... PRs all been failing CI but merged" (embedding-shape)
对实际应用价值的讨论
- 认为未合并的PR缺乏说服力,需要更多实际案例
- "why haven't they merged that PR... examples feel thin" (trjordan)
- 关注维护成本而非代码可读性
- "only thing that matters is... cost of maintenance" (tiredandawake)
行业影响预测
- 类比3D打印未取代工厂,AI也不会取代软件开发
- "this doesn't mean the death of software products" (nl)
- 认为可能降低软件成本
- "cost of software will be driven down to... cost of the tokens" (mccoyb)
开发过程观察
- 指出AI开发面临与人类团队相似的问题
- "integration creating bottlenecks... lack of consistent direction" (matthewfcarlson)
- 质量与速度的权衡
- "only way to achieve the results... is to sacrifice quality" (luhego)