文章摘要
尽管作者在2025年成功构建了多个实际应用的AI代理系统,但他对当前AI代理的炒作持怀疑态度。他认为,尽管这些系统在开发、数据基础设施、质量和流程等方面确实带来了实际价值并节省了大量时间,但市场对AI代理的期望可能过高,因此他选择对这股热潮持保留态度。
文章总结
为什么我赌2025年AI代理不会大获成功(尽管我在构建它们)
尽管2025年被广泛认为是“AI代理之年”,许多人预言自主AI将彻底改变工作方式,但我却对此持怀疑态度。作为一名在过去一年中构建了多个实际生产环境中运行的AI代理系统的开发者,我深知当前炒作背后的现实问题。
AI代理的三大硬伤
错误率在多步骤工作流中呈指数级增长:即使每一步的可靠性达到95%,经过20步后,整体成功率仅为36%。而生产系统需要99.9%以上的可靠性。
上下文窗口导致二次方成本增长:长对话的token成本会迅速攀升,使得大规模应用变得经济上不可行。
工具设计的挑战:真正的难点在于如何设计出AI代理能够有效使用的工具和反馈系统,而不仅仅是AI的能力。
数学现实:错误累积
AI代理在多步骤工作流中的错误累积问题使得完全自主的工作流在生产规模下几乎不可能实现。即使每一步的可靠性达到99%,经过20步后,成功率也仅为82%。这不是提示工程或模型能力的问题,而是数学上的现实。
经济现实:token成本
上下文窗口的二次方成本增长使得对话式代理在经济上不可行。例如,一个100轮的对话可能仅token成本就高达50到100美元,大规模应用时成本将难以承受。
工具设计的现实
即使解决了数学和经济问题,工具设计的复杂性也是一个巨大的挑战。每个工具都需要精心设计,以提供有效的反馈,同时不超出上下文窗口的限制。工具设计不仅仅是API调用,而是如何让AI理解复杂的操作状态和失败恢复机制。
集成现实
现实世界的系统并不像干净的API那样易于集成。企业系统往往存在各种遗留问题、部分故障模式、不断变化的认证流程和复杂的合规要求,这些都会让AI代理的集成变得异常困难。
成功的模式
成功的AI代理系统通常遵循以下模式:AI处理复杂性,人类保持控制,传统软件工程确保可靠性。例如,UI生成代理在部署前由人类审查,数据库代理在执行破坏性操作前进行确认,函数生成代理在明确的边界内操作。
我的预测
2025年,那些依赖“完全自主代理”的初创公司将首先面临经济困境,而企业软件公司则可能因为代理无法深度集成而停滞不前。真正的赢家将是那些构建受限、领域特定工具的团队,这些工具利用AI处理复杂部分,同时保持人类对关键决策的控制。
构建AI代理的正确方式
- 明确边界:定义代理的职责范围,明确哪些任务由人类或确定性系统处理。
- 设计容错机制:如何处理AI的错误?如何回滚?
- 解决经济问题:每次交互的成本是多少?如何随着使用量扩展?
- 优先考虑可靠性:用户更信任始终如一的工具,而不是偶尔“神奇”的系统。
- 建立在坚实的基础上:利用AI处理意图理解和内容生成,但依赖传统软件工程处理执行、错误处理和状态管理。
结语
AI代理的革命即将到来,但它不会像2025年人们所预言的那样。真正的成功将来自于那些能够解决可靠性、成本优化和集成复杂性的团队。
评论总结
评论内容主要围绕AI的现状、应用和未来发展展开,观点多样,既有对AI的批评,也有对其潜力的认可。以下是总结:
AI的局限性:
- 一些评论认为AI目前更适合辅助而非完全自动化,且存在可靠性问题。例如,dmezzetti指出:“AI目前最适合的是增强而非自动化。” (AI is best suited for augmentation not automation.)
- vntok提到:“业务自动化不需要完美,只需比现状更好即可。” (Business Process Automation via AI doesn’t need to be perfect. It simply needs to be sufficiently better than the status quo to pay for itself.)
AI代理(Agents)的争议:
- 部分评论对AI代理的实际应用表示怀疑,认为其尚未解决实际问题。infecto表示:“我还没看到AI代理解决任何问题。” (I have yet to see agents solve anything.)
- deadbabe质疑:“谁能给我一个AI代理真正带来利润的实际用例?” (I just want someone to give me one legit use case where an AI Agent now enables them to do something that couldn’t be done before, and actually makes an impact on overall profit.)
AI的未来发展:
- 一些评论对AI的未来持乐观态度,认为技术将不断进步。digitcatphd表示:“我相信文章中提到的问题在未来五年内会得到解决。” (I’m sure most of the problems cited in this article will be easily solved within the next five years or so.)
- raincole引用另一篇文章:“AI工具还不完美,但它们正在不断进步。” (AI tools aren’t perfect yet. They sometimes make mistakes, and they can’t always understand what you are trying to do. But they’re getting better all the time.)
AI与人类的协作:
- 评论强调AI与人类协作的重要性,尤其是在验证和检查点方面。KoolKat23提到:“人类的多步骤工作流通常有检查点,未来的AI代理也应如此。” (Human multi-step workflows tend to have checkpoints where the work is validated before proceeding further.)
- RamblingCTO建议:“最好有经过人类验证的检查点,避免完全自动化的风险。” (It’s best to have human validated checkpoints, small search spaces and very specific questions/prompts.)
对AI的批评与讽刺:
- 一些评论对AI的过度炒作表示不满。rvz讽刺道:“我们不能让这篇文章对AI代理的炒作产生恐慌,骗局需要继续下去。” (We can’t allow this post to create FUD about the current hype on AI agents and we need the scam to continue as long as possible.)
- roschdal直言:“AI是为那些没有自然智力的人准备的。” (AI is for people without natural intelligence.)
总结:评论中对AI的看法存在分歧,既有对其当前局限性的批评,也有对其未来潜力的期待。AI代理的实际应用尚未得到广泛认可,而AI与人类的协作被认为是当前最可行的方向。