文章摘要
未来AI助手将能无缝整合数百种工具,通过按需调用而非预加载来提升效率,同时结合自然语言与代码执行能力,根据任务需求灵活选择最优方案。
文章总结
标题:Claude开发者平台推出高级工具使用功能
核心内容:
- 功能背景
- AI代理的未来需要处理数百甚至数千种工具的无缝协作
- 传统工具调用方式存在三大痛点:
- 工具定义占用大量上下文空间(可达134K token)
- 中间结果污染上下文窗口
- JSON模式无法表达实际使用规范
- 三大新功能 (1) 工具搜索工具
- 动态按需加载工具定义而非全部预加载
- 示例:将55K token的工具定义降至8.7K
- 准确率提升:Opus 4从49%→74%,Opus 4.5从79.5%→88.1%
(2) 编程式工具调用 - 通过代码编排工具调用流程 - 优势: * 减少37%的token消耗(43,588→27,297) * 支持并行执行 * 知识检索准确率提升25.6%→28.5%
(3) 工具使用示例 - 提供具体调用示例补充JSON模式 - 准确率提升:72%→90%(复杂参数场景)
- 最佳实践
- 分层使用:根据瓶颈选择对应功能
- 工具搜索:保持3-5个高频工具常驻
- 编程调用:标注清晰的返回格式
- 使用示例:展示1-5个典型调用场景
- 技术实现
- 通过API标记工具属性实现:
- deferloading:延迟加载
- allowedcallers:允许编程调用
- input_examples:使用示例
- 应用场景
- Excel处理:无需加载完整电子表格
- 预算审查:自动汇总2000+行消费记录
- 工单系统:规范复杂嵌套参数
- 获取方式
- 当前处于beta测试阶段
- 需添加特定请求头启用
致谢部分提及了来自Anthropic团队和外部项目的贡献,包括LLMVM、Cloudflare代码模式等启发。
(注:原文中的具体代码示例、图片链接和部分技术细节已精简,保留了核心功能说明和关键数据)
评论总结
AI工具设计的复杂性与简化之争
观点1:AI工具设计存在复杂性循环
- 评论1指出AI工具设计经历了"复杂→简单→复杂"的循环,从Manus/Devin的复杂框架到简单LLM循环,再到MCP增加功能但消耗上下文,现在又回归复杂工具。
"We seem to be on a cycle of complexity -> simplicity -> complexity"
"I wonder if there will be another round of simplifications"
观点2:工具搜索工具的利弊
- 评论7和19讨论工具搜索工具的价值与问题:可访问数千工具但可能引发工具滥用(如TEO优化),且在准确性和可扩展性间权衡。
"tool makers start to abuse Tool Engine Optimization"
"Seems like we traded scalability for accuracy, then accuracy for scalability"
观点3:程序化工具调用的优势
- 评论9和14高度评价程序化工具调用,认为其是自然演进,优于手动复制数据的LangChain式设计,但需更紧凑的工具定义语言。
"Programmatic tool use feels like the way it always should have worked"
"It is clear we are heading towards code as a language for LLMs"
观点4:上下文管理的改进需求
- 评论4和6批评预加载工具JSON模式浪费上下文窗口,呼吁更高效的管理方法。
"This is such a waste of context window"
"What’s the best way to prevent the input context from compounding?"
观点5:GraphQL的替代方案
- 评论13主张GraphQL优于MCP,因其能最小化数据传输并解决N+1问题。
"I strongly believe it is one of the best technologies for AI agents"
"The agent only receives the minimal amount of data"
观点6:工具设计的根本问题
- 评论17和22质疑当前工具设计的本质,认为应直接调用API或构建有状态的真实工具界面。
"why not just let them call those APIs directly?"
"It feels crazy to me that we are building 'tool search'"
其他观点
- 评论20预测未来网络将变成数十亿工具的集合,由AI动态调用。
- 评论21将工具搜索类比为"工具的RAG",让LLM专注于核心任务。
(注:所有评论均无评分数据,故未包含认可度信息)