Hacker News 中文摘要

文章摘要

该研究探讨了大型语言模型代理在信息检索任务中不同检索策略(如grep和向量检索)与代理架构、工具调用范式的交互影响，通过实验比较了它们在处理相关和无关文本时的性能表现。

文章总结

标题：Grep是否足够？智能体框架如何重塑代理搜索范式

来源：arXiv数据库（2026年5月15日发布）

核心内容： 1. 研究背景： - 大语言模型(LLM)代理的最新进展支持复杂的工作流程 - 现有研究缺乏对检索策略与代理架构、工具调用范式之间关系的系统比较

研究方法：

实验1：比较grep和向量检索在116个问题样本上的表现
- 使用定制代理框架Chronos和主流CLI框架
- 测试两种工具结果呈现方式：内联结果和独立文件结果
实验2：在逐步增加无关对话历史的情况下，比较纯grep和纯向量检索

主要发现：

grep检索在实验1中普遍表现优于向量检索
整体性能受框架选择和工具调用方式的显著影响
即使使用相同对话数据，不同框架仍会产生差异

研究意义：

填补了代理搜索系统中检索策略比较的研究空白
揭示了工具输出呈现方式和干扰文本对性能的影响

注：删减了原文中重复的URL信息、技术细节过深的描述以及版本历史等非核心内容，保留了研究设计、方法和关键结论等核心信息。

评论总结

以下是评论内容的总结，平衡呈现不同观点并保留关键引用：

支持传统grep的观点
- 认为grep在代码搜索中表现优异，尤其适用于结构化数据：
  - "grep’s design is surprisingly winning, exceeding expectations to this day."（piekvorst）
  - "With structured inputs like source code, I’d expect grep to outperform semantic search"（gbacon）
支持混合/替代方案的观点
- 建议结合多种工具或使用更先进的搜索技术：
  - "give the agent all the tools and let it decide which to use...this X vs Y is uninteresting when the answer can be both"（jeffchuber）
  - "Combining regex filtering with semantic ranking using multi-vector embeddings has yielded good results"（alexrigler）
对研究的质疑
- 指出研究局限性和标题夸大：
  - "Don’t presume this study has anything to do with programming. They measured an agent’s ability to search long conversations"（quinncom）
  - "This paper oversells on the title...what is chronos, which embedding model was used"（stephantul）
结构化数据的优势
- 强调结构化数据在代理工作流中的价值：
  - "using Palantir's 'Ontology' graph framework...is going to be able to achieve some exception and differentiating outcomes"（piker）
组织内容的重要性
- 指出内容组织比搜索技术更重要：
  - "Just organizing content is at least half of building search...It’s not all technology"（softwaredoug）
工具选择的讨论
- 关于工具替代的思考：
  - "I have a hook that rewriters grep to rg but lately I wonder if this is actually wasteful"（hmokiguess）

关键分歧点在于：传统文本搜索（如grep）与语义/向量搜索的适用场景，以及研究结论的普适性。多数评论认为工具选择应取决于具体使用场景和数据特性。

Grep就够了吗？智能代理如何重塑代理搜索 -- Is Grep All You Need? How Agent Harnesses Reshape Agentic Search

文章摘要

文章总结

评论总结