文章摘要
借助人工智能技术,Ryan Pearce在自家洗衣房中运行了一个名为Searcha Page的搜索引擎,其隐私保护版本为Seek Ninja。尽管规模远不及谷歌,但通过巧妙资源利用和大量工作,Pearce成功打造了一个接近现代谷歌搜索体验的系统,展示了个人在有限硬件条件下也能实现高效搜索服务的能力。
文章总结
标题:借助AI,他在洗衣房里打造了一个谷歌的竞争对手
在2025年,Ryan Pearce在他的洗衣房里运行着一个名为Searcha Page的搜索引擎,其隐私保护版本称为Seek Ninja。尽管谷歌的搜索引擎早已无法容纳在单一数据中心内,但Pearce通过巧妙的资源利用和大量工作,成功在一台与谷歌早期服务器大小相当的机器上实现了接近现代谷歌的搜索体验。
Pearce的DIY搜索引擎主要依赖于旧服务器零件,并通过临时通风口散热。他的服务器最初放在卧室,但由于机器过热,影响了他的睡眠,最终被搬到了洗衣房。尽管搜索速度略有延迟,但搜索结果的质量往往超出预期,因为Searcha Page和Seek Ninja基于一个包含20亿条目的庞大数据库,Pearce预计半年内将扩展到40亿条。
Pearce的成功秘诀在于大型语言模型(LLM),他利用AI进行关键词扩展和上下文理解,这与谷歌20年前的做法类似,但加入了现代AI技术。尽管LLM在搜索引擎中的应用引发了一些争议,但AI早已成为现代搜索引擎的核心部分。
Pearce的搜索引擎构建成本为5000美元,其中3000美元用于存储,远低于全新硬件的成本。他通过“升级套利”策略,利用市场上大量廉价的旧服务器设备,实现了高性能的搜索体验。尽管他的系统不如云计算平台强大,但足以支持他的搜索引擎运行。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎还受益于Common Crawl等开放数据资源,这些资源为生成式AI提供了重要支持。尽管他在构建过程中遇到了一些挑战,如最初尝试使用向量数据库失败,但他通过不断迭代和改进,最终实现了功能强大的搜索引擎。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得Pearce无法在洗衣房内完全实现,但他通过SambaNova等低成本服务访问了强大的AI模型。
Pearce的搜索引擎不仅展示了个人开发者如何通过有限的预算和硬件接近谷歌的水平,还揭示了LLM在降低技术门槛方面的作用。尽管LLM的复杂性使得
评论总结
评论内容主要围绕个人搜索引擎的创建、技术挑战、市场竞争以及对现有搜索引擎(如Google)的批评展开。以下是主要观点和论据的总结:
1. 个人搜索引擎的可行性与挑战
- 支持观点:有人认为,随着技术的进步,个人创建搜索引擎的门槛降低,尤其是大语言模型(LLM)的应用。
- 引用:“I think it’s definitely lowered the barrier,” Lin says of the LLM’s role in enabling DIY search engines. (评论7)
- 引用:Google was invented many years ago by two guys in a dorm room... it seems like it could be done by a small group or independent person. (评论5)
- 质疑观点:也有人指出,技术并非主要障碍,真正的挑战在于市场力量和资源。
- 引用:The hardest part about building a search engine is not the actual searching though, it is... building your index and crawling the (extremely adversarial) internet. (评论8)
- 引用:I actually find it unlikely that a guy, who isn’t attempting some radical new type of search... can hope to compete with the orgs in Google. (评论15)
2. 对现有搜索引擎的批评
- 对Google的批评:有人认为Google的搜索结果质量下降,尤其是PageRank和反向链接的价值减弱。
- 引用:Google could use its own AI to evaluate URLs instead of relying on pagerank and backlinks which are almost completely valueless as a signal in 2025. (评论17)
- 引用:It’s tragic what Google is doing to the internet. (评论17)
- 对市场竞争的期待:有人希望看到更多竞争,尤其是隐私友好的搜索引擎。
- 引用:I greatly prefer Kagi but it’s very nice to see more competition in this space in general. (评论6)
3. 技术细节与创新
- 技术细节:评论中提到了一些技术细节,如使用AMD EPYC处理器和开源工具(如Solr/Lucene、Yacy)。
- 引用:The beefy CPU running this setup, a 32-core AMD EPYC 7532... It can now be had on eBay for less than $200. (评论10)
- 引用:step 1: indexer, solr/lucene... Step 2: crawler of which there are several foss. (评论16)
- 创新与开源:有人赞赏开源和自我托管的精神,认为这有助于推动创新。
- 引用:Great innovation plus cloud-skeptic self-hosting. There should be much much more of this! (评论4)
- 引用:I have 1542766 domains... It is available as a github repo, so anybody that wants to start crawling has some initial data to kick off. (评论12)
4. 对未来的展望
- 去中心化的可能性:有人认为,随着网络的去中心化,个人或社区可以创建符合自身需求的搜索引擎。
- 引用:With the decentralization/recentralization of the Web, it may become easier for certain people to roll their own search engines for their respective communities. (评论14)
- 对失败的宽容:即使项目不成功,也有人认为这种尝试本身具有价值。
- 引用:Even if this project doesn’t succeed, it reminds us that giant companies aren’t unshakable. (评论11)
5. 幽默与调侃
- 幽默评论:有人调侃搜索引擎的创建可能涉及洗钱,或提到Hacker News的“诅咒”。
- 引用:I’m sure there’s a money laundering joke in here somewhere. (评论9)
- 引用:Crashed? The curse of Hacker News! (评论18)
总结:评论中对个人搜索引擎的创建持不同态度,有人看好技术进步带来的机会,也有人认为市场竞争和技术挑战难以克服。同时,对现有搜索引擎(尤其是Google)的批评较多,期待更多竞争和创新。