Hacker News 中文摘要

RSS订阅

显示HN:Omni——基于Postgres的开源工作场所搜索与聊天工具 -- Show HN: Omni – Open-source workplace search and chat, built on Postgres

文章摘要

GitHub上的Omni项目是一个工作场所AI助手和搜索平台,提供AI代码创建、开发者工作流和应用安全等功能,包括GitHub Copilot、Actions、Codespaces等工具。该项目旨在帮助开发者更高效地编写代码、管理项目和保障安全。

文章总结

GitHub 项目:Omni - 职场AI助手与搜索平台

项目概述 Omni 是一个面向职场的AI助手与搜索平台,能够连接各类办公应用,帮助员工快速查找信息并完成工作任务。该项目采用Apache-2.0开源协议,当前获得288星标和8次分叉。

核心功能 1. 统一搜索
- 支持Google Drive/Gmail、Slack、Confluence、Jira等应用的全文检索(BM25)和语义搜索(pgvector) - 权限继承机制,确保用户仅能访问已授权的数据

  1. AI智能体

    • 提供聊天交互界面,支持工具调用
    • 可执行Python/bash代码(在沙箱容器中运行),具备数据分析能力
  2. 私有化部署

    • 完全运行在用户自有基础设施上,数据不离开内部网络
    • 支持主流LLM模型(Anthropic/OpenAI/Gemini等)和开源模型(通过vLLM)
  3. 简易部署

    • 提供Docker Compose单机部署方案
    • 支持通过Terraform在AWS/GCP进行生产级部署

技术架构 - 数据库:采用PostgreSQL(ParadeDB)统一处理全文搜索、向量搜索和业务数据 - 多语言开发:核心服务使用Rust(搜索/索引)、Python(AI编排)和SvelteKit(前端) - 安全沙箱:代码执行环境具备网络隔离、文件系统限制和资源管控

部署与集成 - 支持的应用:Google Workspace、Slack、Confluence、Jira、HubSpot等 - 部署指南:提供Docker Compose和Terraform(AWS/GCP)详细文档 - 扩展性:每个数据源连接器作为独立容器运行,支持多语言开发

社区资源 - 官方文档:docs.getomni.co - Discord社区:discord.gg/aNr2J3xD - 贡献指南:项目仓库中的CONTRIBUTING.md文件

(注:已过滤GitHub页面导航菜单、用户交互元素等非核心内容,保留技术细节和项目关键信息)

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

  1. 技术实现与数据隔离
    用户关注数据隔离和权限管理问题,特别是多用户环境下的实现方式。

    • "I'm curious how you handle data isolation... Managing user mapping was super painful" (评论1)
    • "How are you managing multiplayer and permissions?... The docs aren't clear" (评论11)
  2. 数据库选择争议
    对仅使用PostgreSQL的方案存在分歧:部分用户认为其简洁高效,另一些则质疑扩展性。

    • "Postgres as a search backend... works really well... No stale results" (评论10)
    • "How well does the Postgres-only approach hold up... benchmark against Elasticsearch?" (评论2)
  3. 功能定义与术语争议
    关于产品功能描述和术语使用存在讨论。

    • "Can we please not change the meaning of chat to mean agent interface?" (评论8)
    • "Could you elaborate on 'not just a basic RAG'?" (评论5)
  4. 产品对比与竞品分析
    用户要求与类似产品(如Onyx/Danswer)进行功能对比。

    • "How does it compare to Onyx...?" (评论9)
  5. 技术细节质疑
    指出文档链接失效问题,并对"自托管"宣传提出修正建议。

    • "Multiple pages link to a API Reference that returns a 404" (评论3)
    • "No data leaves your network... unless you use cloud LLMs" (评论7)
  6. 集成需求
    用户询问对其他平台(如Teams)的兼容性。

    • "Can it connect to Teams?" (评论6)

关键争议集中在:数据隔离实现、PostgreSQL方案的合理性、术语定义的准确性,以及与其他产品的差异化。