Hacker News 中文摘要

RSS订阅

OSS ChatGPT WebUI – 530模型、MCP、工具、Gemini RAG、图像/音频生成 -- OSS ChatGPT WebUI – 530 Models, MCP, Tools, Gemini RAG, Image/Audio Gen

文章摘要

llms.py发布了v3版本,新增了CLI工具、Web界面、多模态支持(图像、音频、文件处理)、媒体生成(图像和音频)等功能,并提供了系统提示库和模型选择器等核心工具。

文章总结

LLMS.py v3 版本发布说明

发布日期: 2026年1月26日
版本重点: 扩展性增强、多模型支持与用户体验优化


🚀 核心更新一览

| 功能 | 描述 | |------|------| | 530+模型支持 | 集成models.dev,支持24家供应商的530余种模型 | | 模型选择器 | 全新设计的UI,支持搜索、筛选、排序与收藏功能 | | 扩展系统 | 通过插件架构可添加功能、供应商或自定义UI | | Gemini RAG | 支持文件搜索存储库管理,实现检索增强生成(RAG)工作流 | | 工具调用 | 支持Python函数调用,与本地环境交互 | | MCP协议 | 连接Model Context Protocol服务器扩展工具能力 | | 桌面自动化 | 支持鼠标、键盘控制及屏幕截图等操作 | | KaTeX公式渲染 | 支持LaTeX数学表达式美观排版 | | 媒体生成 | 内置图像/音频生成功能,支持Google、OpenAI等供应商 |


🌟 主要功能详解

  1. 模型选择器升级

    • 新增智能搜索、高级筛选、灵活排序及收藏功能
    • 支持快速启用/禁用供应商(示例截图
  2. 扩展性重构

    • 核心代码重写,所有功能模块化
    • 支持通过~/.llms/extensions文件夹安装社区扩展
    • 示例:圣诞主题扩展可替换品牌Logo和欢迎页
  3. Gemini RAG扩展
    bash llms --add gemini # 安装扩展

    • 支持文件拖拽上传、分类管理及双向同步
    • 可实现文档级、分类级或全库的知识检索(操作界面
  4. 工具支持

    • 函数自动注册示例: python def get_current_time(tz:str=None) -> str: """获取当前时间(ISO格式)""" return datetime.now(ZoneInfo(tz)).isoformat()
    • UI提供工具开关管理(工具页面截图
  5. 媒体生成

    • 图像生成命令: bash llms -m "gemini-2.5-flash-image" --out image "星空下的山脉"
    • 音频生成支持Gemini 2.5 TTS模型
  6. SQLite存储

    • 迁移至服务端数据库,支持多设备同步
    • 资源文件缓存路径:~/.llms/cache

🛠️ 安装与升级

bash pip install llms-py --upgrade llms --serve 8000 # 启动服务


📌 社区生态建设

v3版本为开发者提供完整的扩展API,鼓励创建社区插件。遇到问题可提交至GitHub讨论区

祝您使用愉快!🎄
—— LLMS.py团队

(注:本文保留核心功能描述,精简了重复的界面说明和部分命令行示例,删除导航菜单等非核心内容)

评论总结

总结评论内容:

  1. 对项目发布方式的质疑
  • 作者mdrzn指出发布频率异常:"Posted 5 times in the last 7 days, today it finally got 29 points with 0 comments? Weird."
  1. 对项目优势的肯定
  • 作者turblety赞赏许可和功能改进:"This looks like it's not only a better license, but also much better features."
  • 对比OpenWebUI:"the weird licence and inability to just pay for branding has frustrated me."
  1. 技术实现询问
  • 作者storystarling关注代理状态管理:"Is that running on LangGraph or did you roll a custom state machine?"
  • 指出技术难点:"I've found managing state consistency in long-running agent loops to be the hardest part"
  1. 替代方案建议
  • 作者chicagobuss提出简单方案:"why not just use llm by simon willison"
  1. 产品命名质疑
  • 作者cyanydeez认为名称不准确:"What is ChatGPT used in the title when it's clearly a much more flexible ui?"
  1. API使用疑问
  • 作者tiahura质疑付费API必要性:"Do people really use claude code or any other agent with a paid api key?"
  • 建议替代方案:"Why wouldn't you just get Claude Max?"
  1. 生产应用关注
  • 作者augusteo询问实际应用场景:"Are people using this for production workloads or mostly experimentation?"
  1. 功能咨询
  • 作者thedevilslawyer关注多用户支持:"Can this be used in a multi user scenario?"