Hacker News 中文摘要

RSS订阅

Show HN:苹果的Sharp通过ONNX Runtime Web在浏览器中运行 -- Show HN: Apple's Sharp Running in the Browser via ONNX Runtime Web

文章摘要

该项目提供了一个基于网页的交互式平台,使用苹果的ml-sharp模型来创建高斯溅射效果。用户可以通过该工具在线生成和体验相关视觉效果。

文章总结

GitHub项目:ml-sharp-web - 基于Apple ml-sharp模型的高斯泼溅生成器

项目简介

这是一个基于Apple ml-sharp模型的浏览器端高斯泼溅(Gaussian Splats)生成工具。用户可以通过上传单张图片,在浏览器中直接生成3D高斯泼溅效果,并支持预览和下载PLY格式文件。

核心功能

  • 单图片上传处理
  • 浏览器端实时生成高斯泼溅
  • 交互式3D预览(使用GaussianSplats3D库)
  • PLY文件导出

技术栈

  • 运行时:Bun
  • 前端框架:React + TypeScript + Vite
  • AI推理:ONNX Runtime Web
  • 3D渲染:WebGPU/WASM

使用要求

  1. 安装Bun环境
  2. 现代浏览器(推荐Chrome/Edge)
  3. 预留2.4GB磁盘空间(模型文件)

快速启动

shell bun install # 安装依赖 bun dev # 启动开发服务器

模型注意事项

  • 需要同时提供.onnx.onnx.data两个模型文件
  • 默认使用云端托管模型(避免本地加载大文件)

许可声明

必须遵守Apple的模型使用许可,仅限研究用途。

项目状态

实验性原型阶段,性能受浏览器和硬件配置影响较大。

相关链接

  • 在线演示:https://ml-sharp-web.vercel.app/
  • 原论文:arXiv:2512.10685
  • 作者Twitter:@bringshrubberyy

该项目由bring-shrubbery和claude共同维护,已获得100星标和4个分支。

评论总结

以下是评论内容的总结:

  1. 技术实现与浏览器兼容性

    • 作者成功将Apple的SHARP模型转换为ONNX格式,实现了在浏览器中本地运行(无需服务器),但模型较大(2.4GB),首次加载较慢。
    • 引用:“What works: drop in an image, get a .ply...”(“功能:上传图片即可生成.ply文件...”)
    • 兼容性问题:部分用户反馈在Firefox/Linux下无法运行,且Chrome可能出现内存不足(“out of memory”)。
    • 引用:“Loading the model crashes my browser tab...”(“加载模型导致浏览器标签崩溃...”)
  2. 模型效果与局限性

    • 用户实测效果参差不齐,部分场景(如风景照)效果远不如演示示例。
    • 引用:“results were nowhere close to the demo...”(“结果与演示相差甚远...”)
    • 单张图片输入可能导致生成内容不准确(如将海报误建模为3D)。
    • 引用:“it is going to make up a lot of stuff...”(“它会虚构很多内容...”)
  3. 隐私与本地化优势

    • 纯客户端运行保护隐私(图片不离本地)。
    • 引用:“all on your machine — your image never leaves the tab”(“全部在本地完成——图片不会离开标签页”)。
  4. 技术生态与改进建议

    • ONNX在Web端的应用仍有优化空间(如WebGPU支持不足)。
    • 引用:“ONNX web leaves a lot to be desired...”(“ONNX在Web端还有很多不足...”)
    • 多图输入技术现状被提及,但当前流程仍不够成熟。
  5. 应用场景与潜力

    • 用户分享基于SHARP的简易VR应用,可快速将本地图片转为3D场景。
    • 引用:“view them fully spatially... quite transformative”(“以全空间视角查看...非常颠覆”)。
  6. 模型规模与格式讨论

    • 2.4GB的ONNX模型引发对参数规模的讨论,同时肯定ONNX格式的设计。
    • 引用:“ONNX actually quite clever...”(“ONNX的设计非常巧妙...”)。

总结:评论肯定该技术的创新性和隐私优势,但指出兼容性、效果稳定性及单图输入的限制,同时探讨了Web端AI工具的生态挑战。