文章摘要
该项目提供了一个基于网页的交互式平台,使用苹果的ml-sharp模型来创建高斯溅射效果。用户可以通过该工具在线生成和体验相关视觉效果。
文章总结
GitHub项目:ml-sharp-web - 基于Apple ml-sharp模型的高斯泼溅生成器
项目简介
这是一个基于Apple ml-sharp模型的浏览器端高斯泼溅(Gaussian Splats)生成工具。用户可以通过上传单张图片,在浏览器中直接生成3D高斯泼溅效果,并支持预览和下载PLY格式文件。
核心功能
- 单图片上传处理
- 浏览器端实时生成高斯泼溅
- 交互式3D预览(使用GaussianSplats3D库)
- PLY文件导出
技术栈
- 运行时:Bun
- 前端框架:React + TypeScript + Vite
- AI推理:ONNX Runtime Web
- 3D渲染:WebGPU/WASM
使用要求
- 安装Bun环境
- 现代浏览器(推荐Chrome/Edge)
- 预留2.4GB磁盘空间(模型文件)
快速启动
shell
bun install # 安装依赖
bun dev # 启动开发服务器
模型注意事项
- 需要同时提供
.onnx和.onnx.data两个模型文件 - 默认使用云端托管模型(避免本地加载大文件)
许可声明
必须遵守Apple的模型使用许可,仅限研究用途。
项目状态
实验性原型阶段,性能受浏览器和硬件配置影响较大。
相关链接
- 在线演示:https://ml-sharp-web.vercel.app/
- 原论文:arXiv:2512.10685
- 作者Twitter:@bringshrubberyy
该项目由bring-shrubbery和claude共同维护,已获得100星标和4个分支。
评论总结
以下是评论内容的总结:
技术实现与浏览器兼容性
- 作者成功将Apple的SHARP模型转换为ONNX格式,实现了在浏览器中本地运行(无需服务器),但模型较大(2.4GB),首次加载较慢。
- 引用:“What works: drop in an image, get a .ply...”(“功能:上传图片即可生成.ply文件...”)
- 兼容性问题:部分用户反馈在Firefox/Linux下无法运行,且Chrome可能出现内存不足(“out of memory”)。
- 引用:“Loading the model crashes my browser tab...”(“加载模型导致浏览器标签崩溃...”)
模型效果与局限性
- 用户实测效果参差不齐,部分场景(如风景照)效果远不如演示示例。
- 引用:“results were nowhere close to the demo...”(“结果与演示相差甚远...”)
- 单张图片输入可能导致生成内容不准确(如将海报误建模为3D)。
- 引用:“it is going to make up a lot of stuff...”(“它会虚构很多内容...”)
隐私与本地化优势
- 纯客户端运行保护隐私(图片不离本地)。
- 引用:“all on your machine — your image never leaves the tab”(“全部在本地完成——图片不会离开标签页”)。
技术生态与改进建议
- ONNX在Web端的应用仍有优化空间(如WebGPU支持不足)。
- 引用:“ONNX web leaves a lot to be desired...”(“ONNX在Web端还有很多不足...”)
- 多图输入技术现状被提及,但当前流程仍不够成熟。
应用场景与潜力
- 用户分享基于SHARP的简易VR应用,可快速将本地图片转为3D场景。
- 引用:“view them fully spatially... quite transformative”(“以全空间视角查看...非常颠覆”)。
模型规模与格式讨论
- 2.4GB的ONNX模型引发对参数规模的讨论,同时肯定ONNX格式的设计。
- 引用:“ONNX actually quite clever...”(“ONNX的设计非常巧妙...”)。
总结:评论肯定该技术的创新性和隐私优势,但指出兼容性、效果稳定性及单图输入的限制,同时探讨了Web端AI工具的生态挑战。