Hacker News 中文摘要

RSS订阅

FUTO Swipe – 一种新的滑动输入模型 -- FUTO Swipe – A new swipe typing model

文章摘要

FUTO Swipe是一款快速、精准的滑行输入系统,可在FUTO键盘应用中使用,也支持开发者下载模型。它解决了隐私侵犯或未授权库的问题,采用开源模型和算法,并基于超过100万次滑行数据训练。

文章总结

FUTO Swipe是一款快速、精准的滑动输入系统,目前已在FUTO键盘(一款完全离线的安卓键盘应用)中投入使用,用户也可下载其模型进行开发。该系统旨在解决长期以来优质滑动输入被隐私侵犯型键盘应用或未授权私有库垄断的问题。FUTO Swipe是FUTO公司开发的开源模型与算法系列,主要服务于FUTO键盘,同时也欢迎社区使用其模型,但要求对最终用户进行可见的署名。

在数据集方面,2024年8月,FUTO通过swipe.futo.org网站收集了超过100万次QWERTY英语滑动数据,经筛选后于2025年3月在HuggingFace上以MIT许可证发布了100万次滑动数据集。这些数据被用于训练模型和评估不同滑动输入系统。

模型架构包含三种类型:编码器模型(通用布局和语言无关,用于一般情况下的滑动输入预测,但精度非顶尖)、ContextLM模型(针对单一语言的小型语言模型,通过消除无意义词汇提升预测质量,仅需文本数据训练)和解码器模型(针对特定语言和布局,学习布局特性并实现领先精度,目前仅有QWERTY英语解码器)。三者结合,在测试集上实现了约4%的前四候选失败率,忽略词汇外情况时错误率低于1%。

模型体积极小:编码器仅635,140参数,解码器额外304,155参数,ContextLM最大为150万参数(其中110万为嵌入层),总活跃参数1,364,271,总参数2,494,767。这使得模型能在低端设备上毫秒级运行,训练环境成本也很低,仅需一个工作站GPU。

此外,FUTO还发布了C++库swipe-library,负责推理、解码和束搜索,帮助用户从滑动路径生成单词预测。FUTO Swipe模型采用FUTO模型许可证,推理库采用GPL许可证,相关论文正在筹备中。

评论总结

根据评论内容,总结如下:

主要观点与论据:

  1. 正面评价(认可度高):多数用户认为FUTO键盘的滑动输入(swipe)功能出色,接近或优于GBoard和SwiftKey。例如,用户prism56称“Futo with the new swipe model is the first android keyboard I've used that I don't feel like I'm compromising vs GBoard”(评分None,认可度高);用户popcar2表示“it feels as good as the Google keyboard”(评分None,认可度高)。用户nozzlegear称赞网站演示“neat”(评分None)。

  2. 负面评价(认可度低):部分用户指出问题。用户jordand抱怨“word suggestions were either odd or random”和“passive aggressive prompt saying I should really purchase a license”(评分None,认可度低)。用户blopker提到“randomly capitalizes words”和“doesn't seem to take context into account”(评分None,认可度中等)。用户HiPhish批评许可证问题:“the library uses the GPLv3 (good) while the Android keyboard uses the Futo License (shit)”(评分None,认可度低)。

  3. 功能对比与需求:用户jawns好奇与SwiftKey对比(评分None);用户satvikpendem希望保留自定义词历史(评分None);用户OsrsNeedsf2P询问韩语支持(评分None);用户jacooper抱怨多语言键盘布局重复(评分None)。用户amelius担忧“snapping to the nearest English word”会阻碍语言进化(评分None)。

  4. 平台与许可证争议:用户madspindel批评“boycotting iOS”(评分None);用户functionmouse指出“confusing license setup”(评分None)。用户skeledrew提到HeliBoard使用Google的滑动库(评分None)。

平衡性总结:评论呈现明显分歧。正面评价集中于滑动输入准确性和隐私优势,负面评价涉及许可证问题、词建议质量、平台限制和功能缺失。多数用户认可其进步,但认为尚未完全超越GBoard。