Hacker News 中文摘要

文章摘要

Liquid AI发布了新一代边缘计算模型LFM2.5-8B-A1B，该模型在消费级硬件上实现了快速可靠的工具调用。相比前代产品，新模型将上下文窗口扩展至128K，预训练数据从12T增至38T，并采用大规模强化学习，同时词汇量翻倍以提升非拉丁语言的编码效率。该模型可在入门级笔记本上流畅运行，支持工具链式调用完成任务，现已登陆Hugging Face和Playground平台。

文章总结

Liquid AI发布新一代边缘计算模型LFM2.5-8B-A1B

2026年5月28日，Liquid AI正式推出专为消费级硬件设计的边缘计算模型LFM2.5-8B-A1B。该模型在2025年10月发布的LFM2-8B-A1B基础上进行了全面升级，主要特点包括：

核心升级： 1. 上下文窗口从32K扩展至128K token 2. 预训练数据量从12T增至38T token 3. 词表规模扩大一倍至128K，显著提升非拉丁语系（如印地语、泰语等）的编码效率 4. 采用纯推理架构，通过思维链提升回答质量

性能表现： - 在AA全知指数上得分-24.7，较前代提升53.62分 - 非幻觉回答率从7.46%提升至63.47% - 数学推理（MATH500）准确率达88.76% - 支持单日处理超16亿token的高吞吐量

技术亮点： 1. 词表扩展采用渐进式训练策略，保持原有token映射关系 2. 通过RoPE基值调整实现上下文窗口扩展 3. 新增防循环机制和反幻觉强化学习阶段

部署支持： - 全面适配llama.cpp、MLX、vLLM等推理框架 - 在M5 Max芯片上实现253 token/s的解码速度 - 手机端可维持30 token/s的推理速度

应用场景：随模型同步开源的LocalCowork演示项目，展示了在单台笔记本电脑上运行包含67种工具的智能代理系统，所有数据处理均在本地完成。

获取方式：基础模型和精调模型已同步发布于Hugging Face平台和Liquid AI Playground，支持开发者本地微调与部署。

这项发布标志着Liquid AI在实现"全设备AI"愿景上迈出重要一步，为构建完全本地的私有化智能代理奠定了基础。

评论总结

以下是评论内容的总结，平衡呈现不同观点并保留关键引用：

正面评价（认可模型性能与实用性）

对小型模型性能的惊喜
- elorant："Wow, this is fucking phenomenal... For an 8B model this is quite impressive."（"哇，这太他妈棒了...对于8B模型来说相当惊艳"）
- chabes："The small models are getting really impressive... fast, private, and doesn’t require internet connection."（"小型模型越来越惊人...快速、隐私且无需联网"）
技术潜力与本地化优势
- adityashankar："having sparser models means more real-time actions on a locally hosted model"（"更稀疏的模型意味着本地部署模型的实时性更强"）
- ramshanker："Guess we can run this even on CPU!"（"估计连CPU都能跑！"）

质疑与批评

对训练数据量的担忧
- Ifkaluva："38T tokens seems like a lot for an 8B model"（"8B模型用38T token训练可能过量"）
- bee_rider："They seem much better than all the models they compared against? What’s the catch?"（"它们似乎远超对比模型？有什么猫腻？"）
功能支持问题
- HenryMulligan："Why no day-one support for Ollama?"（"为何不首日支持Ollama？"）
- zmmmmm："No vision support?"（"不支持视觉？"）

其他观点

幽默/讽刺：gmuslera称其为"Homeopathic AI"（"顺势疗法AI"），mlmonkey通过洗车问题调侃模型回答风格。
技术细节讨论：irthomasthomas提到"chinchilla scaling is 1800x"（"千兆缩放达1800倍"）。

中立信息

用户SubiculumCode询问demo链接（localcowork项目），adityashankar提供了playground试用地址。

总结：评论普遍认可模型的高效与小体积优势，但对训练数据量、功能支持及性能真实性存在疑问，部分用户提出技术细节或幽默反馈。