Hacker News 中文摘要

RSS订阅

液态AI发布8B-A1B混合专家模型,基于38T数据训练 -- Liquid AI reveals 8B-A1B MoE trained on 38T

文章摘要

Liquid AI发布了新一代边缘计算模型LFM2.5-8B-A1B,该模型在消费级硬件上实现了快速可靠的工具调用。相比前代产品,新模型将上下文窗口扩展至128K,预训练数据从12T增至38T,并采用大规模强化学习,同时词汇量翻倍以提升非拉丁语言的编码效率。该模型可在入门级笔记本上流畅运行,支持工具链式调用完成任务,现已登陆Hugging Face和Playground平台。

文章总结

Liquid AI发布新一代边缘计算模型LFM2.5-8B-A1B

2026年5月28日,Liquid AI正式推出专为消费级硬件设计的边缘计算模型LFM2.5-8B-A1B。该模型在2025年10月发布的LFM2-8B-A1B基础上进行了全面升级,主要特点包括:

核心升级: 1. 上下文窗口从32K扩展至128K token 2. 预训练数据量从12T增至38T token 3. 词表规模扩大一倍至128K,显著提升非拉丁语系(如印地语、泰语等)的编码效率 4. 采用纯推理架构,通过思维链提升回答质量

性能表现: - 在AA全知指数上得分-24.7,较前代提升53.62分 - 非幻觉回答率从7.46%提升至63.47% - 数学推理(MATH500)准确率达88.76% - 支持单日处理超16亿token的高吞吐量

技术亮点: 1. 词表扩展采用渐进式训练策略,保持原有token映射关系 2. 通过RoPE基值调整实现上下文窗口扩展 3. 新增防循环机制和反幻觉强化学习阶段

部署支持: - 全面适配llama.cpp、MLX、vLLM等推理框架 - 在M5 Max芯片上实现253 token/s的解码速度 - 手机端可维持30 token/s的推理速度

应用场景: 随模型同步开源的LocalCowork演示项目,展示了在单台笔记本电脑上运行包含67种工具的智能代理系统,所有数据处理均在本地完成。

获取方式: 基础模型和精调模型已同步发布于Hugging Face平台和Liquid AI Playground,支持开发者本地微调与部署。

这项发布标志着Liquid AI在实现"全设备AI"愿景上迈出重要一步,为构建完全本地的私有化智能代理奠定了基础。

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

正面评价(认可模型性能与实用性)

  1. 对小型模型性能的惊喜

    • elorant:"Wow, this is fucking phenomenal... For an 8B model this is quite impressive."("哇,这太他妈棒了...对于8B模型来说相当惊艳")
    • chabes:"The small models are getting really impressive... fast, private, and doesn’t require internet connection."("小型模型越来越惊人...快速、隐私且无需联网")
  2. 技术潜力与本地化优势

    • adityashankar:"having sparser models means more real-time actions on a locally hosted model"("更稀疏的模型意味着本地部署模型的实时性更强")
    • ramshanker:"Guess we can run this even on CPU!"("估计连CPU都能跑!")

质疑与批评

  1. 对训练数据量的担忧

    • Ifkaluva:"38T tokens seems like a lot for an 8B model"("8B模型用38T token训练可能过量")
    • bee_rider:"They seem much better than all the models they compared against? What’s the catch?"("它们似乎远超对比模型?有什么猫腻?")
  2. 功能支持问题

    • HenryMulligan:"Why no day-one support for Ollama?"("为何不首日支持Ollama?")
    • zmmmmm:"No vision support?"("不支持视觉?")

其他观点

  • 幽默/讽刺:gmuslera称其为"Homeopathic AI"("顺势疗法AI"),mlmonkey通过洗车问题调侃模型回答风格。
  • 技术细节讨论:irthomasthomas提到"chinchilla scaling is 1800x"("千兆缩放达1800倍")。

中立信息

  • 用户SubiculumCode询问demo链接(localcowork项目),adityashankar提供了playground试用地址。

总结:评论普遍认可模型的高效与小体积优势,但对训练数据量、功能支持及性能真实性存在疑问,部分用户提出技术细节或幽默反馈。