文章摘要
瑞士AI倡议联合EPFL、苏黎世联邦理工学院和CSCS开发了完全开放的基础模型Apertus,其训练数据、代码、权重、方法和对齐原则均公开可复现。该模型符合欧盟AI法案要求,性能与顶级开放模型相当,支持1000多种语言。
文章总结
Apertus是由瑞士人工智能倡议(Swiss AI Initiative)开发的全开放基础模型,由EPFL、苏黎世联邦理工学院和CSCS合作完成。该模型秉持完全开放原则,训练数据、代码、权重、方法及对齐原则均公开透明且可复现,如同开源之于软件。它符合欧盟AI法案要求,能尊重用户退出选择、移除个人身份信息并防止记忆化,为全球应用提供合规基础。在性能上,Apertus与同等规模(8B和70B参数)的顶级开放模型竞争,且从发布之初就支持1000多种语言,具备多语言能力。瑞士电信(Swisscom)是瑞士人工智能倡议的战略合作伙伴。如需获取最新动态,可订阅其新闻通讯,了解Apertus发布、团队研究及社区新闻。
评论总结
以下是对评论内容的总结,关注主要观点、论据及认可度,并保持不同观点的平衡性:
1. 对模型性能的批评(低认可度) - 评论2:认为模型声称遵守版权法但实际未做到,因此“完全无用”("completely useless")。 - 评论7:指出模型在多语言任务中不可靠,如翻译和动词变位,常产生幻觉("hallucinating words that do not exist")。
2. 对模型实用性的肯定(中等认可度) - 评论4:认为模型虽不适合代理任务,但作为RAG的通用驱动模型“相当胜任”("pretty competent"),可用于构建实用软件。
3. 对开源生态的讨论(高认可度) - 评论5:列举其他完全开源模型(如OLMo 3.1、K2 Think V2),并引用Nemotron在基准测试中优于Deepseek R1的论点。 - 评论9:强调完全开源管道的重要性,认为这是实现“主权AI”("sovereign AI")的唯一途径,并指出若中国蒸馏实验室停止开源,美国实验室可能不再免费发布权重。
4. 对项目进展的质疑(中等认可度) - 评论3:质疑模型是否基于旧版Llama3.1微调,缺乏新进展。 - 评论8:认为项目“以委员会速度推进”("moves at the speed of a committee"),难以交付有竞争力的模型。
5. 对本地化部署的担忧(高认可度) - 评论10:指出当前战场是本地vs服务型LLM,但本地模型因用户体验差而“惨败”("losing that battle badly"),普通人更熟悉ChatGPT而非Gemma等本地模型。
6. 对团队潜力的认可(中等认可度) - 评论11:引用观点,认为项目最宝贵的产出是团队经验,若再次训练可大幅降低成本并提升效果。
7. 对数据隐私的关切(低认可度) - 评论13:对模型的数据退出和PII移除机制提出疑问,质疑请求合法性确认方式。