Hacker News 中文摘要

RSS订阅

发布FLUX.1 Krea的开放权重 -- Releasing open weights for FLUX.1 Krea

文章摘要

Krea与Black Forest Labs合作发布了FLUX.1 Krea的开源版本,该图像模型注重美学控制和图像质量,兼容现有生态系统。模型开发过程中强调特定美学偏好,并分享了预训练和后训练的见解及未来研究方向。

文章总结

标题:发布FLUX.1 Krea的开放权重

主要内容:

2025年7月31日,Krea团队宣布发布Krea 1的开放版本,这是他们与Black Forest Labs合作开发的第一个图像模型,旨在提供卓越的美学控制和图像质量。该模型与FLUX.1-dev完全兼容,能够无缝集成到现有生态系统中。FLUX.1-Krea [dev]经过蒸馏,以匹配Krea 1的质量,特别注重保持美学和照片级真实感。

与大多数图像模型不同,FLUX.1 Krea在设计时融入了特定的美学理念,旨在创建一个符合团队特定审美偏好的模型。技术报告中分享了开发该模型的过程和经验,包括预训练和后训练的见解,以及未来的研究方向。

“AI Look”的解析:

AI生成的图像通常具有独特的“AI look”,如过度模糊的背景、蜡质皮肤纹理和单调的构图。尽管生成模型在技术上取得了显著进步,但在追求技术能力和基准优化的过程中,早期图像模型的真实感、风格多样性和创意融合被忽视了。

模型训练的两个阶段:

  1. 预训练阶段:重点是“模式覆盖”和“世界理解”,目标是最大化多样性。预训练模型应包含“坏”数据,以便在后续阶段通过负提示引导模型远离不良部分。
  2. 后训练阶段:重点是去除分布中的不良部分,通过模式坍塌使模型偏向于生成符合美学标准的图像。

后训练流程:

后训练分为两个阶段:监督微调(SFT)和基于人类反馈的强化学习(RLHF)。在SFT阶段,团队手工挑选符合美学标准的高质量图像数据集,并加入Krea-1的合成样本以提高模型稳定性。在RLHF阶段,采用TPO技术进一步提升模型的美学和风格化。

关键发现:

  1. 质量优于数量:后训练所需的数据量较小,但数据质量至关重要。
  2. 采取有主见的方法:使用现有的偏好数据集可能导致模型回归“AI look”,因此团队选择收集符合自身审美偏好的数据。

未来研究方向:

Krea计划改进模型的核心能力,并扩展到更多视觉领域,使用户能够探索、混合和融合多样化的视觉元素。未来,团队希望通过个性化、美学和可控性研究,提供更符合用户个人审美的模型。

致谢:

感谢Black Forest Labs团队提供基础模型权重,以及数据、基础设施和产品团队的努力,为后训练流程奠定了基础。

引用:

@misc{flux1kreadev2025, author={Sangwu Lee, Titus Ebbecke, Erwann Millon, Will Beddow, Le Zhuo, Iker García-Ferrero, Liam Esparraguera, Mihai Petrescu, Gian Saß, Gabriel Menezes, Victor Perez}, title={FLUX.1 Krea [dev]}, year={2025}, howpublished={\url{https://github.com/krea-ai/flux-krea}} }

加入我们:

Krea正在招聘,欢迎加入我们,共同推动这一领域的发展。

评论总结

评论内容主要围绕Krea团队发布的开源模型FLUX Krea展开,涵盖了技术细节、应用场景、商业用途及用户反馈等多个方面。以下是主要观点和论据的总结:

  1. 技术细节与发布背景

    • Krea团队发布了FLUX Krea模型,并提供了相关技术文档和GitHub链接。
    • 评论中提到了模型的参数规模(12B)和文件大小(23.8 GB),并讨论了VRAM需求。
    • 团队表示愿意回答技术问题,并提供了相关博客文章和Huggingface模型卡链接。
      • "FLUX.1 Krea is a 12B rectified flow model distilled from Krea-1, designed to be compatible with FLUX architecture." (评论3)
      • "Relevant links: GitHub repository, Model Technical Report, Huggingface model card." (评论9)
  2. 应用场景与商业用途

    • 用户对模型的应用场景提出了疑问,包括生成逼真图像、机器人训练等。
    • 有用户询问了模型的商业用途,如生成非AI生成的假脸图像。
      • "But what's the business use case? Is it for people who want to put fake faces on their website that don't look AI generated?" (评论6)
      • "Does this have any application for generating realistic scenes for robotics training?" (评论7)
  3. 用户反馈与建议

    • 用户对模型的生成效果提出了意见,认为图像仍具有AI生成的特征。
    • 有用户建议提供更详细的商业授权路径和成本信息。
      • "Images still look AI generated." (评论15)
      • "I'd recommend you offer a clearly documented pathway for companies to license commercial output usage rights." (评论19)
  4. 技术问题与优化

    • 用户询问了数据集大小、NVIDIA优化版本等问题。
    • 有用户提到使用特定工具(如axolotl)进行模型训练,并希望获得更多启动脚本。
      • "How large was the dataset used for post-training?" (评论14)
      • "Curious what others are using? What is the quickest way to get started?" (评论11)

总结:Krea团队的开源模型FLUX Krea引发了广泛的技术讨论,用户对其应用场景、商业用途和生成效果提出了多种问题和建议。团队积极回应,并提供了相关技术文档和资源。