文章摘要
Krea与Black Forest Labs合作发布了FLUX.1 Krea的开源版本,该图像模型注重美学控制和图像质量,兼容现有生态系统。模型开发过程中强调特定美学偏好,并分享了预训练和后训练的见解及未来研究方向。
文章总结
标题:发布FLUX.1 Krea的开放权重
主要内容:
2025年7月31日,Krea团队宣布发布Krea 1的开放版本,这是他们与Black Forest Labs合作开发的第一个图像模型,旨在提供卓越的美学控制和图像质量。该模型与FLUX.1-dev完全兼容,能够无缝集成到现有生态系统中。FLUX.1-Krea [dev]经过蒸馏,以匹配Krea 1的质量,特别注重保持美学和照片级真实感。
与大多数图像模型不同,FLUX.1 Krea在设计时融入了特定的美学理念,旨在创建一个符合团队特定审美偏好的模型。技术报告中分享了开发该模型的过程和经验,包括预训练和后训练的见解,以及未来的研究方向。
“AI Look”的解析:
AI生成的图像通常具有独特的“AI look”,如过度模糊的背景、蜡质皮肤纹理和单调的构图。尽管生成模型在技术上取得了显著进步,但在追求技术能力和基准优化的过程中,早期图像模型的真实感、风格多样性和创意融合被忽视了。
模型训练的两个阶段:
- 预训练阶段:重点是“模式覆盖”和“世界理解”,目标是最大化多样性。预训练模型应包含“坏”数据,以便在后续阶段通过负提示引导模型远离不良部分。
- 后训练阶段:重点是去除分布中的不良部分,通过模式坍塌使模型偏向于生成符合美学标准的图像。
后训练流程:
后训练分为两个阶段:监督微调(SFT)和基于人类反馈的强化学习(RLHF)。在SFT阶段,团队手工挑选符合美学标准的高质量图像数据集,并加入Krea-1的合成样本以提高模型稳定性。在RLHF阶段,采用TPO技术进一步提升模型的美学和风格化。
关键发现:
- 质量优于数量:后训练所需的数据量较小,但数据质量至关重要。
- 采取有主见的方法:使用现有的偏好数据集可能导致模型回归“AI look”,因此团队选择收集符合自身审美偏好的数据。
未来研究方向:
Krea计划改进模型的核心能力,并扩展到更多视觉领域,使用户能够探索、混合和融合多样化的视觉元素。未来,团队希望通过个性化、美学和可控性研究,提供更符合用户个人审美的模型。
致谢:
感谢Black Forest Labs团队提供基础模型权重,以及数据、基础设施和产品团队的努力,为后训练流程奠定了基础。
引用:
@misc{flux1kreadev2025, author={Sangwu Lee, Titus Ebbecke, Erwann Millon, Will Beddow, Le Zhuo, Iker García-Ferrero, Liam Esparraguera, Mihai Petrescu, Gian Saß, Gabriel Menezes, Victor Perez}, title={FLUX.1 Krea [dev]}, year={2025}, howpublished={\url{https://github.com/krea-ai/flux-krea}} }
加入我们:
Krea正在招聘,欢迎加入我们,共同推动这一领域的发展。
评论总结
评论内容主要围绕Krea团队发布的开源模型FLUX Krea展开,涵盖了技术细节、应用场景、商业用途及用户反馈等多个方面。以下是主要观点和论据的总结:
技术细节与发布背景:
- Krea团队发布了FLUX Krea模型,并提供了相关技术文档和GitHub链接。
- 评论中提到了模型的参数规模(12B)和文件大小(23.8 GB),并讨论了VRAM需求。
- 团队表示愿意回答技术问题,并提供了相关博客文章和Huggingface模型卡链接。
- "FLUX.1 Krea is a 12B rectified flow model distilled from Krea-1, designed to be compatible with FLUX architecture." (评论3)
- "Relevant links: GitHub repository, Model Technical Report, Huggingface model card." (评论9)
应用场景与商业用途:
- 用户对模型的应用场景提出了疑问,包括生成逼真图像、机器人训练等。
- 有用户询问了模型的商业用途,如生成非AI生成的假脸图像。
- "But what's the business use case? Is it for people who want to put fake faces on their website that don't look AI generated?" (评论6)
- "Does this have any application for generating realistic scenes for robotics training?" (评论7)
用户反馈与建议:
- 用户对模型的生成效果提出了意见,认为图像仍具有AI生成的特征。
- 有用户建议提供更详细的商业授权路径和成本信息。
- "Images still look AI generated." (评论15)
- "I'd recommend you offer a clearly documented pathway for companies to license commercial output usage rights." (评论19)
技术问题与优化:
- 用户询问了数据集大小、NVIDIA优化版本等问题。
- 有用户提到使用特定工具(如axolotl)进行模型训练,并希望获得更多启动脚本。
- "How large was the dataset used for post-training?" (评论14)
- "Curious what others are using? What is the quickest way to get started?" (评论11)
总结:Krea团队的开源模型FLUX Krea引发了广泛的技术讨论,用户对其应用场景、商业用途和生成效果提出了多种问题和建议。团队积极回应,并提供了相关技术文档和资源。