Hacker News 中文摘要

RSS订阅

我们进行了600多次图像生成测试以比较AI图像模型 -- We ran over 600 image generations to compare AI image models

文章摘要

该文章介绍了LateNiteSoft团队通过运行600多次图像生成测试,对前沿AI图像生成模型进行的比较评估研究。

文章总结

专业AI图像生成模型横向评测报告

背景概述

LateNiteSoft作为拥有15年iOS摄影应用开发经验的团队(代表作Camera+、Photon等),针对当前主流AI图像生成模型进行了系统性测试。团队基于自建的"CreditProxy"按次计费系统,通过600余次图像生成测试,对比了OpenAI、Gemini和Seedream三大模型在不同场景下的表现。

测试框架

  1. 测试样本:选取宠物、人像、风景、汽车和产品五类典型照片
  2. 核心指标:生成质量、提示词理解、耗时(OpenAI高精度模式80秒/张,Gemini 11秒/张,Seedream 9秒/张)
  3. 测试类别:经典滤镜、镜头效果、风格迁移、人像特效和创意生成五大场景

关键发现

  1. 经典滤镜场景

    • Gemini在保持原图细节方面最优,但艺术表现力保守
    • OpenAI存在"AI粗糙化"倾向,人像处理易失真
    • 示例:在"复古照片"效果中,Gemini保留真实质感,OpenAI则添加了过度艺术化噪点
  2. 创意生成场景

    • OpenAI展现最强创造力,在"70年代黑胶封面"等任务中完胜
    • Gemini对"神秘门户"等提示会产生诡异解读(如将人脸替换为传送门)
    • Seedream在"未来科技元素"任务中表现出独特亚洲美学风格
  3. 风格迁移场景

    • OpenAI在吉卜力动画风格转换中保持领先
    • Gemini对人像艺术化处理存在安全限制(部分效果拒绝执行)
    • Seedream在浮世绘风格测试中展现文化优势
  4. 技术亮点

    • 提示词精确性至关重要(如"针孔相机效果"需明确避免字面理解)
    • Seedream在低多边形艺术等特定风格中超越其他模型
    • Gemini会对模糊提示主动发起追问(如"需要隔离哪个物体")

商业应用建议

  1. 混合部署策略:艺术类需求导向OpenAI,写实类选择Gemini
  2. 成本优化:Seedream在性价比方面表现突出(速度最快,成本最低)
  3. 提示词工程:需建立标准化提示词库避免歧义

未来方向

团队正在开发"提示词分类器"系统,计划实现模型自动路由功能。本次测试数据采集于2025年10月8日,使用各平台最新稳定版本模型。

(注:原文中大量重复的图片对比模块和导航信息已精简,保留核心测试结论和典型示例)

评论总结

以下是评论内容的总结:

  1. 关于OpenAI图像生成的特点

    • 多位用户指出OpenAI生成图像有黄色调倾向("You can always identify the OpenAI result because it's yellow" - Dwedit)
    • 对人物面部处理过度,会标准化面部特征("OpenAI is reducing to some sort of median face" - whoaoweird)
    • 生成速度较慢且可能重复添加元素("prone to taking eight times longer...add a third cat over and over" - jrflowers)
  2. 不同模型的比较

    • Gemini倾向于保持原图不变,特别是在人物照片上("Gemini seems to refuse to apply any edits at all" - gs17)
    • Seedream支持4K输出且表现接近NanoBanana("Seedream is the only one that outputs 4k" - Scrapemist)
    • 有用户认为Gemini略优于Seedream("pick Gemini narrowly over Seedream" - beezle)
  3. 对测试方法的质疑

    • 测试设计可能不够科学,使用随机词语同样有效("using random words would be just as valid" - th0ma5)
    • 测试图像选择不佳("wish they'd used a better image than the low contrast mountain" - stevage)
    • 建议增加原图对比("original image should also be included" - angry_albatross)
  4. 其他观点

    • 生成式AI用于简单过滤可能不划算("Using gen. ai for filters is stupid" - yapyap)
    • 艺术家可能面临被AI取代的风险("Are artists going the way of the horse and buggy?" - sema4hacker)
    • 有用户提供测试平台("we build our sandbox just for this use case" - treesciencebot)