Hacker News 中文摘要

文章摘要

该文章介绍了LateNiteSoft团队通过运行600多次图像生成测试，对前沿AI图像生成模型进行的比较评估研究。

文章总结

专业AI图像生成模型横向评测报告

背景概述

LateNiteSoft作为拥有15年iOS摄影应用开发经验的团队（代表作Camera+、Photon等），针对当前主流AI图像生成模型进行了系统性测试。团队基于自建的"CreditProxy"按次计费系统，通过600余次图像生成测试，对比了OpenAI、Gemini和Seedream三大模型在不同场景下的表现。

测试框架

测试样本：选取宠物、人像、风景、汽车和产品五类典型照片
核心指标：生成质量、提示词理解、耗时（OpenAI高精度模式80秒/张，Gemini 11秒/张，Seedream 9秒/张）
测试类别：经典滤镜、镜头效果、风格迁移、人像特效和创意生成五大场景

关键发现

经典滤镜场景：
- Gemini在保持原图细节方面最优，但艺术表现力保守
- OpenAI存在"AI粗糙化"倾向，人像处理易失真
- 示例：在"复古照片"效果中，Gemini保留真实质感，OpenAI则添加了过度艺术化噪点
创意生成场景：
- OpenAI展现最强创造力，在"70年代黑胶封面"等任务中完胜
- Gemini对"神秘门户"等提示会产生诡异解读（如将人脸替换为传送门）
- Seedream在"未来科技元素"任务中表现出独特亚洲美学风格
风格迁移场景：
- OpenAI在吉卜力动画风格转换中保持领先
- Gemini对人像艺术化处理存在安全限制（部分效果拒绝执行）
- Seedream在浮世绘风格测试中展现文化优势
技术亮点：
- 提示词精确性至关重要（如"针孔相机效果"需明确避免字面理解）
- Seedream在低多边形艺术等特定风格中超越其他模型
- Gemini会对模糊提示主动发起追问（如"需要隔离哪个物体"）

商业应用建议

混合部署策略：艺术类需求导向OpenAI，写实类选择Gemini
成本优化：Seedream在性价比方面表现突出（速度最快，成本最低）
提示词工程：需建立标准化提示词库避免歧义

未来方向

团队正在开发"提示词分类器"系统，计划实现模型自动路由功能。本次测试数据采集于2025年10月8日，使用各平台最新稳定版本模型。

（注：原文中大量重复的图片对比模块和导航信息已精简，保留核心测试结论和典型示例）

评论总结

以下是评论内容的总结：

关于OpenAI图像生成的特点
- 多位用户指出OpenAI生成图像有黄色调倾向（"You can always identify the OpenAI result because it's yellow" - Dwedit）
- 对人物面部处理过度，会标准化面部特征（"OpenAI is reducing to some sort of median face" - whoaoweird）
- 生成速度较慢且可能重复添加元素（"prone to taking eight times longer...add a third cat over and over" - jrflowers）
不同模型的比较
- Gemini倾向于保持原图不变，特别是在人物照片上（"Gemini seems to refuse to apply any edits at all" - gs17）
- Seedream支持4K输出且表现接近NanoBanana（"Seedream is the only one that outputs 4k" - Scrapemist）
- 有用户认为Gemini略优于Seedream（"pick Gemini narrowly over Seedream" - beezle）
对测试方法的质疑
- 测试设计可能不够科学，使用随机词语同样有效（"using random words would be just as valid" - th0ma5）
- 测试图像选择不佳（"wish they'd used a better image than the low contrast mountain" - stevage）
- 建议增加原图对比（"original image should also be included" - angry_albatross）
其他观点
- 生成式AI用于简单过滤可能不划算（"Using gen. ai for filters is stupid" - yapyap）
- 艺术家可能面临被AI取代的风险（"Are artists going the way of the horse and buggy?" - sema4hacker）
- 有用户提供测试平台（"we build our sandbox just for this use case" - treesciencebot）

我们进行了600多次图像生成测试以比较AI图像模型 -- We ran over 600 image generations to compare AI image models