文章摘要
谷歌开发者博客宣布Imagen 4 Fast及Imagen 4系列在Gemini API中的全面可用性,标志着该技术在开发者平台上的进一步推广和应用。
文章总结
Imagen 4 Fast及Imagen 4系列在Gemini API中全面上线
2025年8月15日,Google宣布其最先进的文本生成图像模型Imagen 4已在Gemini API和Google AI Studio中全面上线。此次发布标志着文本生成图像质量迈出了重要一步,尤其是在文本渲染方面,相较于之前的模型有了显著提升。
Imagen 4系列:满足创意需求的模型
除了Imagen 4,Google还推出了专为速度设计的Imagen 4 Fast,与强大的Imagen 4和Imagen 4 Ultra一同构成完整的Imagen 4系列。这一系列为用户提供了平衡质量、速度和成本的完美工具。
- [新] Imagen 4 Fast:适合快速生成图像和高容量任务,每张输出图像的价格仅为0.02美元,速度极快。
- Imagen 4:旗舰模型,适用于各种高质量图像生成任务,尤其在文本渲染方面有显著改进。
- Imagen 4 Ultra:当创意需求最高级别的细节和严格遵循提示时,Imagen 4 Ultra能够提供高度一致的结果。
更高分辨率,更多细节
为了进一步突破创意边界,Imagen 4和Imagen 4 Ultra现在支持生成分辨率高达2K的图像,能够创建出极其细致和清晰的视觉效果,非常适合用于营销素材或复杂的艺术创作。
Imagen 4 Fast的实际应用
以下是使用Imagen 4 Fast生成的一些示例,展示了该模型在不同风格和内容上的多样性。
- 风景/自然图像:黎明时分的山脉景观,前景是清澈的湖泊,倒映着白雪覆盖的山峰。
- 四格漫画:复古风格的四格漫画,展示了Imagen 4的快速生成能力。
- 复古科幻电影海报:具有复古风格的科幻电影海报,展示了Imagen 4在细节和风格上的表现力。
开始使用Imagen
作为负责任AI的一部分,所有由Imagen 4系列生成的图像都带有SynthID的不可见水印。用户可以通过官方文档和示例代码开始使用Imagen 4。
Google期待看到用户通过Gemini API和Google AI Studio使用Imagen 4创造的作品。
相关文章
评论总结
评论主要围绕Imagen模型的表现和功能展开,观点多样,既有批评也有肯定。
Imagen 4的生成效果不佳
- nkzd指出Imagen 4生成的图像过于“卡通化”,不符合其产品对逼真图像的需求。
- 引用:“results were too 'cartoonish'”(结果太“卡通化”了)。
文档信息不足
- ctippett批评文档页面未提供关于最新Imagen模型的信息,仅展示了Gemini 2.0 Flash的示例。
- 引用:“leads to a page that documents nothing about the latest Imagen models”(跳转到一个没有记录最新Imagen模型信息的页面)。
Webcomic生成效果差
- gawa认为生成的Webcomic角色显得虚假且不自然,未能准确遵循提示指令。
- 引用:“the characters look very fake, unsettling”(角色看起来非常假,令人不安)。
- tmvphil也指出模型完全忽略了四格漫画中的明确指令。
- 引用:“totally disregards the many explicit instructions”(完全忽略了众多明确的指令)。
与其他工具的比较
- typpilol表示Copilot在处理相同任务时表现更好。
- 引用:“I asked basically copilot the same and got a much better result”(我基本上问了Copilot同样的问题,得到了更好的结果)。
Imagen在图像处理中的实用性
- HocusLocus肯定了Imagen在黑白图像处理和灰度调整方面的实用性,但认为其色彩分离功能较为初级。
- 引用:“good for preparing B&W greyscale photographs”(适合准备黑白灰度照片)。
- 引用:“'color separation' capability is rudimentary”(色彩分离功能较为初级)。
与其他模型的区别
- nh43215rgb询问Imagen是否与其他人讨论的Google新模型不同。
- 引用:“This is different from nano banana that others are talking about”(这与其他人讨论的nano banana不同吗?)。
总结:评论者对Imagen的评价褒贬不一,主要集中在生成效果、文档信息、指令遵循能力以及与其他工具的比较上。