Hacker News 中文摘要

RSS订阅

粗犷更佳 -- Coarse Is Better

文章摘要

文章探讨了AI绘画技术的进步与艺术性的关系。作者对比了早期DALL-E、Midjourney v2与最新Nano Banana Pro生成的图像,发现虽然新技术在细节处理上更精细,但早期模型的作品反而更具艺术感和想象力。核心观点是:粗糙有时比精细更好,技术进步未必带来艺术性的提升。

文章总结

粗糙之美:AI艺术进化的悖论

当DALL-E横空出世时,那种震撼感让我整整两周都合不拢嘴。我会带着满脑子的创作提示兴奋入睡,期待第二天重新获得生成配额。这种体验如同发现新宇宙般神奇,我将那些惊艳作品收录在艺术图鉴中。

技术进化vs艺术退步

朋友最近用Nano Banana Pro(NBP)重跑了我早期的创作提示,将新旧模型输出并列对比。令人深思的是:经过多年发展,模型在图像精度上突飞猛进,艺术表现力却断崖式下跌。

案例对比

  1. 电子轮廓(意大利未来主义风格)

    • 旧版Midjourney呈现鲜艳的抽象色块,虽不完全符合未来主义,却充满张力
    • NBP产出严格符合风格定义,但色彩沉闷如工业制图
  2. 九龙寨城(布丹风格)

    • 旧作虽不符合史实,却以粗犷笔触营造出印象派的神秘感
    • NBP输出像现代电影般去饱和,即使强制要求"粗糙印象派"仍显呆板
  3. 诗人梦境花园(波斯细密画)

    • 早期版本通过抽象构图唤起想象,右上角颜料斑点宛如《百鸟朝凤》中的戴胜鸟
    • NBP直接生成博物馆展柜照片,将诗性提示机械理解为文献记录

艺术本质的消逝

在《洛夫莱斯肖像》案例中,旧模型用罗塞蒂风格的窄色调绿营造出惊人美感,而NBP只产出画廊场景的平庸照片。更讽刺的是,《宇宙微波背景》的波斯细密画创作,NBP竟直接将科学图像套进传统画框。

模糊的魔力

我最爱的DALL-E 2作品《梦的故事》系列,那些模糊的棕褐色照片完美复现了《黄衣之王》的诡异氛围。而NBP的产出却是公园游客照片,还自作聪明加上博物馆档案标签。

结语

早期AI艺术的魅力恰恰在于其不完美——那些模糊、矛盾和留白构成了想象力的呼吸空间。当模型追求过度精确时,反而丧失了创造多义性艺术的能力。或许我们该呼吁:让AI艺术重新变得怪异起来吧。

(本文对比图像详见原文,发表于2025年12月21日)

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

  1. 批评新模型缺乏艺术性

    • 认为新模型过度优化导致失去独特艺术风格:"Years of refinement on the taste of people with no taste has produced a model with no taste" (airza)
    • 指出艺术需要意识与意图:"art requires consciousness and intent while this type of model is capable of neither" (Zak)
  2. 支持新模型的实用价值

    • 强调工具定位差异:"Nano Banana Pro throws out fantastic images you can actually use in your marketing right away" (spaceman_2020)
    • 认为新模型更精准:"new models have prompt adherence precise enough to distinguish what 'British Museum'... is from the art itself" (pornel)
  3. 关于提示技巧的争议

    • 批评作者使用缺陷性提示:"The author is using special prompts exploiting flaws of the old models" (pornel)
    • 反驳提示问题:"Just remove the sentence, and you'll be fine... This analysis is just noise" (airstrike)
  4. 艺术本质的讨论

    • 否定AI创作艺术:"AI doesn’t make art... trying to fit the square peg of their intuitive understanding about the art creation process" (only-one1701)
    • 提倡传统创作:"any mess you produce will give you more joy than any shot produced by any clanker brain" (delis-thumbs-7e)
  5. 技术改进建议

    • 提出模型选择方案:"use Flux.2 with a LoRA or perhaps a coarser model like Zit" (BoredPositron)
    • 建议探索绘画技法:"Another cool prompt could be specific painting techniques" (smurda)

关键分歧点在于:新模型在精确性/商业价值与艺术表现力之间的权衡,以及AI是否真正具备艺术创作能力。支持者强调实用性(如营销图片),反对者则认为失去了早期模型的"意外美感"。