文章摘要
该文章揭露了一个网站未经授权复制了《晦涩悲伤词典》全书内容,包括前言、311个新造词及其定义和插图,涉嫌大规模抄袭。
文章总结
上周,MetaFilter 用户分享了一个链接,指向一个看似是《晦涩悲伤词典》的新网站。该词典是约翰·柯尼希耗时十年打造的项目,旨在“为那些我们都能感受到却无法言说的情感创造词汇”。这个精美的网站包含了出版商宣传书籍时应有的一切:作者简介、媒体报道以及亚马逊购书链接。奇怪的是,它还包含了整本书的文本,从开篇800字的前言到全部311个新造词及其定义、词源和短文,均由柯尼希撰写。然而,书中由柯尼希及其他艺术家创作的原始拼贴插画却明显缺失,取而代之的是每个词条旁由DALL-E 2生成的AI图像,充满了该模型常见的错误和瑕疵。
网站首页的横幅鼓励访客“使用AI生成你自己的词汇——为你的悲伤发声!”“提交悲伤”功能允许用户描述一种感受,然后利用OpenAI的GPT-4生成新词、词源和定义,并配上AI生成的艺术作品,存入“用户生成的悲伤”画廊。MetaFilter成员立即对此产生怀疑,我也一样。我的妻子阿米和我于2022年制作了一款卡牌游戏《失语》,部分灵感就来自柯尼希的项目。我们拥有一本他的书,并且多年来一直在网上关注该项目。拥抱AI的做法似乎与他的风格不符。随后我注意到,新网站与原始Tumblr主页的域名完全不同:原版是dictionaryofobscuresorrows.com,而新网站是thedictionaryofobscuresorrows.com。这到底是怎么回事?
约翰·柯尼希于2009年在Tumblr上推出了《晦涩悲伤词典》,并于2013年扩展为一系列受欢迎的视频散文。如果你知道该项目中的任何一个词,那很可能是“sonder”,这个词已远远超出其起源,进入日常用语,并最终被Dictionary.com和韦氏词典收录。柯尼希创造的其他词汇,如“anemoia”(对从未经历过的时代或地方的怀旧感)、“vellichor”(旧书店中那种奇特的渴望)或“monachopsis”(微妙而持久的格格不入感),也在项目之外找到了生命力。但“sonder”是突破性的成功。我敢打赌,大多数听说过这个词的人并不知道它是由一个2012年在Tumblr上的人创造的。有一支R&B乐队名为Sonder,一家失败的Airbnb竞争对手,以及无数企业,从咨询公司、风险投资公司到咖啡馆和药房,都以Sonder命名。离我两英里远就有一家名为Sonder的酒吧。这一成功为柯尼希赢得了与西蒙与舒斯特出版社的图书合约,该书于2021年11月出版后成为《纽约时报》畅销书。两年后,大约在2023年8月,新的《晦涩悲伤词典》网站上线,但奇怪的是,官方Tumblr页面或社交媒体上没有任何提及。
柯尼希项目的使命,用他自己的话来说,是“照亮作为人类的基本奇特之处”。因此,他现在鼓励人们用大语言模型生成新词和定义,这让人感觉很奇怪,因为大语言模型是一种有争议的技术,它基于大量人类写作进行训练,却无法理解作为人类是什么感觉。我直接联系了约翰·柯尼希,询问他是否参与了该网站。他一小时后回复邮件说:“不,我与它毫无关系。不知道对此该想什么或做什么,因为那个网站相当精美。比我的好多了。”找到谁负责并不难,因为他们在每个页面的页脚“网站致谢”中列出了自己:Qontour(前身为Prompt Digital),一家总部位于旧金山的网页设计和营销机构。唯一暗示该网站未经授权的线索是他们作品集中的一个页面,其中提到“Qontour构建了交互式数字平台——在Webflow中设计网站,生成AI驱动的图像库,并推出了一个让访客提交自己的悲伤并为词典添加新定义的特色功能。”在该页面上,他们自称是这本书的“粉丝”:“该网站为粉丝(比如我们)提供了一个地方来查找所有内容——视频、评论、采访和购买链接——而不是在十几个平台上搜索。”当然,问题是,作为粉丝并不意味着他们有权将任何材料用于自己的网站。
在Qontour未经授权的网站页脚中,他们添加了版权声明,承认自己不拥有网站上任何材料的权利,同时将所有用户提交的词汇以CC Zero许可协议授权为公共领域。这暴露了对版权运作方式的根本误解。Qontour无权为了展示其网页设计技能而出版柯尼希整本书。他们还向Webflow的目录提交了他们的网站以宣传其设计业务。“这一努力展示了我们在网站设计、AI生成内容和广泛内容集成方面的专业知识。”在“雇佣Qontour”按钮下方,一个指向“版权信息”的小链接歪曲了他们的工作:“Qontour的《晦涩悲伤词典》根据知识共享署名-非商业性使用-禁止演绎4.0国际许可协议进行许可。保留所有权利。换句话说,这是别人的作品,所以你不得以任何理由复制或编辑它,但你可以与他人分享。”不用说,你不能重新许可你不拥有的内容。使他们的“粉丝致敬”说法更加复杂的是,Qontour还在整个网站中使用了他们自己的亚马逊联盟代码,这些代码是以他们之前的名称Prompt Digital创建的,从而从所有图书销售中分得一杯羹。这些佣金在过去几年里可能相当可观,因为该非官方网站现在几乎是与该书相关的所有查询的顶级搜索结果,包括书名、书中创造的词汇,甚至约翰·柯尼希的名字。在我尝试的每一次谷歌搜索中,非官方网站的排名都高于官方网站、出版商网站或维基百科。随着从传统网络搜索向对话式AI搜索的快速转变,情况变得更糟,因为对话式AI搜索容易被操纵,隐藏来源,并将上下文简化为简单答案。ChatGPT和Gemini都将盗版网站链接为官方网站,并声称是约翰·柯尼希创建了它。这造成了对其作者身份的合理混淆,并且可以说,通过其热情拥抱AI,损害了该项目和书籍的声誉。最初将网站发布到MetaFilter的人认为它是官方网站,而该帖子中的评论者随后合理地质疑这本书本身是否由AI撰写。我问柯尼希他的出版商是否计划向该网站发出停止侵权通知,但没有收到回复。给他发邮件后,我意识到西蒙与舒斯特出版社去年确实采取了行动来限制其影响力。他们于去年7月向谷歌提交了两份DMCA删除通知,要求从搜索结果中删除盗版网站的两个页面,但毫无效果。
粉丝出于对原始素材的热爱,在没有商业动机的情况下分享或混搭受版权保护的材料是一回事(“无意侵权!”)。而一家营销机构拿走一位在世作者整本书,用AI垃圾替换其艺术,添加AI词汇生成器,将流量变现,在其作品集中推广,然后在各处超越官方网站的排名,这完全是另一回事。这是一种比当今常见的抄袭更明目张胆的形式,通常人类创作的作品会通过AI模型进行“洗白”,变成与原始来源足够不同以避免法律问题。但看到它来自一家如此重度依赖生成式AI的机构并不令人惊讶。正如他们自豪地解释的那样,“这个网站上的每一页都是用Claude编写的”,使用了一个他们称之为“Q”的“作者角色”。这里缺少的是同意,这感觉像是AI的原罪。正如我之前多次写到的,生成式AI模型都是在大量人类创作的作品上训练的,没有署名、同意或补偿,从创作者那里提取价值,同时将权力集中在极少数大型科技公司手中。在更小的规模上,Qontour本可以联系约翰·柯尼希,请求允许重新出版他的作品,与他合作创建一个新的、改进的网站。他可能会要求他们仅限于发布在Tumblr上的词汇,要求他们不要构建AI功能,或者可能直接拒绝整个事情,这将是他的权利。
发生在《晦涩悲伤词典》上的事情可能更加明目张胆,但这并非孤立案例。这是整个网络上一个广泛趋势的一部分,即人们利用AI重新包装、优化和取代其训练所依据的权威来源以谋利。几乎每天,我都会收到一封邮件,里面是一个新推出的、明显是“氛围编码”的网站,充满了AI生成的内容,旨在从人类创作者那里吸走注意力:博主、作者、记者、艺术家、音乐家,以及任何其他缓慢而艰辛地以创作为生的人。我甚至不再确定我收到的邮件是由人类发送的。看到你热爱的东西被一台旨在取代其创造者的机器吞噬和再利用,这种感觉似乎是一种独特的现代悲伤。也许应该有一个词来形容它。
评论总结
根据评论内容,主要观点和论据总结如下:
观点一:AI被用于版权侵权,但核心问题是抄袭而非AI本身 - 评论5指出,Qontour网站直接复制了整本书的文本,而非AI生成("it also includes the entire text of the book... so it doesn't seem likely to me that they asked AI to make a fan site and it spat out the book")。 - 评论6强调,这是小公司公然侵犯版权,AI只是“短暂且附带地参与”("some random tiny scam company copied a book without permission... AI was briefly and tangentially involved")。
观点二:AI洗白(AI laundering)将成为普遍策略,威胁版权体系 - 评论2认为,AI洗白将渗透所有领域,例如将GPL软件用其他语言重写以规避许可("It's easy to take GPL software and rewrite it in another language without the license")。 - 评论16分享亲身经历:有人用AI重命名其免费软件后重新发布,且平台对DMCA投诉无效("Google and Apple are useless for dmca unless you have a court order")。
观点三:对现行版权法的质疑与反思 - 评论11认为,DMCA仅适用于逐字复制,AI改写后难以追责,并主张“停止从过时的版权法中榨取租金”("It's time that we stop extracting rent from outdated copyright laws")。 - 评论13批评版权制度“覆盖全球却无人认真反抗”,并指出AI公司已从人类文化中获取足够数据,不再需要新内容("human culture was sucked dry and is no longer needed")。
观点四:AI侵权背后的商业模式与平台责任 - 评论10揭露,盗版网站通过亚马逊联盟链接(Amazon Associates)盈利,并批评平台审核不严("poorly gated Amazon programs... Anything goes")。 - 评论7要求Webflow回应其合作伙伴Qontour的抄袭行为("let's ask Webflow's public relations dept. how cool are they with the fact their partner is a liar and plagiarist")。
平衡性说明:多数评论谴责AI辅助的版权侵权,但部分评论(如11、13)对现行版权法持批判态度,认为其已不适应技术发展。少数评论(如6)强调AI只是工具,核心问题在于人的违法行为。