文章摘要
五家出版商和作家斯科特·图罗起诉Meta及其CEO扎克伯格,指控该公司非法复制数百万书籍、文章等受版权保护的内容用于训练AI系统Llama,构成"史上最大规模侵权"。原告称Meta通过盗版网站获取内容并多次复制,要求赔偿。Meta回应称AI训练使用受版权保护材料属合理使用。
文章总结
在人工智能领域爆发的新一轮法律纠纷中,Meta公司及其首席执行官马克·扎克伯格被五家出版商和作家斯科特·图罗联合起诉。原告指控这家科技巨头为训练其AI系统Llama,非法复制了数百万册书籍、文章及其他受版权保护的作品。
诉状中写道:"为赢得AI军备竞赛,Meta和扎克伯格奉行其臭名昭著的座右铭'快速行动,打破常规'。他们首先从盗版网站非法获取数百万册受版权保护的书籍和期刊文章,并下载几乎整个互联网的未授权抓取内容,随后通过反复复制这些盗版材料来训练价值数十亿美元的Llama系统——这堪称史上最大规模的版权侵权事件之一。"该集体诉讼于5月5日提交至纽约南区联邦法院,原告方包括阿歇特、麦克米伦等五家大型出版集团及图罗本人,要求Meta赔偿未具体说明的侵权损失。
针对指控,Meta发言人回应称:"AI正在推动变革性创新,法院已明确判定基于受版权保护材料训练AI可能构成合理使用。我们将积极应诉。"值得注意的是,2025年6月曾有13位作家(包括莎拉·西尔弗曼等)起诉Meta侵权败诉,当时法官裁定使用近20万本书籍训练Llama属于"合理使用"。
但新诉讼揭露了更惊人的细节:诉状称扎克伯格曾亲自叫停正版授权计划。根据内部文件显示,在Llama1发布后,Meta原计划在2023年1月至4月斥资2亿美元获取出版商授权,却在4月初突然中止谈判。一份内部备忘录显示:"如果授权任何一本书,我们就无法主张合理使用原则。"更令人震惊的是,Meta员工明知LibGen是盗版资料库(被内部标注为"已知盗版数据集且不得披露使用情况"),仍按高层指示下载了超过267TB的盗版内容——相当于美国国会图书馆印刷藏品总量的数倍。
诉状指出,Llama系统现已能快速生成原告作品的替代品,包括教科书章节、小说改写版本等侵权内容,甚至能模仿特定作家的创作风格。这起案件或将重新定义AI训练与版权保护的边界,Meta的"盗版换进度"策略将面临严峻法律考验。
评论总结
以下是评论内容的总结,平衡呈现不同观点并保留关键引用:
支持追究Meta责任的观点
要求高额赔偿
- 引用1:"if Zuckerberg pirated 'millions'... settlement could be $6bn"(若扎克伯格盗用数百万作品,赔偿或达60亿美元)
- 引用10:"Royalties are owed continuously... like paying for each song played"(应持续支付版税,如每次播放歌曲需付费)
呼吁刑事处罚
- 引用2:"Zuckerberg should do 6 months in jail"(扎克伯格应服刑6个月)
- 引用14:"Shouldn’t this trigger RICO?"(这难道不构成《反诈骗腐败组织集团法》?)
质疑版权主张合理性的观点
AI训练是否构成侵权
- 引用4:"Is AI training different from human reading?"(AI学习与人类阅读有何不同?)
- 引用12:"LLM's advanced arts and sciences... transformative fair use"(LLM推动艺术科学进步,属合理使用)
双标问题
- 引用9:"Aaron Swartz faced prison... but Meta gets a pass"(Aaron Swartz因分享学术文章入狱,Meta却安然无恙)
- 引用8:"HN loves copyright lobby against hated targets"(网友只在对厌恶对象时才支持版权游说)
认为诉讼无实际效果的观点
法律判例倾向AI公司
- 引用7:"Courts found training AI can be fair use... authors lost before"(法院曾判定AI训练属合理使用,作者方败诉)
- 引用13:"Friends do similar things at smaller scale"(普通人也在小规模做类似事情)
赔偿机制不完善
- 引用10:"One-time payment misses ongoing theft"(一次性赔偿忽视持续侵权)
- 引用15:"Mocking fair use loopholes"(讽刺通过单层模型规避侵权的漏洞)
其他关键论点
- 技术规避行为:引用11提到Meta无视robots.txt并绕过IP限制爬取数据。
- 法律定义争议:引用12引用最高法院判例,质疑"盗用"一词的法律适用性。
总结:评论呈现两极分化,一方强调Meta应受严厉处罚,另一方则认为AI训练属合理使用且现行法律存在双标。核心争议围绕版权法在AI时代的适用性及执行公平性。