Meta
有13名作者在2023年连袂控告Meta没有取得授权,就利用他们的作品来训练大型语言模型Llama,法官Vince Chhabria于本周裁决,原告的证据不足,因此驳回此案,但Chhabria强调,此一裁决并不代表他支持Meta使用受版权保护的内容来训练大型语言模型是合法的。
跟Anthropic被告侵权的案件一样,控方指控Meta透过诸如Library Genesis等各种非法的影子图书馆下载大量的图书以用来训练模型,此外,这13名作者还指控Meta以此训练的模型可复制书中文字,属于未经授权的内容重制,还说Meta损害了作者授权其作品来训练大型语言模型的能力。
Chhabria指出,控方的这两个论点都站不住脚,因为Llama并无法从原告的书籍中生成足够长度的文本,此外,就算控方是作品的版权所有人,但他们并没有权利拥有或控制「将作品授权给AI训练」的市场。
换句话说,法官认为,「将作品授权给AI训练」这个市场本身并非版权法的保护范围,作者无法因为一个新科技应用的出现,就自动拥有从中获利的权利。
然而,Chhabria其实是替作者感到忧心的。他坦承,合理使用并无明确规则,得视具体情况,现在所有的AI公司都主张他们的使用是具转化性的(可创造出不同于原作的新功能或意义),但问题在于业者创造出了一个产品(AI),有能力严重损害原作品的市场,同时削弱人类创作的动机,在合理使用的原则下,对版权作品的伤害比业者使用这些作品的目的还重要。
Chhabria还提出了一个控方可能胜诉的论点:Meta抄袭原告的作品并创造一种产品,该产品可能会让类似的作品充斥市场,从而稀释了市场。可惜控方只是敷衍带过此一论点,也没有提出证据来证明Llama会稀释其作品的市场。
虽然在Anthropic及Meta的案件中,AI模型开发商都取得了优势,但Chhabria并不同意另一位法官William Alsup的论点,也批评AI公司宣称不利于它们的版权裁决会阻碍AI发展是个非常荒谬的说法,因为如果业者必须使用受版权保护的作品来训练模型,而且AI将带来数十亿或数兆美元的收入,那么它们就会想办法补偿版权持有人。