Reddit控告Anthropic擅自抓取资料训练AI模型

社交新闻平台Reddit本周三(6/4)在加州旧金山高等法院,对AI新创Anthropic提起诉讼,指控Anthropic未经授权使用Reddit上的用户内容来训练该公司的AI模型Claude。去年3月以34美元登上纽约股市的Reddit,昨天股价上涨了6.64%,以118.21美元作收。

Reddit于诉状中表示,虽然Anthropic是在2023年3月,才正式对外发表AI聊天机器人Claude,但早在2021年年底,Anthropic便在未经授权且直接违反Reddit用户协议的状况下,使用Reddit用户的贴文来训练Claude。

在各大AI业者广泛利用网路上的公开资料训练模型之际,Reddit在2024年7月初更新其robots.txt文件,封锁了未与Reddit签署合作协议的网路爬虫,Reddit执行长Steve Huffman更公开指责微软、Anthropic及Perplexity未经许可,抓取了Reddit的资料。

当时Anthropic宣称,Reddit自2024年5月起就被加入其网路爬虫黑名单,没有再将任何来自Reddit的URL添加至爬虫程式中。

不过,Reddit发现事实并非如此,因为Anthropic在之后的几个月仍继续部署其自动机器人,存取Reddit内容超过10万次。此外,当Reddit与Anthropic接洽时,Anthropic拒绝与Reddit协商授权事宜,也拒绝自系统内删除已被Reddit用户删除的文章,还说该公司无从得知用来训练Claude的Reddit内容是否已被删除。

Reddit希望法院要求Anthropic支付补偿性赔偿金,以及赔偿Anthropic借由抓取Reddit内容而获利的金额,亦申请禁令,禁止Anthropic继续抓取Reddit内容。

目前Reddit已与OpenAI、Google及Sprinklr等AI业者达成内容合作协议,其中,OpenAI共同创办人暨执行长Sam Altman拥有8.7%的Reddit股份,是该公司第三大的股东。