Reddit控告Anthropic擅自抓取資料訓練AI模型

社交新闻平台Reddit本周三（6/4）在加州旧金山高等法院，对AI新创Anthropic提起诉讼，指控Anthropic未经授权使用Reddit上的用户内容来训练该公司的AI模型Claude。去年3月以34美元登上纽约股市的Reddit，昨天股价上涨了6.64%，以118.21美元作收。

Reddit于诉状中表示，虽然Anthropic是在2023年3月，才正式对外发表AI聊天机器人Claude，但早在2021年年底，Anthropic便在未经授权且直接违反Reddit用户协议的状况下，使用Reddit用户的贴文来训练Claude。

在各大AI业者广泛利用网路上的公开资料训练模型之际，Reddit在2024年7月初更新其robots.txt文件，封锁了未与Reddit签署合作协议的网路爬虫，Reddit执行长Steve Huffman更公开指责微软、Anthropic及Perplexity未经许可，抓取了Reddit的资料。

当时Anthropic宣称，Reddit自2024年5月起就被加入其网路爬虫黑名单，没有再将任何来自Reddit的URL添加至爬虫程式中。

不过，Reddit发现事实并非如此，因为Anthropic在之后的几个月仍继续部署其自动机器人，存取Reddit内容超过10万次。此外，当Reddit与Anthropic接洽时，Anthropic拒绝与Reddit协商授权事宜，也拒绝自系统内删除已被Reddit用户删除的文章，还说该公司无从得知用来训练Claude的Reddit内容是否已被删除。

Reddit希望法院要求Anthropic支付补偿性赔偿金，以及赔偿Anthropic借由抓取Reddit内容而获利的金额，亦申请禁令，禁止Anthropic继续抓取Reddit内容。

目前Reddit已与OpenAI、Google及Sprinklr等AI业者达成内容合作协议，其中，OpenAI共同创办人暨执行长Sam Altman拥有8.7%的Reddit股份，是该公司第三大的股东。

Reddit控告Anthropic擅自抓取资料训练AI模型