纽约时报控告OpenAI、微软擅自使用网站内容训练AI

Photo by

《纽约时报》昨(27)日向纽约地方法院控告OpenAI及微软未经其同意使用网站新闻内容来训练AI聊天机器人的底层AI模型,侵害其声誉及营运获利能力。

纽时指出,OpenAI及微软为训练生成式AI助理ChatGPT及Copilot的底层大型语言模型(LLM),未经其同意复制及使用数百万新闻文章、深度调查、社论、产品评价、指引等内容,免费提供给用户,纽时内容还经过加权使用。此外,除了非法使用内容,纽时也批评ChatGPT及Copilot模仿纽时新闻报导风格撰写报导,有时还将假消息来源指向纽时,伤害其与读者关系及声誉。

AI业者撷取网路文章的行为引发媒体出版商反弹,《纽时》、《CNN》、《BBC》等媒体已经封锁AI的爬虫。纽时曾试图和OpenAI、微软(以及提供新闻内容的Google、苹果及Meta)洽谈付费授权,但两家公司以「合理使用」为由拒绝付费。纽时指出,两家业者未经同意使用媒体内容产生的内容,又反过来和媒体竞争用户流量,损及其订阅、授权、广告及合作收费制的获利能力。

这次控告,纽时并未寻求特定金额赔偿,但他们估计因被告滥用其内容造成的损害上看数十亿美元。这家媒体龙头也要求OpenAI及微软摧毁使用其内容训练出的AI模型及训练资料集。

纽时是第一家对OpenAI或微软提出侵害诉讼的主流媒体。但此前美国作者公会个别作家也曾控告OpenAI侵权。

OpenAI发出声明稿指出,该公司尊重创作者及所有人,该公司和纽时的对话已有相当进展及成果,因此这番控告感到惊讶与失望。微软则尚未回应。

为解决资料撷取的争议,OpenAI 11月启动合作伙伴计划,以便能合法取得AI训练资料集。OpenAI及另一AI大厂Google都提供爬虫工具,允许网路出版商退出被撷取资料的行列。