Tumblr、WordPress传也出售用户内容给AI业者训练模型

图片来源: 

WordPress

404Media报导,网路内容平台Tumblr及Wordpress母公司已谈定出售平台上的内容,供AI业者如OpenAI、Midjourney训练模型。

报导引述消息人士说,Tumblr及Wordpress母公司Automattic与AI厂商即将签定内容授权协议。报导并引述一份Tumblr产品经理的内部文件,描述已搜集好的一批欲寄给Midjourney及OpenAI的平台内容,不慎包含某些理应不该搜集的资料,像是公开部落格的私有贴文、已删除或停权部落格的贴文、不公开(问题的)回答、被标示为「露骨」或「成熟」的贴文,以及顶级合作伙伴(如苹果音乐论坛)的贴文等。

不过报导指出,无法从这则流出的Tumblr内部文件断定这些资料已经寄出,或是及时被拦下。

就在本则报导后,Automattic并未否认或承认报导中的内部文件存在与否,只公布Tumblr及Wordpress上的隐私设定,以及用户隐私权利。这家业者指出,Tumblr、Wordpress.com有设定不让搜寻引擎索引内容,也对AI平台加入了类似设定。目前两个平台已预设封锁主要AI平台的爬虫机器人。

目前尚无法律要求网路爬虫遵循这些偏好设定,但欧洲AI法案(AI Act)正在立法中,未来可能改变现况。Automattic宣称将提供用户更大的隐私控制权。此外也将和特定AI业者合作,他们只会分享在Wordpress.com及Tumblr上没有opt-out的内容,不会分享代管在其他平台上内容,即使它们使用Automattic的外挂,包括Jetpack 或 WooCommerce。该公司强调其合作伙伴计划将尊重opt-out设定,也计划定期更新任何新增采取opt-out设定的合作伙伴。