大型出版商诉谷歌AI训练涉侵权
哈珀柯林斯出版集团与圣智出版集团近日向加州联邦法院提交动议,要求介入针对谷歌的集体诉讼。该诉讼指控科技巨头为构建Gemini人工智能平台,系统性实施“历史性版权侵权”。诉状指出谷歌“选择窃取原告及集体成员的海量内容训练AI模型”,其开发过程“每个阶段均存在故意侵权”,而非通过合法授权途径。
盗版资源成训练数据源
本案源于2023年作家发起的集体诉讼,指控谷歌复制图书训练生成式AI模型。出版商称谷歌从盗版网站下载图书后,在AI训练中多次复制:先存入计算机内存,转为AI可读格式,再编入各代模型的训练集。诉状特别指出,谷歌C4训练数据集包含从Z-Library抓取的受版权保护作品,该盗版资源库已被查封超350个网站域名。
出版商举证称,书籍复制来源包括已显示联邦查封通知的b-ok.org(Z-Library旗下域名),以及OceanofPDF和WeLib等“存有大量未授权版权内容的活跃站点”。诉状显示,C4数据集至少包含28个被美国政府列为盗版市场的网站内容,“数据集内版权符号©出现超2亿次”,谷歌被指刻意排除“政策声明”与“使用条款”警告,却纳入“海量受版权保护作品、盗版作品及付费墙内容”。
规避许可协议引争议
出版商进一步指控谷歌绕过合法许可协议,从Scribd.com等订阅图书馆复制作品。据称非营利数据集提供商Common Crawl被问及此行为时,曾以“受害者有罪论”回应:“若不愿内容出现在网络,当初就不应上传。”诉状指出Gemini当前输出内容已形成“对版权作品的替代”,包括逐字复制、详细摘要及“模仿原创作品核心创意的仿制品”。
谷歌目前同时面临潘世奇媒体公司就其AI概述功能提起的反垄断诉讼。科技巨头辩称展示AI生成摘要属于“合法产品优化而非反竞争行为”。出版商方诉求包括法定赔偿、禁令制止持续侵权,以及要求谷歌销毁未授权作品副本并披露训练Gemini所用的图书清单。
行业维权面临法律变数
此次介入动议延续了2023年作家对AI公司的系列诉讼。联邦法官此前对Meta和Anthropic案件作出部分有利判决,认定使用受版权图书训练模型属合理使用范畴,但同时批评企业长期维护盗版图书数据库的行为。当前案件进展显示,人工智能训练数据来源的合法性边界仍需司法实践进一步明晰。

资金费率
资金费率热力图
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
账号安全
资讯收藏
自选币种