![]()
Meta正在把美国最高法院的一份判例当作盾牌,试图挡住两起诉讼的子弹。两起案件的核心指控相同:这家社交巨头用BT下载(BitTorrent,一种点对点文件传输协议)抓取了约80TB的盗版内容训练AI,涉嫌版权侵权。
原告之一的Entrepreneur Media指控Meta构成"帮助侵权"——明知BT的工作原理是用户互相上传下载片段,仍主动做种加速传输。另一起集体诉讼Kadrey v. Meta的原告是图书作者,他们最初指控的是更严重的"直接侵权"(即Meta完整传播了盗版作品)。
但BT的技术特性给作者们挖了坑:文件被切成碎片分散传输,很难证明Meta完整上传过任何一本书。这正是Meta的突破口——直到最近,一位法官裁定"帮助侵权"指控也可加入集体诉讼,局面骤然紧张。
Meta的应对策略浮出水面:援引最高法院在Cox案中的裁决。这家ISP(互联网服务提供商)因用户盗版被起诉,最终最高法院认定其免责。Meta认为这道"红线"同样适用于自己。
Cox案给Meta开了什么后门
最高法院在Cox案中确立了"帮助侵权"的两条窄路。第一条:单纯向公众提供服务,明知有人会用之侵权,不构成侵权。这看起来对Meta不利——它不是在"被动提供管道",而是主动下载。
但Meta的律师团队显然嗅到了第二条路的可能性。判例中,大法官们严格限定了"帮助侵权"的适用范围,要求证明被告"实质性促成"了具体侵权行为,而非泛泛地知道技术可能被滥用。
Entrepreneur Media的指控恰恰踩在这个模糊地带:他们知道BT有上传机制,但这是否等于"实质性促成"每一次用户的上传行为?Meta即将提交的补充简报,核心论点预计围绕此展开。
技术细节成为攻防焦点。BT协议中,做种者(seeder)确实加速了网络,但每个用户只持有碎片。原告要证明Meta"诱导"侵权,必须跨越从"知道技术原理"到"意图促成具体侵权"的鸿沟。
![]()
两起诉讼的微妙差异
Kadrey案的原告原本选择"直接侵权"是步险棋。版权法中的"发行权"要求证明被告传播了"完整复制件",而BT的分布式架构天然对抗这种证明。TorrentFreak的分析指出,作者们几乎不可能锁定Meta完整上传过哪本书。
但"帮助侵权"的举证标准不同。它不需要完整作品,只需要证明Meta"明知故犯"地提供了侵权条件。这正是Entrepreneur Media的打法,也是法官最近允许Kadrey案追加该指控的原因。
对Meta而言,两案合流意味着风险倍增。一旦"帮助侵权"成立,赔偿计算方式对被告极不友好——不需要证明每本书的损失,而是按侵权行为的规模笼统量刑。80TB的数据量,换算成潜在赔偿是个天文数字。
Meta的防御体系因此分两层:在事实层面否认"诱导"意图,在法律层面争取Cox案的庇护。后者是更干净的胜利——如果法院认定BT下载属于"提供服务"范畴,整个诉讼根基将被动摇。
AI训练数据的版权雷区
这起诉讼撕开了生成式AI产业的共同伤疤:训练数据从哪来。Meta的Llama模型被曝使用LibGen等盗版书库,而LibGen的内容主要通过BT网络分发。这不是Meta独有的操作,却是目前被诉得最狠的案例。
行业内的应对策略分化明显。OpenAI与出版商签订内容授权协议,用真金白银买平安;谷歌在诉讼中主张"合理使用"抗辩,试图用法律概念而非商业谈判解决问题;Meta则两头下注,一边谈判一边打官司。
版权方的心态也在变化。早期诉讼聚焦"输出端"——AI生成的内容是否侵权。现在火力转向"输入端":训练过程本身是否非法。后者威胁更大,因为可能触发禁令救济,直接冻结模型迭代。
![]()
Meta选择死磕而非和解,可能与其数据规模有关。Llama的训练数据量远超公开披露,若授权谈判开启,价格标签将参照这个基数计算。相比之下,诉讼成本反而可控——前提是能赢。
最高法院的红线有多粗
Cox案的裁决写得很技术化,但核心信息清晰:国会没让ISP当版权警察,法院也不该越俎代庖。大法官们区分了"明知"(knowledge)和"意图"(intent),只有后者触发责任。
Meta的律师需要把这个逻辑平移到BT场景:公司知道BT会上传,但这是技术设计的必然,不等于"意图"促成每一次具体侵权。换句话说,下载盗版书和经营盗版网站,在主观恶性上有本质区别。
原告方的反驳已经准备好:Meta不是普通用户,它部署了自动化工具批量抓取,并主动做种优化下载速度。这种"系统性使用"是否超出Cox案的庇护范围,将是听证会的交锋点。
时间线对Meta不算有利。补充简报提交后,法院可能需要数月才能裁定动议。这期间,Kadrey案的证据开示(discovery)继续推进,更多技术细节将被曝光。Meta既要防守法律战,又要控制舆论战。
一个有趣的旁支:Cox案的原告是音乐版权方,他们输掉官司后正在推动立法修改。如果国会收紧"帮助侵权"的标准,Meta此刻的胜诉可能变成明天的负债。法律战的胜利有时是暂时的,尤其是当对手能改写规则时。
Meta的赌注有多大?80TB数据背后是整个Llama训练 pipeline 的合法性。输掉这起诉讼,不只是赔钱的问题,而是所有基于该数据训练的模型版本都可能面临禁令。这种"回溯性污染"是AI公司最恐惧的噩梦。
当Meta的律师在起草那份补充简报时,他们真正在问的是:最高法院保护ISP的盾牌,能不能挡住一个主动下载盗版内容的科技巨头?答案将决定不止一家公司的命运。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.