网易首页 > 网易号 > 正文 申请入驻

OpenAI最新两起诉讼的新风向:大模型“偷书”要担责了?

0
分享至

21世纪经济报道 记者 王俊 实习记者 蔡欣佁

大模型“偷书”算不算“偷”?是贯穿生成式AI发展过程中的议题,近几年版权纠纷的熊熊战火足以说明其重要性。

本月,OpenAI分别在欧洲大陆和美国本土迎来两起诉讼,把这个问题又推向了新的高度:

一起是被称为欧洲首例生成式AI版权侵权案,据央视报道,当地时间11月11日,德国慕尼黑第一地区法院裁定:OpenAI未经许可使用受著作权保护的音乐歌词训练ChatGPT模型,已构成侵权。

另外一起则是已经缠斗两年的《纽约时报》诉OpenAI案,11月7日,纽约南区联邦法院法官Ona T. Wang发布最新命令,责令OpenAI向《纽约时报》提交多达2000万条ChatGPT用户日志。

业内对这两起案件倾注了足够的关注,仔细翻阅法律文书,有很多高光点不容忽视:

1、推翻“合理使用”

此前的不少判决中,大模型训练被视为“合理使用”,即在特定情况下,模型无需得到授权即可使用作品。但德国法院率先认定,AI模型“记忆”与“输出”歌词均构成复制侵权,将AI“学习”定性为“偷书”。

2、逐渐穿透“大模型黑箱”

德国法庭用大量篇幅着眼技术审查,纽约法院则直接要求OpenAI交出用户日志。过去,“模型训练”被AI公司盖上层层面纱,现如今,司法面正在层层解剖技术逻辑。

正如德国案的判决书所言:“大模型生成并不是神奇的过程”。当训练过程被逐渐复原,技术迷雾随之消散,AI公司便很难再以“技术复杂性”为由进行抗辩。这种趋势,对于AI公司而言,并不乐观。

生成式AI的训练过程是否涉及侵犯版权,是近年来法律界争议最为激烈的一道命题。

广东财经大学法学院教授姚志伟曾告诉21记者,AI侵权案件的难点在于,一是证明原告作品被用于训练,这个过程发生在企业内部较难证实。二是证明AI的生成物与原告作品存在“实质性相似”。

而德国慕尼黑案件打破了上述两个难点。原告GEMA一步步拆解了大模型训练的过程,并通过技术验证发现,用户只需要输入简单的提示词,ChatGPT就能基本完整再现涉案歌曲的歌词,这意味着ChatGPT“记住”了这些内容。根据法庭裁决,大模型在训练阶段“记忆”歌词,在输出阶段“还原”歌词,均构成侵犯版权。

这场判决的关键在于,“记忆”是否等于“复制”。判决书显示,大模型训练完成之后,涉案歌词内容就形成了一个固定参数,这个过程已等同于“复制”。到了输出阶段,大模型基于提示词和固定参数生成内容。虽然经解码器进行“随机化”处理。然而,当输出文本达到一定体量,将“不可避免地”再现歌词。判决书中直陈,ChatGPT在此情况下如同数据库。

而OpenAI的立场是,ChatGPT并未储存或者复制观点,而是像学生一样“学习”了知识。更何况,经过用户输入提示词而产生的内容,理应归用户负责。

这套AI公司的惯用措辞,在过去美国的几起版权纠纷中被肯定。然而,德国慕尼黑法院并不买账。

法院明确认定:大模型对歌词的“记忆”构成复制。法院认为,“将歌词编码为参数并不影响其作品完整性。这些参数仍完整地包含在模型中,可被技术手段提取。”涉案歌词已被固定存储在模型参数中,并通过简单提示词就能被还原,符合德国著作权法第16条“有形固定+可感知”要求。法院援引欧盟《信息社会指令》第2条,采取技术中立的解释:复制涵盖"任何形式和任何方式",不要求直接感知,只需间接可感知即可。

数据进入到模型的一步步过程不神秘,也不抽象,每一步都是很清楚、具体的。回到法律,如果我们考察大模型在训练阶段,只是在这个阶段,是否构成著作权的侵权,那我们就应该把这部分训练的代码拿出来,一步步去考察和适用法律,看这个过程是否构成复制?是不是侵犯其他受到《著作权法》保护的权利?”同济大学法学院助理教授、上海市人工智能社会治理协同创新中心研究员朱悦曾指出。

在大洋彼岸的美国本土,OpenAI亦在经历一场诉讼鏖战,其大模型训练过程也将被拆解。

此前,OpenAI沿用惯用策略,声称其使用新闻文章旨在训练模型以学习语言模式,而非替代新闻本身。但11月7日,纽约南区联邦法院法官Ona T. Wang发布最新命令,责令OpenAI向纽约时报提交多达2000万条ChatGPT用户日志。

业内专家吴雨辉表示,在认定版权侵权的案件之中,如此海量的证据提交是比较少见的,却也有其必要性。对于普通的版权案件,通常需要比对原作品和涉嫌侵权的内容是否存在实质性相似,但本案中《纽约时报》主张OpenAI涉嫌在输入端的训练数据侵权,无法从输出进行比对,用户日志的确是关键证据。

通常情况下,原告起诉时应遵循“谁主张谁举证”的原则。在本起案件中,OpenAI的输出日志数据(包括用户聊天记录及API输出)一直是原告《纽约时报》的关注焦点,其主张,这些数据是本案的关键证据,而这份关键证据牢牢掌握在被告手中。

根据原告今年5月向法院递交的补充备忘录,早在2023年4月(原告于2023年12月27日提起诉讼),OpenAI就已知晓原告的版权疑虑,理应保留相关日志作为潜在证据。然而,《纽约时报》律师团队指控,OpenAI仅仅保留对其辩护有利的证据,其他数据正在被销毁。

面对证据可能灭失的风险,今年5月13日,Ona T. Wang法官曾签发命令,要求OpenAI“保留并隔离所有本应被删除的输出日志数据”——这甚至包括用户主动删除或出于隐私政策需要删除的聊天记录。

针对Ona T. Wang法官签发的命令,OpenAI打出了隐私保护的惯用牌。其在官网称:

《纽约时报》要求我们交出 2000 万条用户的私人 ChatGPT 对话记录,并且声称能从中找到我们利用 ChatGPT 绕过其付费墙的证据。

OpenAI认为,这一要求无视隐私保护规则,违背常识性安全惯例,还将迫使其交出数千万条与诉讼毫无关联的高度私人对话。“你的私人对话为你所有 —— 它们不应成为争议中的牺牲品。”

无论如何“反抗”,命令已是既定事实。OpenAI接下来面对的版权官司,困难重重。

天元律师事务所李昀锴指出,欧洲大陆的判决清晰表明,AI的免费午餐时代正在结束,“先授权、后训练”将成为AI公司不可回避的合规路径。大模型“学习”过程也得落入版权法管辖范围。

GEMA总法律顾问凯·韦尔普(Kai Welp)表示:我们开创了一个先例,既保护又澄清了创意版权所有者的权利:ChatGPT等人工智能工具的运营商也必须遵守版权法。该判决代表了整个欧洲作者和创作者获得公平报酬的一个里程碑。即使是科技巨头也必须获得使用知识产权的许可;他们不能逃避自己的义务。

不过,OpenAI对判决结果并不满意:“我们不同意这一裁决,并正在考虑下一步行动。

《纽约时报》对用户日志这一关键证据的坚持,也将对大模型训练过程进一步穿透。有实力的原被告,将把AI版权的探索推向新高地。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
7000万粉的网红白小白怒怼评委:你15年没发歌,凭啥说我没本事?

7000万粉的网红白小白怒怼评委:你15年没发歌,凭啥说我没本事?

乡野小珥
2026-01-26 08:34:43
湖北毒菜曝光:菜贩自己不吃,专供外地,剧毒农药只为你好看

湖北毒菜曝光:菜贩自己不吃,专供外地,剧毒农药只为你好看

天气观察站
2026-01-27 13:27:00
12岁玥儿穿价值7000元外套,很贵气!越长越像大S

12岁玥儿穿价值7000元外套,很贵气!越长越像大S

大眼妹妹
2026-01-27 08:40:10
何猷君已任海南省政协委员,此前已任湖北省政协委员

何猷君已任海南省政协委员,此前已任湖北省政协委员

澎湃新闻
2026-01-26 13:11:07
“让我睡一次,不然死给你看!”17岁少年持刀,威胁舅妈发生关系

“让我睡一次,不然死给你看!”17岁少年持刀,威胁舅妈发生关系

有书
2026-01-09 21:30:59
四川绵阳一佳人太漂亮,身高177cm体重54kg五官精致到无懈可击!

四川绵阳一佳人太漂亮,身高177cm体重54kg五官精致到无懈可击!

TVB的四小花
2026-01-27 11:03:50
“矮大紧”事后补料,“牢A”理论更扎实!

“矮大紧”事后补料,“牢A”理论更扎实!

达文西看世界
2026-01-22 10:52:23
三个省级政府常务副职调整

三个省级政府常务副职调整

上观新闻
2026-01-27 14:29:02
房东慌了!身份被实锤,真实目的被扒,嫣然医院新址确定后着急了

房东慌了!身份被实锤,真实目的被扒,嫣然医院新址确定后着急了

有范又有料
2026-01-24 16:26:39
雷军无奈宣布:全部下架!

雷军无奈宣布:全部下架!

电动知家
2026-01-25 15:31:25
你知道咱妈为何要拍《太平年》吗?知道这是拍给谁看的吗?

你知道咱妈为何要拍《太平年》吗?知道这是拍给谁看的吗?

李健政观察
2026-01-27 09:50:28
越扒越劲爆!释永信在少林寺的奢靡生活,你想都不敢想!

越扒越劲爆!释永信在少林寺的奢靡生活,你想都不敢想!

混沌录
2025-09-17 23:25:04
千万别姐弟恋,很累!

千万别姐弟恋,很累!

果粉之家
2026-01-06 11:26:21
Lululemon让人走光,是故意的还是不小心?

Lululemon让人走光,是故意的还是不小心?

智商税研究中心
2026-01-27 10:09:07
辽宁男篮新帅上任,李虎翼获重用,主力恐被边缘化

辽宁男篮新帅上任,李虎翼获重用,主力恐被边缘化

老垯科普
2026-01-27 13:47:04
破防了!原来只要失业,所有人都一样!网友:人都快抑郁了

破防了!原来只要失业,所有人都一样!网友:人都快抑郁了

另子维爱读史
2026-01-16 21:03:12
取消中考选拔功能、普通高中全员直升,浙江嵊泗教改细节披露

取消中考选拔功能、普通高中全员直升,浙江嵊泗教改细节披露

澎湃新闻
2026-01-25 19:33:20
甲午战争失败后,假如清政府死不投降,拒不赔款,结果将是怎样?

甲午战争失败后,假如清政府死不投降,拒不赔款,结果将是怎样?

铭记历史呀
2026-01-26 19:40:51
1940年炊事员在朱德饭里下毒,枪毙之时,杨奇清提出:重审此案

1940年炊事员在朱德饭里下毒,枪毙之时,杨奇清提出:重审此案

鹤羽说个事
2026-01-24 15:14:20
范晓萱做客鲁豫访谈,网友泪目,只因她谈吐与眉眼间竟与大s神似

范晓萱做客鲁豫访谈,网友泪目,只因她谈吐与眉眼间竟与大s神似

小娱乐悠悠
2026-01-27 10:23:52
2026-01-27 15:32:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
230726文章数 743616关注度
往期回顾 全部

科技要闻

理想开始关店“过冬”,否认“百家”规模

头条要闻

特朗普突然宣布对韩关税升至25% 青瓦台紧急派人赴美

头条要闻

特朗普突然宣布对韩关税升至25% 青瓦台紧急派人赴美

体育要闻

带着母亲遗愿战斗12年,交易添头成了队魂

娱乐要闻

张雨绮被曝代孕,春晚被拒,代言跑路

财经要闻

金价狂飙 “牛市神话”未完待续

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

健康
游戏
房产
旅游
教育

耳石脱落为何让人天旋地转+恶心?

2026第一场“游戏玩家大战”,因为支付宝集福打起来了?

房产要闻

实景兑现在即!绿城,在海棠湾重新定义终极旅居想象!

旅游要闻

泰山之巅惊现七彩灯华奇景 非常罕见

教育要闻

高中半年直观感受

无障碍浏览 进入关怀版