网易首页 > 网易号 > 正文 申请入驻

可逐字复现畅销书,多家巨头AI模型被指存储版权作品

0
分享至

IT之家 2 月 24 日消息,全球顶尖人工智能模型可通过提示词,生成与畅销小说几乎逐字相同的内容,这对 AI 行业声称其系统不存储受版权保护作品的说法提出了新的质疑。


近期多项研究显示,来自 OpenAI、谷歌、Meta、Anthropic 和 xAI 的大语言模型,对训练数据的记忆量远超此前认知。

AI 及法律专家向《金融时报》表示,这种“记忆”能力,可能对全球 AI 企业应对数十起版权诉讼产生重大影响,其直接动摇了这些企业的核心抗辩理由:大语言模型只是从受版权保护作品中“学习”,而非存储副本。

伦敦帝国理工学院应用数学与计算机科学教授伊夫-亚历山大 · 德蒙茹瓦称:“越来越多证据表明,模型记忆现象比此前认为的更为普遍。”

长期以来,AI 企业均否认存在记忆行为。在 2023 年致美国版权局的一封信中,谷歌曾表示:“模型本身并不存储训练数据副本,无论文本、图像或其他格式。”

AI 行业还主张,使用受版权书籍训练模型属于“合理使用”,认为该技术将原作品转化为具有全新意义的内容。

但上月发布的一项研究显示,斯坦福大学与耶鲁大学研究人员通过针对性提示词,成功让 OpenAI、谷歌、Anthropic 和 xAI 的大语言模型,输出了《权力的游戏》《饥饿游戏》《霍比特人》等 13 部作品的数千字内容。

通过让模型补全书中句子,谷歌 Gemini 2.5 高精度复现了《哈利 · 波特与魔法石》76.8% 的内容,xAI 的 Grok 3 则生成了 70.3%。研究人员还通过“越狱”(绕过安全限制)Anthropic 的 Claude 3.7 Sonnet,几乎提取了整部小说的完整原文。

这一结论建立在去年一项研究基础之上:该研究发现,Meta 的 Llama 等开源模型,会记住训练数据中特定书籍的大量内容。

此前 AI 专家并不确定,安全防护更严格、能阻止不当内容生成的闭源模型,是否也会出现大规模记忆现象。

参与该研究的耶鲁大学研究员 A· 费德 · 库珀表示:“尽管设有防护机制,模型仍能记住整段文本,这令人意外。”

研究人员尚未弄清大语言模型为何会记住训练数据中的内容,也不清楚模型输出中会体现多少训练数据。

这种记忆特性还可能对医疗、教育等其他领域产生严重影响,训练数据泄露可能引发隐私与保密问题。

法律专家表示,这可能使 AI 企业面临重大版权侵权责任,并影响其模型训练方式与研发成本。

英国品诚梅森律师事务所知识产权合伙人塞里斯 · 温 · 戴维斯称,这些研究发现“可能对那些主张 AI 模型不存储、不复制任何版权作品的观点构成挑战”。

AI 模型是否记忆训练数据,已成为近期版权法律纠纷的关键因素。美国一家法院去年裁定,Anthropic 使用部分受版权内容训练大语言模型可被视为合理使用,因其具有“转化性”。但法院同时认定,存储盗版作品“本质上、无可挽回地构成侵权”,最终该 AI 企业以 15 亿美元(IT之家注:现汇率约合 103.74 亿元人民币)达成和解。

德国去年 11 月的一项判决认定,OpenAI 因模型记忆歌词侵犯版权。此案由词曲作者及出版商协会 GEMA 提起,被视为欧盟标志性判例。

美国 Husch Blackwell 律师事务所合伙人鲁迪 · 特尔舍认为,无需越狱即可完整复制一整本书“显然构成版权侵权”,但问题在于“此类情况是否普遍到足以让 AI 模型承担连带侵权责任”。

Anthropic 表示,斯坦福与耶鲁研究中使用的越狱技术对普通用户并不实用,提取文本所需成本高于直接购买作品。该公司还称,其模型不存储特定数据集副本,只是学习训练数据中词汇与字符的模式和关联关系。

xAI、OpenAI 和谷歌均未回应置评请求。

帝国理工的德蒙茹瓦指出,AI 实验室设置防护机制防止训练数据被提取,这一事实本身就说明它们知晓问题存在。

芝加哥大学计算机科学教授本 · 赵质疑,AI 实验室从一开始是否真的需要使用受版权内容来训练前沿模型。“无论技术上能否实现,问题在于我们应不应该这么做。”赵表示,“法律层面最终应坚守立场,成为整个过程的裁决者。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄罗斯遭大规模袭击

俄罗斯遭大规模袭击

中国经济网
2026-05-06 17:08:04
依木兰让队友变强,泰山4将正式接班 韩鹏早踢4后卫 不至于送温暖

依木兰让队友变强,泰山4将正式接班 韩鹏早踢4后卫 不至于送温暖

替补席看球
2026-05-06 08:48:55
印尼已经料到中方反应,与日本签署防务协议,直言中方不会介意

印尼已经料到中方反应,与日本签署防务协议,直言中方不会介意

你的雷达站
2026-05-05 21:52:55
原来富人家插座也是歪的!陆家嘴女孩晒才艺,窗外风景成最大亮点

原来富人家插座也是歪的!陆家嘴女孩晒才艺,窗外风景成最大亮点

知晓科普
2026-05-04 06:30:10
“自由计划”仅一天就暂停!6日0点后,俄军仍在大规模轰炸乌克兰

“自由计划”仅一天就暂停!6日0点后,俄军仍在大规模轰炸乌克兰

鹰眼Defence
2026-05-06 16:42:01
缅甸政府为何不敢动,拥有4万军队,号称小中国的佤邦?

缅甸政府为何不敢动,拥有4万军队,号称小中国的佤邦?

鹤羽说个事
2026-05-06 22:54:55
赛事火 健身热 活力足——“五一”假期体育盘点

赛事火 健身热 活力足——“五一”假期体育盘点

新华社
2026-05-06 00:08:17
老板秘书发我这照片,她什么意思?

老板秘书发我这照片,她什么意思?

太急张三疯
2026-02-24 11:32:23
《低智商犯罪》被观众要求下架!理由:主演招人烦、演技尴尬

《低智商犯罪》被观众要求下架!理由:主演招人烦、演技尴尬

林轻吟
2026-05-06 19:40:05
双鹭药业,暴雷

双鹭药业,暴雷

药圈观察局
2026-05-06 20:20:56
山东男篮憾负上海点评:三员悍将无可挑剔,后场两人成最大短板

山东男篮憾负上海点评:三员悍将无可挑剔,后场两人成最大短板

臻体育
2026-05-06 22:42:27
华蓥瀑布秋千坠亡事故!女孩16岁,有网友称我的朋友该项目建设者

华蓥瀑布秋千坠亡事故!女孩16岁,有网友称我的朋友该项目建设者

火山詩话
2026-05-06 13:42:02
宅女的慵懒,透着让人心情愉悦的治愈感

宅女的慵懒,透着让人心情愉悦的治愈感

飛娱日记
2026-05-06 07:54:01
美国人想不通:为防止战争来临,中国不造055,咋却加速造054B?

美国人想不通:为防止战争来临,中国不造055,咋却加速造054B?

壹知眠羊
2026-05-04 16:51:39
湖人锋线大闸疑似赛季报销,他们需要对轮换阵容进行调整了?

湖人锋线大闸疑似赛季报销,他们需要对轮换阵容进行调整了?

稻谷与小麦
2026-05-07 00:46:49
回加拿大生活的大山,60岁须发皆白很沧桑,重庆妻子仍风韵犹存

回加拿大生活的大山,60岁须发皆白很沧桑,重庆妻子仍风韵犹存

素衣读史
2026-03-31 15:11:31
iPhone 18 Pro首发!iOS 27定档6月:四款机型被淘汰

iPhone 18 Pro首发!iOS 27定档6月:四款机型被淘汰

快科技
2026-05-04 09:13:04
如果你在NBA拿了大合同,先别急着跟肯豆约会

如果你在NBA拿了大合同,先别急着跟肯豆约会

乡野小珥
2026-05-07 00:44:29
没演员别硬演!《低智商犯罪》被“相声班”霸占,演技没一个能打

没演员别硬演!《低智商犯罪》被“相声班”霸占,演技没一个能打

秋姐居
2026-05-06 19:33:14
中央明确了!社保最低缴费年限要提高,70、80后得早做准备

中央明确了!社保最低缴费年限要提高,70、80后得早做准备

云鹏叙事
2026-04-12 16:36:39
2026-05-07 05:28:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
342814文章数 607189关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

特朗普:伊朗可能将其高浓缩铀运往美国

头条要闻

特朗普:伊朗可能将其高浓缩铀运往美国

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

本地
时尚
教育
公开课
军事航空

本地新闻

用青花瓷的方式,打开西溪湿地

有些路,不必每一步都走得那么用力

教育要闻

女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

实施不到48小时 特朗普紧急喊停"霍尔木兹自由计划"

无障碍浏览 进入关怀版