网易首页 > 网易号 > 正文 申请入驻

OpenAI 遭实锤:研究称其AI模型“记住”了受版权保护的内容

0
分享至

IT之家 4 月 6 日消息,一项新研究似乎为 OpenAI 至少使用部分受版权保护内容来训练其人工智能模型的指控提供了依据。

IT之家注意到,OpenAI 正面临由作家、程序员以及其他版权持有者提起的诉讼,这些原告指责该公司在未经许可的情况下,使用他们的作品 —— 包括书籍、代码库等,来开发其模型。尽管 OpenAI 一直声称其享有合理使用的抗辩理由,但原告方则认为美国版权法中并无针对训练数据的豁免条款。

该研究由华盛顿大学、哥本哈根大学和斯坦福大学的研究人员共同撰写,提出了一种新方法,用于识别像 OpenAI 这样通过应用程序接口(API)提供服务的模型所“记忆”的训练数据。

AI 模型本质上是预测引擎,通过大量数据训练,它们能够学习各种模式,从而生成文章、照片等。虽然大多数输出并非训练数据的逐字复制,但由于模型的“学习”方式,部分内容不可避免地会被模型记忆下来。此前已有研究发现,图像模型会重复生成其训练数据中电影的截图,而语言模型则被观察到存在剽窃新闻文章的行为。

该研究的核心方法依赖于研究人员提出的“高意外性”词汇,即在大量作品中显得不常见的词汇。例如,在句子“Jack and I sat perfectly still with the radar humming”中,“radar”(雷达)一词被认为是高意外性的,因为从统计学角度来看,它出现在“humming”(嗡嗡作响)之前的可能性比“engine”(引擎)或“radio”(收音机)等词要低。

共同作者对包括 GPT-4 和 GPT-3.5 在内的几种 OpenAI 模型进行了测试,通过从虚构小说片段和《纽约时报》文章中移除高意外性词汇,然后让模型尝试“猜测”被屏蔽的词汇,来寻找记忆迹象。研究人员认为,如果模型能够成功猜出这些词语,则很可能表明该模型在训练过程中记忆了这些片段。

根据测试结果,GPT-4 显示出记住了流行小说书籍的部分内容,包括一个包含受版权保护电子书样本的数据集 BookMIA 中的书籍。结果还表明,该模型记住了《纽约时报》文章的部分内容,尽管比例相对较低。

华盛顿大学的博士生、该研究的共同作者阿比拉沙・拉维奇汉德(Abhilasha Ravichander)对 TechCrunch 表示,这些发现揭示了模型可能接受训练的“有争议的数据”。

长期以来,OpenAI 一直倡导放宽对使用受版权保护数据开发模型的限制。尽管该公司已经达成了一些内容许可协议,并提供了允许版权所有者标记不希望其用于训练的内容的退出机制,但该公司一直在游说多个政府将围绕人工智能训练方法的“合理使用”规则编入法典。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
西方媒体:哪怕中国全力以赴,也不可能按时建成这样庞大的工程

西方媒体:哪怕中国全力以赴,也不可能按时建成这样庞大的工程

乐天闲聊
2025-12-20 10:59:49
脚是心梗的放大镜?忠告:脚部出现这几种表现,要尽快就医!

脚是心梗的放大镜?忠告:脚部出现这几种表现,要尽快就医!

岐黄传人孙大夫
2025-12-25 09:56:07
超载货车查处后“卷土重来”,周边居民:“每天提心吊胆”

超载货车查处后“卷土重来”,周边居民:“每天提心吊胆”

扬子晚报
2025-12-25 17:37:47
青岛大学裁撤青岛师范学院 青岛师范大学要来了吗 青师历史不敌烟师

青岛大学裁撤青岛师范学院 青岛师范大学要来了吗 青师历史不敌烟师

今日美食分享
2025-12-25 13:47:09
为什么县城房价没怎么跌?

为什么县城房价没怎么跌?

社科干饭指南
2025-12-24 13:02:50
意外收获!南博事件拔出萝卜带出泥!

意外收获!南博事件拔出萝卜带出泥!

大道微言
2025-12-23 19:29:03
央行终于出手,2026年2月1日起正式执行!拒收现金正式纳入严管!

央行终于出手,2026年2月1日起正式执行!拒收现金正式纳入严管!

今朝牛马
2025-12-24 22:30:26
在柬埔寨,如果你问街上的人,谁是这个国家的最高领袖?

在柬埔寨,如果你问街上的人,谁是这个国家的最高领袖?

忠于法纪
2025-12-25 22:27:02
狂扫1000吨黄金,美联储慌了,金价突破4500,中国底牌要藏不住了

狂扫1000吨黄金,美联储慌了,金价突破4500,中国底牌要藏不住了

前沿天地
2025-12-26 00:47:40
明天上海气温将达近期最低!入冬和2026哪个先来?

明天上海气温将达近期最低!入冬和2026哪个先来?

鲁中晨报
2025-12-25 19:57:03
国防部:解放军全时待战、随时能战、战之必胜

国防部:解放军全时待战、随时能战、战之必胜

界面新闻
2025-12-25 15:58:25
朱孝天深夜发文道歉!称情绪失控言论欠妥,彻底认怂关闭评论区

朱孝天深夜发文道歉!称情绪失控言论欠妥,彻底认怂关闭评论区

萌神木木
2025-12-25 23:37:26
中国军队回撤时越军为何不追击?越南少将阮德辉回忆:并非不敢打

中国军队回撤时越军为何不追击?越南少将阮德辉回忆:并非不敢打

古书记史
2025-12-22 19:50:50
阚清子被曝畸形儿夭折不到一天,前任经纪人发声,担心的事发生了

阚清子被曝畸形儿夭折不到一天,前任经纪人发声,担心的事发生了

月光作笺a
2025-12-25 22:53:48
传奇!中国小哥乾隆年间跑到英国,从男仆一路升职,干成大英公务员了?!

传奇!中国小哥乾隆年间跑到英国,从男仆一路升职,干成大英公务员了?!

英国那些事儿
2025-12-25 22:59:36
大蒜塞耳朵里太厉害了,10个人9个都用得到,看完赶快叮嘱家人

大蒜塞耳朵里太厉害了,10个人9个都用得到,看完赶快叮嘱家人

妙招酷
2025-12-02 00:06:08
李兰娟发现:经常吃红薯的人,用不了多久,肠胃或有这5个变化

李兰娟发现:经常吃红薯的人,用不了多久,肠胃或有这5个变化

九哥聊军事
2025-11-30 18:49:01
从叫嚣今夜就开战,到坚决不与中国发生冲突,美国人真的变怂了?

从叫嚣今夜就开战,到坚决不与中国发生冲突,美国人真的变怂了?

温读史
2025-12-26 04:04:57
不装了,特朗普准备发动战争,六国被列入名单,各大势力选边站

不装了,特朗普准备发动战争,六国被列入名单,各大势力选边站

小俎娱乐
2025-12-26 01:38:45
浙江省纪委监委通报:蒋松海主动投案

浙江省纪委监委通报:蒋松海主动投案

新浪财经
2025-12-25 21:02:32
2025-12-26 05:11:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
321519文章数 606845关注度
往期回顾 全部

科技要闻

小米17Ultra发布,徕卡2亿像素 ,6999元起

头条要闻

俄军中将在汽车炸弹爆炸中身亡 俄军报复

头条要闻

俄军中将在汽车炸弹爆炸中身亡 俄军报复

体育要闻

约基奇有多喜欢马?

娱乐要闻

朱孝天把阿信好意当球踢!

财经要闻

新规来了,年化超24%的小贷被即刻叫停

汽车要闻

速来!智界在上海西岸准备了年末潮流盛典

态度原创

本地
家居
数码
时尚
公开课

本地新闻

这辈子要积多少德,下辈子才能投胎到德国当狗

家居要闻

经典弥新 品味浪漫居所

数码要闻

年终复盘不用愁,鸿蒙电脑让高效贯穿每一刻

冬季穿衣别显得太臃肿!大衣收腰、搭配围巾,有质感又高级

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版