网易首页 > 网易号 > 正文 申请入驻

冼汉迪谈人工智能时代语料库建设的合规问题

0
分享至

3月2日下午,中国网络空间安全协会人工智能安全治理专业委员会在北京召开“人工智能语料建设与合规”专题研讨会。全国人大代表、政协委员及学界、法律、行业专家参会,针对人工智能大模型语料采集、处理、流通中所涉及的相关法律问题进行深入探讨。

全国人大代表、中手游(00302.hk)联合创始人、国宏嘉信资本创始合伙人冼汉迪先生发表了关于《人工智能语料建设与合规问题思考》的看法,他表示:模型训练目前仍具备较大的版权侵权风险,我的观点是,为了AI产业的发展,我建议在合理使用版权作品的情况下,可以豁免一部分大模型的版权责任,但不是无条件、无限制的豁免;要鼓励技术创新,如开发智能版权识别技术等,更好的帮助和管理版权问题;要鼓励公众多参与此话题的讨论,提升版权意识和知识产权教育,共同推动人工智能技术的健康发展。

以下是讲话全文:

大家下午好,非常感谢主办方的邀请,今天很高兴能和大家一起来探讨智能语料建设与合规的问题,我也在此谈谈我的思考。

一、大模型训练目前仍具备较大的版权侵权风险

首先,让我们回顾一下大模型的基本概念。大模型是一种深度学习模型,通过海量数据的训练,可以实现自然语言理解、生成等任务。然而,正是因为它的训练依赖于大量的数据,涉及到了版权作品的使用,因此也引发了版权侵权的担忧,未经授权利用第三方平台作品数据进行大模型训练也导致了一些纷争。

关于生成式人工智能利用的数据来源,许多人工智能开发者并不公开其训练数据集的确切细节,但大致可以分为两步:第一步,通过购买数据库、公开爬取等方式获得海量内容数据,进行一定形式的转换之后,存储在相关服务器之中;第二步,对内容数据进行分析处理,以发现一定的模式、趋势以及相关性并转变为大模型参数,供后续内容生成时调取使用。但是,这些数据中不乏含有受版权保护的内容。

例如,包括谷歌、Facebook和OpenAI在内的人工智能开发者都在使用“Colossal Clean Crawled Corpus” 数据集(通常简称为C4数据集)来训练大模型,C4 数据集包括许多具有版权内容的网站,这些形式的数据收集也可能引起版权所有权和合理使用的问题,成为了生成式人工智能技术健康发展的症结所在。

二、对于大模型训练运用版权作品是否侵权,现有的判断标准是什么?

为了进一步了解如何判定用版权作品训练大模型是否是侵权的,我也去了解了一下我国相关的法律规定:

我国《著作权法》第二十四条规定了“合理使用”(即对于作品的利用,可以不经版权人许可,不向其支付报酬)的具体情形,涉及大模型训练的具体规则大致包括“个人使用”“适当引用”“学习研究使用”等。

其中:

第一点,“个人使用”适用目的存在严格限制,目前大模型主要为商业性服务,不满足该项;

第二点,“适当引用”,法律条文中的前提是“为介绍、评论说明某一作品”或“说明某一问题”,AIGC模型商业化应用显然也不满足该项;

第三点,“科学研究”,对作品的利用限定在“学校课堂教学或者科学研究”,同时还强调仅能“少量复制”,大模型大量复制与利用作品的现状无法满足该项要求。

那么如果仅仅根据著作权法来看,用未经授权的版权作品进行模型训练无疑是侵权的。

但是,除了《著作权法》之外,为了让版权法服务于促进全社会文化知识的分享、内容传播技术的进步等更高层级的公共利益,各国也设立了一个例外规则,即:如果满足“三步检验法”,也可以判定为“不侵权”。三步检验法的具体内容是 “只能在特殊情况下做出、与作品的正常利用不相冲突,没有不合理的损害版权人的利益”。

关于用这三步来评判大模型是否侵权,我相信今天在座的各位法律专家也一定会有自己的专业见解。我想重点谈谈:未经授权的版权作品用于模型训练,是否会对版权作品形成市场冲击?是否会导致公共利益不平衡?这一定是一个价值考量和利益平衡的过程,很难说有一个百分百正确的答案。我认为,AIGC的发展一定会极大的推动社会发展。虽然模型训练对版权方可能会造成一定的市场影响,但如果我们过度强调训练过程中要对版权作品付费,一定会对限制甚至是阻碍AIGC的产业发展。

所以我们也看到,从ChatGPT发布以来,世界各国为了促进AI的发展,其实已经对法律的完善作出了初步探索,目标都是在一定程度上“豁免AIGC平台在模型训练阶段的版权责任”。例如,欧盟、日本、美国都通过修改法律条文的方式对大模型的版权责任做出了一定程度的豁免。

三、建议

因此,我在此也作出以下建议:

1.为了AI产业的发展,我建议在合理使用版权作品的情况下,可以豁免一部分大模型的版权责任,但不是无条件、无限制的豁免。

2.鼓励技术创新,如开发智能版权识别技术等,更好的帮助和管理版权问题。

3.鼓励公众多参与此话题的讨论,提升版权意识和知识产权教育,共同推动人工智能技术的健康发展。例如像今天这样的讨论交流就是一个很好的契机,所以也再次感谢主办方组织这样的会议,让我们能够对人工智能语料建设与合规的问题有更加深入的思考和交流。

以上就是我的分享,谢谢大家!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李春江接任新主教练?杜锋拒绝续约广东队,换帅基本成为定局!

李春江接任新主教练?杜锋拒绝续约广东队,换帅基本成为定局!

绯雨儿
2026-06-26 11:14:36
摩根士丹利:光通信退潮,网络设备正成为新主线

摩根士丹利:光通信退潮,网络设备正成为新主线

新浪财经
2026-06-26 17:43:36
特斯拉中国为员工子女设奖学金:考上985、211最高奖5000元

特斯拉中国为员工子女设奖学金:考上985、211最高奖5000元

IT之家
2026-06-26 11:53:40
土耳其发生多起中国游客租驾汽车、摩托车、骑马等意外事故,多人受伤甚至死亡,中使馆紧急提醒

土耳其发生多起中国游客租驾汽车、摩托车、骑马等意外事故,多人受伤甚至死亡,中使馆紧急提醒

极目新闻
2026-06-26 17:09:22
美国发话也不行,中方正式通告全球:打日本,中国具备“正当性”

美国发话也不行,中方正式通告全球:打日本,中国具备“正当性”

凤语谈
2026-05-28 12:13:58
豆瓣9.4的国产神剧,正在被全网批判

豆瓣9.4的国产神剧,正在被全网批判

独立鱼
2026-06-27 00:05:34
一句话捅了马蜂窝!梅洛尼公开反驳吕特:意大利没参战,别乱说

一句话捅了马蜂窝!梅洛尼公开反驳吕特:意大利没参战,别乱说

相思赋予谁a
2026-06-27 02:38:42
A股:证监会最新出手,开出私募史上最重罚单!下周一将迎新变化

A股:证监会最新出手,开出私募史上最重罚单!下周一将迎新变化

云鹏叙事
2026-06-27 00:00:07
贝克汉姆也成“发面馒头”了?男神老去不可怕,可怕的是瞎折腾

贝克汉姆也成“发面馒头”了?男神老去不可怕,可怕的是瞎折腾

白露文娱志
2026-06-26 16:27:17
从狂赚到大亏15亿卢布!吉利长安在俄罗斯一年从天堂摔地狱

从狂赚到大亏15亿卢布!吉利长安在俄罗斯一年从天堂摔地狱

老马拉车莫少装
2026-05-11 14:18:27
温网首轮“缘分弄人”,吴易昺对战德约,郑钦文再战西尼亚科娃

温网首轮“缘分弄人”,吴易昺对战德约,郑钦文再战西尼亚科娃

极目新闻
2026-06-26 18:38:04
逆转四冠王!高原之鹰时隔20年再次小组出线 总统宣布全国放假1天

逆转四冠王!高原之鹰时隔20年再次小组出线 总统宣布全国放假1天

狍子歪解体坛
2026-06-26 10:11:26
为什么女人第一次同房后,后面不主动也不拒绝呢?

为什么女人第一次同房后,后面不主动也不拒绝呢?

思絮
2026-06-02 10:06:18
啥情况?李在明穿防弹背心,突然对中国强硬表态:韩国不会不管!

啥情况?李在明穿防弹背心,突然对中国强硬表态:韩国不会不管!

云舟史策
2026-06-26 07:06:24
卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

叨唠
2026-05-27 04:13:37
17场16球5助攻,姆巴佩世界杯直接参与进球数升至历史第二

17场16球5助攻,姆巴佩世界杯直接参与进球数升至历史第二

懂球帝
2026-06-27 03:32:22
不配执法世界杯?美国女主裁连续犯错:被打出1.0分 FIFA应禁赛她

不配执法世界杯?美国女主裁连续犯错:被打出1.0分 FIFA应禁赛她

风过乡
2026-06-26 07:01:44
付某兵(男,1977年生)运毒近87公斤,已核准死刑

付某兵(男,1977年生)运毒近87公斤,已核准死刑

南方都市报
2026-06-26 08:14:48
我接受不了我女儿这样!女大学生晒和男友同居日常,家长心态崩了

我接受不了我女儿这样!女大学生晒和男友同居日常,家长心态崩了

世界圈
2026-06-25 12:34:13
重磅利好!铟定乾坤,磷化铟产能龙头开启长牛行情

重磅利好!铟定乾坤,磷化铟产能龙头开启长牛行情

趣味萌宠的日常
2026-06-26 07:31:03
2026-06-27 05:55:00
此账号已停用 incentive-icons
此账号已停用
请关注全新账号:IT时代网
4594文章数 54917关注度
往期回顾 全部

科技要闻

拿了500亿的梁文锋,只挖地基,不信销售

头条要闻

世界杯:塞内加尔5-0十人伊拉克 盖伊世界波双响

头条要闻

世界杯:塞内加尔5-0十人伊拉克 盖伊世界波双响

体育要闻

我在世界杯的每次奔跑,都为了证明你没看错

娱乐要闻

玥儿不回北京,马筱梅解释后妈身份

财经要闻

"索具龙头"领大额罚单

汽车要闻

11.99万起 捷途自由者7 PLUS/山海T1四驱版上市

态度原创

游戏
本地
数码
公开课
军事航空

迈向下一个十年的大成之作!《暗喻幻想》凭啥拿下年度最佳RPG?

本地新闻

世界杯球迷节:比球赛更好玩的派对

数码要闻

深夜突发!iPad/Mac全球大涨价,苹果成了AI受害者?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:驶离指定航线船舶不享有安全保障

无障碍浏览 进入关怀版