网易首页 > 网易号 > 正文 申请入驻

数据保护不等于数据封锁,科学家提出AI时代数据分级保护治理方案

0
分享至

在传统的信息系统中,数据往往被静态地存储在数据库或硬盘中,保护数据的方式也相对简单——只需将其“锁起来”即可。但随着生成式人工智能(GenAI,Generative AI)的快速发展,数据开始在模型的训练、部署、调用、生成等多个环节中持续“流动”,不再是一个静态的资源,而成为 AI 系统生命周期中活跃的参与者。

数据的流动性给其保护带来了新的挑战:我们不仅要防止数据泄露和滥用,还要确保在数据被使用的同时,依然保有“知情、可控、可溯源、可删除”等基本权利。换句话说,在生成式人工智能时代,数据保护不再等同于一刀切的“封锁”,而需要更加细致、动态的治理方案。

正是基于这些观察,来自浙江大学区块链与数据安全全国重点实验室和新加坡南洋理工大学等团队的研究人员进行了一项联合研究,旨在以通俗易懂的语言向广大读者阐述数据保护在生成式人工智能时代下的具体内涵与深远影响。

该工作系统地梳理并回答了数据保护在人工智能时代下面临的一系列关键问题:哪些数据要保护?应该采取怎样的保护措施?可能会遇到哪些新挑战?目前的相关法规和监管现状如何?数据保护和数据安全存在怎样的区别与联系?研究团队进一步提出了一套分层次的数据治理框架,试图在安全性、可用性与可监管性之间找到新的平衡。


(来源:arXiv)

需要了解的是,传统的数据保护理念是“以数据为中心”,无论训练还是保护都围绕数据本身展开;而该研究提出,在 AI 时代,数据保护本质是“以模型为中心”,这样的数据是在与 AI 模型的开发、应用、交互、生产过程中创造价值。

研究人员以模型为核心主线,重新梳理了其全生命周期中可能接触的数据类型以及涉及的各个环节,包括训练数据、训练后的模型、系统提示词、外挂知识库、用户输入的数据与 AI 生成内容等。

不同于以往数据保护中“加密加水印”的简单方法,他们提出了一种覆盖四个关键层级的保护框架——数据不可用性、隐私保护、可追溯性和可删除性。这一创新视角为未来 AI 技术的健康、可持续发展及其治理体系建设指出了明确的方向。

该论文第一作者、曾任浙江大学区块链与数据安全全国重点实验室特聘研究员、现新加坡南洋理工大学研究员(Research Fellow)李一鸣博士对 DeepTech 表示:“我们的核心目标是阐明数据保护在 AI 时代的关键内涵与价值——这也与当前全球范围内推动可信赖 AI 发展的主流诉求高度契合。”

目前,相关论文以《生成式人工智能时代下的数据保护再思考》(Rethinking Data Protection in the(Generative)Artificial Intelligence Era)为题发布在预印本网站arXiv[1]。南洋理工大学研究员李一鸣博士是第一作者,通讯作者由李一鸣博士和浙江大学秦湛教授共同担任。


图丨相关论文(来源:arXiv)

该团队构建了一套从 Level 1 到 Level 4 保护强度逐级递减的保护框架——从“最严格”逐渐降到“最低限度”,每往下一级,其保护强度随之递减,而数据效用则随之相应提升。

Level 1,数据不可用性(Non-usability):这是最高级别的数据保护,需确保特定数据无法用于模型训练或推理。例如,在此前三星员工误把源码贴进 ChatGPT 的事件中,就可以通过“数据不可用性”进行前置性保护。

Level 2,隐私保护性(Privacy-preservation):在保护隐私信息前提下,数据可用于模型开发和应用,也就是数据“可用不可见”,相当于数据脱敏后再使用,降低了数据隐私泄露的风险。

该要求在以往的技术和相关法规中其实就已被提出过,李一鸣举例说道:“例如差分隐私在训练阶段注入噪声,联邦学习将原始记录留在本地只上传梯度,同态加密则允许云端直接对密文运算。”

Level 3,可追溯性(Traceability):这是最新的法规要求,允许数据可使用,但数据必须通过数字水印或区块链等技术记录数据来源和使用与修改历史,并能够在训练或推理得到的模型和生成内容中得到校验,也就是“用后留痕”。

Level 4,可删除性(Deletability):这是最宽松的数据保护级别,允许数据完全用于训练和推理,赋予用户“被遗忘权”,允许其数据的影响从模型中彻底清除。


图丨生成式 AI 时代数据保护的层级分类(来源:arXiv)

实际上,由于各国家和地区对数据保护的要求具有显著差异,现有数据保护法规的覆盖面可能存在缺口。例如,欧盟的《通用数据保护条例》和《人工智能法案》明确提到了“可删除性”,美国加州的《加州消费者隐私法》强调“知情权”,中国的《个人信息保护法》和《生成式人工智能服务管理办法》则更加聚焦规范水印与标识。

然而,这会导致跨国数据治理的难题:当前,大模型的训练流程往往分散在全球。创业公司可能通过“地点切换”来规避法律层面的严格约束,例如在数据保护薄弱的国家采集训练数据,然后去模型监管宽松的地区完成训练和微调,再把服务部署到尚未规定删除权的司法管辖区,以将合规成本降到最低。


表丨生成式工智能时代数据保护的代表法规(来源:arXiv)

针对这一复杂局面,该研究提出了突破性的治理视角:当代数据保护的核心已从单纯的“数据封锁”转变为“价值的可控流动”。这种理念在具体应用场景中体现为:医疗 AI 可学习病例特征模式但不泄露患者隐私;法律 AI 能引用数据库中的以往判例逻辑却不可输出数据库中完整的判决书。

实现这种平衡需要多重技术支撑,例如,差分隐私保障训练过程隐私,数字水印追踪内容流向,联邦学习促进多方数据协作。特别值得注意的是,这些技术方案同时服务于“数据保护”与“数据安全”双重目标,反映出二者日益融合的趋势:当模型能够抵御成员推理攻击时,既保护了训练数据隐私,也增强了模型自身的安全性。


图丨李一鸣(来源:李一鸣)

李一鸣在清华大学计算机科学与技术专业获得博士学位,曾任浙江大学区块链与数据安全全国重点实验室特聘研究员。目前,他在南洋理工大学担任研究员(Research Fellow),研究方向为可信人工智能,尤其是 AI 安全评测和 AI 版权保护。

在论文的讨论部分,他与合作者还专门辨析了”数据保护“与”数据安全“的异同。原则上,二者关注点不同:前者聚焦模型及其所涉数据的隐私合规,后者强调模型本身及系统的稳健性。但在实践中,二者深度交织——数据保护不足可能导致系统不安全,反之亦然;联邦学习、差分隐私等技术已成为跨领域的通用解决方案。

正如研究中所提醒的那样,“数据保护不等同于数据安全”。该分层框架的价值在于把数据保护治理的颗粒度拆细,让产业界不必在“全封闭”与“全开放”之间二选一,而是像“调音量”一样,为不同场景、不同法域找到风险与创新的最佳平衡点。“我们相信,完善的数据治理方案将为更广泛范围的安全治理奠定坚实基础。”李一鸣说。

参考资料:

1.https://arxiv.org/abs/2507.03034

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
南京地铁试行10分钟内同站进出免费

南京地铁试行10分钟内同站进出免费

环球网资讯
2026-01-10 17:41:08
CBA最新积分榜!浙江7战6胜升第5,北控仅5胜8负,广州30分大胜!

CBA最新积分榜!浙江7战6胜升第5,北控仅5胜8负,广州30分大胜!

止境
2026-01-11 01:21:55
湘西女匪王1951年被擒,她看着审讯将领凄然一笑,道出惊人的过往

湘西女匪王1951年被擒,她看着审讯将领凄然一笑,道出惊人的过往

卡西莫多的故事
2026-01-07 10:43:54
郭晶晶没想到,被国家队开除的田亮,如今以这种方式让人刮目相看

郭晶晶没想到,被国家队开除的田亮,如今以这种方式让人刮目相看

无心小姐姐
2026-01-09 17:46:24
绝了!欧冠之臀遇流量永动机 C罗 金姐 周边秒罄比点球还快

绝了!欧冠之臀遇流量永动机 C罗 金姐 周边秒罄比点球还快

罗氏八卦
2026-01-10 23:35:03
1755年,乾隆灭掉准噶尔,男丁灭族,对当时的世界造成极大的震撼

1755年,乾隆灭掉准噶尔,男丁灭族,对当时的世界造成极大的震撼

掠影后有感
2026-01-10 13:54:20
挽救4个赛点!陈幸同4-3逆转张本美和,送日乒女单5人全军覆没

挽救4个赛点!陈幸同4-3逆转张本美和,送日乒女单5人全军覆没

莼侃体育
2026-01-11 03:18:54
26年央视春晚导演官宣彩排!小品领军人物确认回归,终于等到这天

26年央视春晚导演官宣彩排!小品领军人物确认回归,终于等到这天

琴声飞扬
2026-01-10 16:35:07
比恒大还惨!中国第二大民企轰然倒塌,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企轰然倒塌,负债7500亿,创始人被带走

古事寻踪记
2025-12-27 07:16:35
禁令执行第四天,中国电路板厂商不再向日本发货,日本厂商天塌了

禁令执行第四天,中国电路板厂商不再向日本发货,日本厂商天塌了

爱看剧的阿峰
2026-01-10 14:20:48
看到中方的反制决心,高市早苗宣布重新大选,内部动摇情绪严重

看到中方的反制决心,高市早苗宣布重新大选,内部动摇情绪严重

起喜电影
2026-01-11 02:49:55
突发!美军扣押第5艘油轮,中国亮大招:成千上万艘武装商船破局

突发!美军扣押第5艘油轮,中国亮大招:成千上万艘武装商船破局

薛小荣
2026-01-10 19:31:57
老用户成“冤大头”?新号29元100G 老号89元不够用 3招破局不换号

老用户成“冤大头”?新号29元100G 老号89元不够用 3招破局不换号

Thurman在昆明
2026-01-03 15:59:21
国乒新情报:1月10日,国乒公布新加坡大满贯参赛名单,陈俊菘上位

国乒新情报:1月10日,国乒公布新加坡大满贯参赛名单,陈俊菘上位

生活新鲜市
2026-01-11 00:46:02
取消光伏退税,行业大洗牌开始了!

取消光伏退税,行业大洗牌开始了!

许戈投资
2026-01-10 23:32:49
难怪中国如此淡定:马斯克做两大预测,不是开玩笑,美日韩都动了

难怪中国如此淡定:马斯克做两大预测,不是开玩笑,美日韩都动了

钦点历史
2026-01-10 10:30:46
英超最大黑马:1.5亿卖光主力+教练,现在还能排第5!

英超最大黑马:1.5亿卖光主力+教练,现在还能排第5!

刘剮说体坛
2026-01-10 12:18:06
马晓旭:感谢协会给年轻女教练机会;希望可以站到最高领奖台

马晓旭:感谢协会给年轻女教练机会;希望可以站到最高领奖台

懂球帝
2026-01-10 21:30:10
麻省理工研究警告:未来华北平原不宜人类居住!理论依据是什么?

麻省理工研究警告:未来华北平原不宜人类居住!理论依据是什么?

小熊侃史
2026-01-08 07:55:03
知名相声演员直播辟谣退出德云社

知名相声演员直播辟谣退出德云社

天津人
2026-01-10 15:37:26
2026-01-11 04:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16107文章数 514471关注度
往期回顾 全部

科技要闻

必看 | 2026开年最顶格的AI对话

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

时尚
艺术
旅游
手机
军事航空

伊姐周六热推:电视剧《小城大事》;电视剧《轧戏》......

艺术要闻

601米,150亿美元!沙特目前第一高楼是它!

旅游要闻

12.7亿元营收、15倍增长背后:谁在操盘万岁山武侠城?顶流景区直面“长红”之困|主题乐园资本论

手机要闻

魅族22Air、22 Next不开售发布,魅族23确认

军事要闻

海空英雄高翔逝世 曾驾驶歼-6打爆美军机

无障碍浏览 进入关怀版