网易首页 > 网易号 > 正文 申请入驻

Google发布首个隐私保护大语言模型VaultGemma

0
分享至


越来越多寻求构建更大AI模型的公司受到高质量训练数据不足的制约。随着科技公司在网络上搜寻更多数据来训练模型,它们可能越来越依赖潜在的敏感用户数据。Google Research团队正在探索新技术,使生成的大语言模型不太可能"记忆"任何此类内容。

大语言模型具有非确定性的输出,这意味着无法准确预测它们会说什么。虽然即使对于相同的输入,输出也会有所不同,但模型有时确实会重现训练数据中的内容——如果使用个人数据进行训练,输出可能违反用户隐私。如果受版权保护的数据进入训练数据(无论是意外还是故意),其在输出中的出现会给开发者带来不同类型的麻烦。差分隐私可以通过在训练阶段引入校准噪声来防止这种记忆。

为模型添加差分隐私在准确性和计算需求方面会带来缺点。直到现在,还没有人费心研究这在多大程度上改变了AI模型的扩展规律。该团队基于模型性能主要受噪声批次比影响的假设开展工作,该比率比较了随机化噪声的量与原始训练数据的大小。

通过运行不同模型大小和噪声批次比的实验,团队建立了对差分隐私扩展规律的基本理解,这是计算预算、隐私预算和数据预算之间的平衡。简而言之,更多噪声会导致较低质量的输出,除非用更高的计算预算(FLOPs)或数据预算(Token)来抵消。该论文详细介绍了私有大语言模型的扩展规律,这可以帮助开发者找到理想的噪声批次比,使模型更加私密。

构建VaultGemma

这项差分隐私工作催生了一个名为VaultGemma的新开放权重Google模型。该模型使用差分隐私来减少记忆的可能性,这可能改变Google在未来AI智能体中构建隐私保护的方式。不过目前,该公司的首个差分隐私模型只是一个实验。

VaultGemma基于Gemma 2基础模型,该模型比Google最新的开放模型系列落后一代。团队使用从初始测试中得出的扩展规律,以最优差分隐私训练VaultGemma。这个模型在整体规模上并不是特别大,只有10亿个参数。然而,Google Research表示VaultGemma的表现与类似规模的非私有模型相似。

该团队希望这项差分隐私扩展规律的工作将帮助其他人有效分配资源来训练私有AI模型。这可能不会改变最大和最强AI模型的运行方式——在超大型通用模型中,性能就是一切。而且无论如何,研究表明差分隐私在较小的大语言模型中效果更好,比如驱动特定AI功能的专用模型。

您现在可以从Hugging Face和Kaggle下载VaultGemma。与其他Gemma模型一样,这个模型具有开放权重,但并非完全开源。虽然Google允许您修改和分发Gemma模型,但您必须同意不将其用于恶意目的,并在任何修改版本中分发Gemma许可证的副本。

Q&A

Q1:VaultGemma是什么?有什么特别之处?

A:VaultGemma是Google发布的首个隐私保护大语言模型,基于Gemma 2基础模型构建。它使用差分隐私技术来减少模型"记忆"训练数据的可能性,从而避免在输出中泄露敏感用户数据或受版权保护的内容。

Q2:差分隐私技术是如何保护隐私的?

A:差分隐私通过在训练阶段引入校准噪声来防止模型记忆训练数据中的具体内容。这样即使模型使用了个人数据或受版权保护的数据进行训练,也不太可能在输出中重现这些敏感信息,从而保护用户隐私。

Q3:在哪里可以获取VaultGemma模型?

A:VaultGemma现在可以从Hugging Face和Kaggle下载。该模型具有开放权重,用户可以修改和分发,但需要同意不用于恶意目的,并在修改版本中包含Gemma许可证副本。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伦纳德离队引发快船动荡,鲍尔默怒火中烧!

伦纳德离队引发快船动荡,鲍尔默怒火中烧!

乖囧貓儿
2025-09-19 08:36:27
释永信交代的情况令人吃惊!你想象不到他的生活有多豪!

释永信交代的情况令人吃惊!你想象不到他的生活有多豪!

巷子里的历史
2025-09-19 08:25:23
福建一男子妻子去世后跟保姆结婚,五年后搬家见到妻子旧手机,谁料,打开后却要跟保姆离婚

福建一男子妻子去世后跟保姆结婚,五年后搬家见到妻子旧手机,谁料,打开后却要跟保姆离婚

广电新视网
2025-09-17 12:10:57
66岁毕福剑也没想到,自己败光的体面,如今被29岁的女儿挣了回来

66岁毕福剑也没想到,自己败光的体面,如今被29岁的女儿挣了回来

心静物娱
2025-09-03 13:47:40
为什么说人类去ktv就几乎废了?网友:我只能说还是注意安全吧

为什么说人类去ktv就几乎废了?网友:我只能说还是注意安全吧

解读热点事件
2025-06-10 00:20:03
何猷君乘国产豪车现身南宁,新座驾崭新,传何超莲给家人买了30台

何猷君乘国产豪车现身南宁,新座驾崭新,传何超莲给家人买了30台

柠檬有娱乐
2025-09-19 14:14:57
9月19日俄乌最新:两个月来的最大战果

9月19日俄乌最新:两个月来的最大战果

西楼饮月
2025-09-19 18:00:08
温州一学校被曝家委收取每人1000元班费,教育局:若属实会叫停

温州一学校被曝家委收取每人1000元班费,教育局:若属实会叫停

现代快报
2025-09-19 19:05:19
出生数据对不上了,骤降2成...

出生数据对不上了,骤降2成...

思哲与创富
2025-09-17 11:37:15
韩媒:国际足联允许韩国队在下个月友谊赛球衣印韩文名字

韩媒:国际足联允许韩国队在下个月友谊赛球衣印韩文名字

直播吧
2025-09-19 15:06:02
《731》票房破4.1亿,豆瓣却差评如潮,终于理解吴京这段话

《731》票房破4.1亿,豆瓣却差评如潮,终于理解吴京这段话

娱乐圈笔娱君
2025-09-19 11:23:07
48:47,美国投票结果出炉,特朗普收到噩耗,他要支付351亿巨款

48:47,美国投票结果出炉,特朗普收到噩耗,他要支付351亿巨款

标体
2025-09-18 18:35:12
辛芷蕾胸前那朵盛开的玫瑰

辛芷蕾胸前那朵盛开的玫瑰

手工制作阿歼
2025-09-08 11:25:32
菲总统称若台海发生冲突菲将卷入 军事专家何雷:“雕虫小技”不会得逞

菲总统称若台海发生冲突菲将卷入 军事专家何雷:“雕虫小技”不会得逞

封面新闻
2025-09-18 14:04:03
女企业竟嫁19岁体育生,一天5次性生活,8年后得知丈夫隐藏身份

女企业竟嫁19岁体育生,一天5次性生活,8年后得知丈夫隐藏身份

今天说故事
2025-09-12 18:14:21
汗从哪出,病就从哪来!5 个部位出汗,对应不同脏腑问题,调理方法收好

汗从哪出,病就从哪来!5 个部位出汗,对应不同脏腑问题,调理方法收好

神奇故事
2025-09-18 22:59:06
普京总统:仅有4个国家能够制造PD-14这样的发动机,俄罗斯是其中之一

普京总统:仅有4个国家能够制造PD-14这样的发动机,俄罗斯是其中之一

俄罗斯卫星通讯社
2025-09-19 15:09:49
如果在家突发脑梗,黄金自救“5步骤”,奉劝你每个都要记在心里

如果在家突发脑梗,黄金自救“5步骤”,奉劝你每个都要记在心里

爆炸营养彭鑫蕊
2025-09-12 16:27:58
杜兰特17年买了比特币但忘了密码,期间比特币从1000涨到了11.7万美元

杜兰特17年买了比特币但忘了密码,期间比特币从1000涨到了11.7万美元

懂球帝
2025-09-18 10:36:28
莱尔斯200米厚度远超博尔特,史上20个最好成绩占10个断崖式领先

莱尔斯200米厚度远超博尔特,史上20个最好成绩占10个断崖式领先

杨华评论
2025-09-19 22:49:19
2025-09-20 02:31:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
14154文章数 49657关注度
往期回顾 全部

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

头条要闻

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

头条要闻

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

习近平同美国总统特朗普通电话

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

时尚
数码
亲子
本地
教育

卡其裤+蓝衬衫,简单高级

数码要闻

格力朱磊:十年免费包修是承诺,十年不用修才是实力

亲子要闻

每年一次性发放!育儿补贴新规出台

本地新闻

大学生军训哪家强,广西申请“出战”!

教育要闻

外国新闻史重点背诵清单。

无障碍浏览 进入关怀版