网易首页 > 网易号 > 正文 申请入驻

模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

0
分享至

机器之心发布

机器之心编辑部

在深度学习时代,联邦学习(FL)提供了一种分布式的协作学习的方法,允许多机构数据所有者或客户在不泄漏数据隐私的情况下协作训练机器学习模型。然而,大多数现有的 FL 方法依赖于集中式服务器进行全局模型聚合,从而导致单点故障。这使得系统在与不诚实的客户打交道时容易受到恶意攻击。本文中,FLock 系统采用了点对点投票机制和奖励与削减机制,这些机制由链上智能合约提供支持,以检测和阻止恶意行为。FLock 理论和实证分析都证明了所提出方法的有效性,表明该框架对于恶意客户端行为具有鲁棒性。

现今,机器学习(ML),更具体地说,深度学习已经改变了从金融到医疗等广泛的行业。在当前的 ML 范式中,训练数据首先被收集和策划,然后通过最小化训练数据上的某些损失标准来优化 ML 模型。学习环境中的一个共同基本假设是训练数据可以立即访问或轻松地跨计算节点分发,即数据是「集中式」的。

然而,在一个拥有多个「客户端」(即数据持有者)的系统中,为了确保数据集中化,客户端必须将本地数据上传到一个集中设备(例如中心服务器)以进行上述的集中式训练。尽管集中式训练在各种深度学习应用中取得了成功,但对数据隐私和安全的担忧日益增长,特别是当客户端持有的本地数据是私有的或包含敏感信息时。

联邦学习(FL)可以解决训练数据隐私的问题。在一个典型的 FL 系统中,一个中心服务器负责聚合和同步模型权重,而一组客户端操纵多站点数据。这促进了数据治理,因为客户端仅与中心服务器交换模型权重或梯度,而不是将本地数据上传到中心服务器,并且已经使 FL 成为利用多站点数据同时保护隐私的标准化解决方案。

然而,现有的 FL 大多不能保证来自客户端的上传模型更新的质量。例如,我们可以将恶意行为定义为通过投毒攻击故意降低全局模型学习性能(例如准确性和收敛性)的行为。攻击者可以通过操纵客户端破坏 FL 系统,而不是黑进中心服务器。这项工作专注于防御客户端投毒攻击。

一种解决方案是将 FL 与如全同态加密(FHE)和安全多方计算(SMPC)等复杂的密码协议相结合,以减轻客户端的恶意行为。然而,采用这些复杂的密码协议为 FL 参与者引入了显著的计算开销,从而损害了系统性能。

FLock.io 公司及其合作研究者们(上海人工智能实验室 Nanqing Dong 博士、帝国理工大学 Zhipeng Wang 博士、帝国理工大学 William Knoettenbelt 教授、及卡内基梅隆大学 Eric Xing 教授)通过提出一种基于区块链和分布式账本技术的安全可靠的 FL 系统框架来解决传统联邦学习(FL)依赖于集中式服务器进行全局模型聚合,从而导致单点故障这个问题,并将此系统设计命名为 FLock。

在该研究中,团队借助区块链、智能合约和代币经济学设计一种可以抵抗恶意节点攻击(尤其是投毒攻击)的 FL 框架。该工作的成果近期被 IEEE Transactions on Artificial Intelligence (TAI) 接收。



  • 论文链接:https://ieeexplore.ieee.org/document/10471193
  • 论文标题:Defending Against Poisoning Attacks in Federated Learning with Blockchain

方法介绍

灵感来源

FLock 的机制设计受到了证明权益(PoS)区块链共识机制和桌面游戏《The Resistance》(一种角色扮演类游戏,该游戏的一个变种叫阿瓦隆)的启发。

PoS 要求参与者通过奖励诚实行为并通过削减权益来惩罚不诚实行为,鼓励诚实行为。例如,在以太坊上,希望参与验证区块并识别链头的节点运营商将以太币存入以太坊上的智能合约中。某位验证者从总验证者池中随机选择作为区块提出者提出新区块, 其他验证者则检查新区块并证明它们是否有效。如果验证者未能完成其中相应的任务,他们就即会受到惩罚或削减;诚实节点则会收到奖励。

《The Resistance》游戏则通过投票机制,每轮游戏中玩家独立推理并投票,从而实现全局共识。《The Resistance》有两个不匹配的竞争方,其中较大的一方被称为抵抗力量,另一方被称为间谍。在《The Resistance》中,有一个投票机制,在每一轮中,每个玩家进行独立推理并为一个玩家投票,得票最多的玩家将被视为「间谍」并被踢出游戏。抵抗力量的目标是投票淘汰所有间谍,而间谍的目标是冒充抵抗力量并生存到最后。

整体设计

基于 PoS 和《The Resistance》的启发,FLock 提出了一个新颖的基于区块链的 FL 全局聚合的多数投票机制,其中每个 FL 参与客户端独立验证聚合本地更新的质量,并为全局更新的接受度投票。参与者需要抵押资产或代币。

每一轮 FL 训练中,参与者将被随机选中参与两种类型的行动,提议(上传本地更新)和投票。聚合者(可以是区块链矿工或者其他 FL 链下聚合者)将对收到的本地更新进行聚合从而得到全局聚合。如果大多数投票接受全局聚合,提议者将退还其抵押的代币,而投票接受的投票者不仅会退还,而且还会获得投票拒绝的投票者的抵押代币的奖励,反之亦然。

基于股权基础聚合机制的整体设计如下图所示。



算法细节如下所示:

  • 在每一轮中,从参与的客户端中随机选择提议者来进行本地训练并将本地更新上传到区块链。
  • 随机选择的投票者将下载聚合的本地更新,执行本地验证,并投票接受或拒绝。



  • 如果大多数投票者投票「接受」,那么全局模型将被更新,提案者和投票「接受」的投票者将获得奖励。



  • 相反,如果大多数投票者投票「拒绝」,则全局模型将不会更新,提案者和投票「接受」的投票者的抵押代币将被削减。





该算法的最终目标是让恶意参与者的长期平均收益为负值,进而使其抵押代币削减到低于某个允许阈值,从而被提出 FL 系统。

实验结果

FLock 的实验在 Kaggle Lending Club 数据集和 ChestX-ray14 数据集上显示分析了该方案的可行性和鲁棒性,包括:

与传统 FL 相比,FLock 抵抗恶意节点的能力:如下图所示,FLock (即 FedAVG w/block)在有恶意节点的情况下仍然保持了稳健的性能。



恶意参与者的抵押代币变化:同理论分析一致,恶意参与者的平均代币随着训练轮数 / 时间的增加而减少。并且,如果惩罚力度增大(即 \gamma 增大),则恶意参与者的平均代币的减少速度将会增大。



诚实参与者的抵押代币变化:相对应的,诚实参与者的平均代币随着训练轮数 / 时间的增加而增加。并且,如果惩罚力度增大大(即 \gamma 增大),则诚实参与者的平均代币的增加速度将会增大。



恶意参与者的存活时间:恶意参与者的存活时间将会随着惩罚力度增大而缩短。



诚实参与者的存活时间:FLock 的实验结果也指出,在恶意节点占比较多的时候(即 \eta 增大时),较大的惩罚力度也会造成部分诚实节点的存活时间缩短(因为每一轮的提议者和投票者是随机选取的)。因此,在实际应用中,要结合考虑恶意节点占比(即 \eta)设置惩罚力度(即 \gamma)。



总结与展望

FLock 提出了一种基于区块链、智能合约和代币经济学的可以抵恶意节点攻击的 FL 框架。该方案论证了区块链和 FL 结合的可行性,证明了区块链不仅可以在去中心化和激励参与者在金融和医学等领域的现实世界中的 FL 应用中发挥重要作用,而且还可以用来防御投毒攻击。

FLock 的方案已被进一步落地实现:https://www.flock.io/

团队将于近期推出首个版本的去中心化 AI 模型训练平台,基建包括了激励体系,联邦学习和一键微调脚本。平台将主要面向两类人群:Developer:欢迎各位 Kaggle 及 Huggingface 玩家早期入驻,完成模型训练与验证以获得激励;Task Creator:有模型训练或者微调需求的公司或者团队可以在FLock平台上发布任务,FLock提供基建组织开发者,从而省去组建AI团队,寻找用户基础与数据的复杂过程,并简化工作流。有兴趣请邮件 FLock 团队:hello@flock.io

研究方面,FLock 也正在探索更加多维度的 decentralized AI 安全解决方案,如借助零知识证明解决 FL 中心节点作恶的问题。

研究地址:https://arxiv.org/pdf/2310.02554.pdf

Let's wait for more decentralized AI solutions from FLock!

与此同时,FLock.io 公司致力于将此技术投入到工程实践,也于最近官宣种子轮六百万美元的融资,由 Lightspeed Faction(光速美国)领投。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
毛奇落马后主动交代内幕,李佩霞最新工作照片曝光,引网友热议!

毛奇落马后主动交代内幕,李佩霞最新工作照片曝光,引网友热议!

小毅讲历史
2024-07-27 13:13:30
官宣,中国队4人退出,2人已回国,无缘巴黎奥运,名记透露内幕

官宣,中国队4人退出,2人已回国,无缘巴黎奥运,名记透露内幕

东球弟
2024-07-26 16:15:56
反转?“等身体好了,做什么都可以”又传李佩霞欲拒还迎 不简单?

反转?“等身体好了,做什么都可以”又传李佩霞欲拒还迎 不简单?

娱乐圈见解说
2024-07-27 15:38:38
“格美”最新影响!山东10市有暴雨到大暴雨,局部特大暴雨

“格美”最新影响!山东10市有暴雨到大暴雨,局部特大暴雨

鲁中晨报
2024-07-27 11:57:03
仅7名运动员参加奥运会,代表团规模却庞大,津巴布韦引发争议

仅7名运动员参加奥运会,代表团规模却庞大,津巴布韦引发争议

星耀国际足坛
2024-07-27 02:47:49
特朗普,突发!

特朗普,突发!

证券时报
2024-07-27 14:17:07
不能理解巴黎奥运中国队5个队“拼船”,而美国队一条单独游船

不能理解巴黎奥运中国队5个队“拼船”,而美国队一条单独游船

泸沽湖
2024-07-27 13:45:51
令人震惊的消息传来,奥运会开幕之际中国女篮竟爆出了两大新闻

令人震惊的消息传来,奥运会开幕之际中国女篮竟爆出了两大新闻

百里无心
2024-07-27 10:23:43
四太梁安琪财产申报表曝光,223套住宅、11栋商业大楼等写满28页

四太梁安琪财产申报表曝光,223套住宅、11栋商业大楼等写满28页

娱乐白名单
2024-07-27 12:17:30
闹大!巴黎运动员大巴没空调,韩国队有人热晕倒,有人当场脱衣服

闹大!巴黎运动员大巴没空调,韩国队有人热晕倒,有人当场脱衣服

嘴炮体坛
2024-07-26 18:10:43
警醒!为什么越来越多的人选择在社交媒体实名举报,而不选择报警

警醒!为什么越来越多的人选择在社交媒体实名举报,而不选择报警

体制内老陈
2024-07-26 08:12:38
多地停课、停运、景区关闭!海浪警报来袭!山东10市有大暴雨局部特大暴雨!台风“格美”最新动态↘

多地停课、停运、景区关闭!海浪警报来袭!山东10市有大暴雨局部特大暴雨!台风“格美”最新动态↘

鲁中晨报
2024-07-27 16:29:06
最新!李佩霞父亲爆料:曾找毛奇3次,为了女儿性命,到外地举报

最新!李佩霞父亲爆料:曾找毛奇3次,为了女儿性命,到外地举报

影像温度
2024-07-26 22:52:21
帮中国冲破美国垄断后,美籍老板提走了11亿

帮中国冲破美国垄断后,美籍老板提走了11亿

灰鸽观察室
2024-07-27 09:17:55
奚梦瑶见证何猷君公司海外上市,激动不已,也是实现了共同心愿

奚梦瑶见证何猷君公司海外上市,激动不已,也是实现了共同心愿

话娱论影
2024-07-27 11:08:12
东莞传奇水蛇姐:以五项绝技名震莞城,得罪某位大人物后离奇消失

东莞传奇水蛇姐:以五项绝技名震莞城,得罪某位大人物后离奇消失

吴学华看天下
2024-07-24 10:23:35
上海前首富周正毅近况!戴200w名表打耳钉,装扮新潮雪茄不离手

上海前首富周正毅近况!戴200w名表打耳钉,装扮新潮雪茄不离手

果娱
2024-07-26 17:09:13
王贵元年轻时和现在变化真大啊,年轻时浓眉大眼、妥妥的小鲜肉!

王贵元年轻时和现在变化真大啊,年轻时浓眉大眼、妥妥的小鲜肉!

阿芒娱乐说
2024-07-27 14:01:05
恶心,郑州女生讨薪被抬出后续:公司被扒得底朝天,警方账号沦陷

恶心,郑州女生讨薪被抬出后续:公司被扒得底朝天,警方账号沦陷

说真话的小陈
2024-07-27 10:51:23
奥运会盈利排名:日本亏损210亿,北京奥运会第3,第一名出乎意料

奥运会盈利排名:日本亏损210亿,北京奥运会第3,第一名出乎意料

拳击时空
2024-07-26 06:36:38
2024-07-27 18:32:49
机器之心Pro
机器之心Pro
专业的人工智能媒体
9249文章数 141966关注度
往期回顾 全部

科技要闻

俞敏洪:以分手换安宁,剥离无法避免

头条要闻

中国射击队00后组合勇夺巴黎奥运会首金

头条要闻

中国射击队00后组合勇夺巴黎奥运会首金

体育要闻

奥运会能有今天,多亏了巴黎

娱乐要闻

《歌手2024》总决赛赛制被质疑好搞笑

财经要闻

董宇辉单飞,与辉同行到底值多少钱?

汽车要闻

售价18.27万/新外观 雪铁龙 天逸C5冠军版上市

态度原创

时尚
数码
本地
健康
公开课

会打扮的女人不显老,不信的话看这些五六十岁阿姨,优雅到老

数码要闻

英特尔酷睿Ultra 7 265KF首曝:20核20线程的Arrow Lake-S 处理器

本地新闻

换个城市过夏天 | 辽宁彰武的清新之旅

人类为何至今无法攻克渐冻症?

公开课

曾激光治近视的人,现在后悔吗?

无障碍浏览 进入关怀版