网易首页 > 网易号 > 正文 申请入驻

ICLR 2022 | 如何从分布式数据进行自监督学习

0
分享至

在 ICLR 2022 上,商汤科技-南洋理工大学联合 AI 研究中心 S-Lab 的研究者对联邦自监督学习进行了深入研究,并提出了联邦指数移动平均更新,从而进一步提升联邦自监督学习的性能。 联邦自监督学习旨在从多个无标签数据源,在隐私保护的前提下,进行自监督学习,从而能被进一步用在下游任务上。

论文地址: https://weiming.me/publication/fedssl/

一、问题和挑战

最近几年来,无监督/自监督视觉表示学习的研究已经取得了一定成果,在 ImageNet数据集上,一些自监督学习的方法已经可以媲美监督学习,而多数的这些方法基于一个假设 – 数据可以采集和存储在一个中心的服务器上。随着近几年边端设备数量的暴增,这些设备产生了海量的数据,比如手机拍照和路边摄像头产生了大量图片,如果将这些图片都上传收集到一个中心服务器,会产生一定的隐私泄露的隐患,比如泄露个人的敏感信息和位置信息。此外,这些图片产生之后天然不带有标签,对这些图片进行人工标注费时费力。

在前一个工作(FedU)中 [1],我们提出了分布式自监督表示学习 FedU 来解决这个问题:FedU 运用了孪生神经网络,能够有效地从多个数据源进行无监督表示学习。近年来,有许多主流的使用孪生神经网络进行自监督学习的方法,FedU 中主要采用了 BYOL [2],但是其他的孪生网络方法、结构和组件的影响对联邦自监督学习的影响,仍未被深入研究。


二、深入分析联邦自监督学习

为了解决上述问题,我们首先提出了联邦自监督学习框架 (FedeSSL),这个框架适用于多种现有的基于孪生神经网络的自监督学习,也提供了灵活的可扩展性以适用于未来新的自监督学习方法。这个框架主要包括三个主要步骤来进行联邦自监督训练 (图1):

  1. 本地训练:每个边端采用孪生神经网络使用本地数据进行自监督对比学习。

  2. 模型通信:每个边端将训练好的模型上传到云端、将云端聚合后的模型更新到边端。

  3. 模型聚合:云端聚合边端上传的模型,产生新的模型。

这三个步骤组成了一回合的训练,FedSSL 不断迭代这三个步骤,直到完成训练。接下来,我们进一步介绍每部分的内容。

图1 联邦自监督学习 (FedSSL) 框架及训练流程图本地训练

每回合都有部分选中的边端进行自监督学习。基于孪生神经网络的自监督学习可以抽象成两个网络相互监督训练,一个在线网络和一个目标网络。训练流程如下:

  1. 对于一张图片,选取两种不同的随机图像变换(剪裁、水平翻转、颜色变换等)。

  2. 将两种不同的变换分别通过在线网络和目标网络、在线网络和目标网络输出一个向量,再对这两个向量计算损失函数。

  3. 更新在线网络和目标网络。

不同的自监督学习方法,设计了不同在线网络模型和目标网络更新方法。我们重点考虑4种现在被大家广泛接受的自监督学习方法:BYOL [2], SimSiam [3], MoCo [4], SimCLR [5]。这4种方法主要有两个维度的不同 (图2):

  1. 在线网络是否有预测器:BYOL 和 SimSiam 的在线网络有预测器,而 MoCo 和 SimCLR 没有。

  2. 在线网络和目标网络的模型参数是否完全一样:SimSiam 和 SimCLR 的两个网络参数相同,而 BYOL 和 MoCo (V1 和 V2) 的目标网络参数是在线网络参数的指数移动平均 (EMA)。

图2 4种基于孪生神经网络的自监督学习方法模型通信

FedSSL 的训练过程中,云端和边端之间需要频繁通信,而每个边端本地有两个网络模型, 因此两个关键的问题是:

  1. 在模型上传时,是上传在线网络、目标网络、还是二者都上传?

  2. 在模型更新时,是更新在线网络、目标网络、还是二者都更新?

我们之前的工作[1]中通过实验证明了上传并更新在线网络的性能最佳。

模型聚合

我们采用了传统联邦学习的模型聚合方法,计算上传的模型参数的加权平均,以得到新的模型参数。其中,权重为每个边端的数据量。

结论总结

基于联邦自监督学习框架,我们进行了大量的实验,深入的研究了预测器、不通过梯度更新目标网络 (stop-gradient)、在线网络和目标网络的更新方法对于整体性能的影响。以下是我们最重要的实验发现 (具体的实验结果可以参考论文):

  1. 预测器是必要的。

  2. 目标网络的更新:指数移动平均 (EMA) 和 不通过梯度更新目标网络 (stop-gradient) 有助于提高性能。

  3. 目标网络应该从在线网络获取“知识”,可以理解为目标网络的模型参数应该直接或间接地被在线网络的模型参数影响。

  4. 在数据异构的场景中,每个边端的在线网络应该保留一些本地“知识”,而不是完全被云端聚合后的模型更新替换。数据异构的意思是多个边端的数据之间是非独立同分布的,比如总共有十个类别的数据,边端只包含了其中随机两个类的数据。


三、模型更新策略:FedEMA

基于实验结论,我们使用 BYOL 作为边端本地训练的基础方法,因为 BYOL 的孪生网络中包含了前面提到的能够进一步提升性能的重要组件。

图3 展示了用独立同分布和非独立同分布数据在联邦学习训练中产生的模型发散的现象

在联邦学习训练过程中,数据异构可能会导致模型发散(图3)。基于第四点结论(在数据异构的场景中,每个边端的在线网络应该保留一些本地“知识”),我们进一步提出了联邦指数移动平均更新(FedEMA)以更好的解决联邦学习中数据异构的问题 (图4)。传统联邦学习的更新方法,直接用云端聚合后的模型参数替换边端上的模型参数,导致边端上的在线网络没能保留和本地数据联系更相关的知识,FedEMA 采用了指数移动平均的方法更新在线网络,既保留了一部分在线网络的知识,也让在线网络能够融合一部分云端聚合模型的知识。

图4 联邦指数移动平均更新 (FedEMA)

FedEMA 更新的具体公式如下:

和 分别是边端的在线网络和云端全局网络在第 回合的模型参数, 和 分别是边端 的预测器和全局预测器在第 回合的模型参数, 是指数移动平均的加权权重。 取值范围在0到1之间,当 时,FedEMA 等价于 FedBYOL。根据不同的数据异构性程度,我们可调节Scaler 来得到合适的 的值。 衡量的是云端网络和边端 前一回合的在线网络的发散程度,值越大表示发散程度越大。当发散程度较大时,我们得到比较大的 ,从而在模型更新时更多地使用边端前一回合模型;当发散度较小时,我们得到比较小的 ,从而在模型更新时更多地使用云端聚合模型。除此之外,我们还提出了 AutoScaler 方法来自动调节 的值,具体的细节可以参考原文。

四、实验结果Linear Evaluation

表1 Linear Evaluation 结果对比

上图是 Linear Evaluation 的结果对比,实验模拟了5个边端的场景,使用自监督对比训练了 100 回合得到模型骨干,然后选取在线网络的模型骨干,使用监督的方法训练一个分类器。FedEMA 的性能比其他的方法以及单个边端训练的结果有显著的提升。论文里还对比半监督衡量的结果,FedEMA 的性能也优于其他的方法。

参数分析

图5 Scaler 和 Autoscaler 参数选择影响

我们进一步分析了 Scaler 和 Autoscaler ,在 CIFAR 数据集上, 时, 的改变对整体性能只有轻微影响; 时, 的值可能会为 1,导致模型更新时没有考虑全局模型。在多数实验里,我们设 为 0.8 - 1。另一方面,Autoscaler 的调整相对更加鲁棒,不同的 都能取得相对不错的效果。

五、结语

在这项工作中,我们首先提出了联邦自监督视觉学习框架 FedSSL,并深入分析了孪生神经网络的基础组件对联邦自监督学习的影响;基于分析结果,我们提出了联邦指数移动平均更新以解决数据异构性的问题。我们希望这个工作能够进一步鼓励并促进在隐私保护的情况下,从分布式数据中进行自监督学习方面的研究。

Reference
[1] Zhuang, Weiming, et al. “Collaborative unsupervised visual representation learning from decentralized data.” ICCV, 2021.
[2] Grill, Jean-Bastien, et al. “Bootstrap your own latent-a new approach to self-supervised learning.” NeuIPS, 2020.
[3] Chen, Xinlei, and Kaiming He. “Exploring simple siamese representation learning.” CVPR, 2021.
[4] He, Kaiming, et al. “Momentum contrast for unsupervised visual representation learning.” CVPR, 2020.
[5] Chen, Ting, et al. “A simple framework for contrastive learning of visual representations.” International conference on machine learning. PMLR, 2020.

公众号:【商汤学术】 作者:庄伟铭

Illustration b y Victoria Chepkasova from icon s8

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线330+期talk视频,900+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

chenhongyuan@thejiangmen.com

或添加工作人员微信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

>> 投稿请添加工作人员微信!

关于我“

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务将门技术社群以及将门创投基金

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
通州8公园发现7种毒蘑菇!北京将进入蘑菇中毒高发时段,切勿采食野生蘑菇

通州8公园发现7种毒蘑菇!北京将进入蘑菇中毒高发时段,切勿采食野生蘑菇

环球网资讯
2026-06-23 14:19:48
郑丽文对大陆海警船驶入太平岛海域发表评论。

郑丽文对大陆海警船驶入太平岛海域发表评论。

果妈聊娱乐
2026-06-21 08:48:22
看完这7件事,我终于懂了:中国足球的离谱,早就超出了人类认知

看完这7件事,我终于懂了:中国足球的离谱,早就超出了人类认知

圣西罗的太阳
2026-04-23 13:24:10
越南人快被“逼疯”了,向全世界发出求救信:它们为啥不去中国?

越南人快被“逼疯”了,向全世界发出求救信:它们为啥不去中国?

厉羽萱
2026-06-15 00:38:38
美股中概股盘前普跌,哔哩哔哩跌5%

美股中概股盘前普跌,哔哩哔哩跌5%

每日经济新闻
2026-06-23 16:10:07
马云被网暴!带核心领导层插秧,一上午才种半亩,被骂第二个雷军

马云被网暴!带核心领导层插秧,一上午才种半亩,被骂第二个雷军

谭谈社会
2026-06-22 23:37:32
东莞娱乐女主播相亲条件太简单:抱我蹲30下,体力行就结婚!

东莞娱乐女主播相亲条件太简单:抱我蹲30下,体力行就结婚!

捣蛋窝
2026-06-18 00:54:03
连锁反应?字母哥交易后,火箭欲组最强3巨头,“711”有望再联手

连锁反应?字母哥交易后,火箭欲组最强3巨头,“711”有望再联手

篮球圈里的那些事
2026-06-23 17:11:41
不再是120/80,“新血压标准”已公布,别再自己吓自己!

不再是120/80,“新血压标准”已公布,别再自己吓自己!

芹姐说生活
2026-04-14 23:27:03
搞笑自行车冷笑话,北大某一同学买了一辆新的自行车为防被盗,每晚用五条铁链将自行车锁在柱子上一天早上!

搞笑自行车冷笑话,北大某一同学买了一辆新的自行车为防被盗,每晚用五条铁链将自行车锁在柱子上一天早上!

天天明星
2026-06-22 13:15:30
反直觉历史:秦始皇陵的地宫毫无盗墓价值

反直觉历史:秦始皇陵的地宫毫无盗墓价值

冷炮历史
2026-06-22 08:00:08
太强了!苹果正式发布五款全新应用

太强了!苹果正式发布五款全新应用

XCiOS俱乐部
2026-06-21 17:34:15
这回中国可能真要栽大跟头,投资的钱估计要全砸进去收不回来!

这回中国可能真要栽大跟头,投资的钱估计要全砸进去收不回来!

云鹏叙事
2026-06-17 19:55:03
1975年,毛主席召开政治局会议,会前提醒陈永贵:不要住在钓鱼台

1975年,毛主席召开政治局会议,会前提醒陈永贵:不要住在钓鱼台

元哥说历史
2026-06-23 17:15:03
宝妈考编第一被作废后续:官方回应戳破谎言,网友一致表示不同情

宝妈考编第一被作废后续:官方回应戳破谎言,网友一致表示不同情

星娱叨叨社
2026-06-22 18:34:58
女司机帮手来了!广德车祸致母子3人2死1伤悲剧,为事故洗白发声

女司机帮手来了!广德车祸致母子3人2死1伤悲剧,为事故洗白发声

追踪之点
2026-06-23 12:10:18
200-400万存款的人或家庭,国内大概有多少?可能会改变你的认知

200-400万存款的人或家庭,国内大概有多少?可能会改变你的认知

猫叔东山再起
2026-06-23 10:30:17
央视宋世雄,晚年选择87岁独居北京,这一决定刺痛无数中国式家庭

央视宋世雄,晚年选择87岁独居北京,这一决定刺痛无数中国式家庭

人生录
2026-06-22 16:37:13
“全班就2个女生表情正常”,廉价毕业照被吐槽,家长咋不管管

“全班就2个女生表情正常”,廉价毕业照被吐槽,家长咋不管管

世界圈
2026-06-22 08:50:58
李金铭签约MCN!被纠缠12年、停更10个月,这次能翻身吗?

李金铭签约MCN!被纠缠12年、停更10个月,这次能翻身吗?

手工制作阿歼
2026-06-23 15:16:16
2026-06-23 20:11:00
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2411文章数 596关注度
往期回顾 全部

科技要闻

48名中国开发者联名举报苹果

头条要闻

河南南阳曾47天查扣24辆冷链货车:拍卖350万上缴国库

头条要闻

河南南阳曾47天查扣24辆冷链货车:拍卖350万上缴国库

体育要闻

扬尼斯去了迈阿密:凯尔特人怎么办?

娱乐要闻

内娱95后顶流格局发生潜移默化的变化

财经要闻

屋顶光伏度苦夏

汽车要闻

华为智驾ADS限时优惠月底结束 7月1日前下订立省3000元

态度原创

游戏
时尚
家居
房产
数码

曾被质疑不配年度游戏的《宇宙机器人》 足够好玩么?

除了玛丽珍、薄底鞋,今年最火的鞋子就是它了

家居要闻

绿意盎然 自然之境

房产要闻

洞察新局|预算不变 居住升级 2026广州置业成本观察

数码要闻

System76推16" Linux移动工作站Serval WS,至高290HX Plus

无障碍浏览 进入关怀版