网易首页 > 网易号 > 正文 申请入驻

联邦学习 | Non-IID数据 论文:测量联邦视觉分类中不相同数据分布的影响

0
分享至

该论文是麻省理工学院MIT的人工智能实验室CSAIL和谷歌研究院的成果,在图像分类任务中,对FL的非独立同分布数据的影响做了比较细致的实验。

主要内容:

1、基于迪利克雷分布,提出了一种FL中Non-IID数据的生成方法;

2、对不同程度的Non-IID数据下,进行了较多的对比试验,研究客户端数据量、本地迭代轮数、学习率等参数对性能的影响;

3、提出了一种基于动量的解决方案,可以有效缓解Non-IID带来的性能下降。

论文地址:https://arxiv.org/pdf/1909.06335.pdf

01

Introduction 介绍

介绍了一下FL和Non-IID数据的背景知识,不清楚的小伙伴可以看之前的文章。

02

Related Work 相关工作

在FL中图像分类数据集的相关生成工作,一部分是在MNIST、CIFAR-10等数据集上进行划分,存在分布极端、划分数据池不够大等问题,不符合实际情况;另一部分工作就是使用 的Dirichlet分布来合成Non-IID数据集。作者主要是使用连续的 生成一系列分布,来研究超参数的设置和优化方案。

下图中2018那篇论文之前的文章分享给过,有兴趣的小伙伴可以看看:

03

Synthetic Non-Identical Client Data 生成客户端Non-IID数据

这部分介绍了一种基于迪利克雷分布的Non-IID数据的生成方法,把10个类别当作一个categorical distribution类别分布p,然后利用参数为 的迪利克雷分布生成每个客户端的分布q, 越大,客户端的分布与基分布约i相似,当趋于无穷大的时候,变为同分布; 越小,非独立同分布程度越高,当等于0时,每个客户端只有一个类别的数据。

数据集:CIFAR-10,10类,训练集50000,测试集10000,分成100份,每份500张图片

04

Experiments and Results

Classification Performance with Non-Identical Distributions

C:参与客户端的数据/总客户端的数据100

E:客户端本地训练轮数

C、E、 、学习率 几个超参数共同影响了FL模型最终的性能,最后一个实验探索了在不同 下学习率的敏感性,发现如果 大,学习率可能在两个数量级的范围内调节都可以获得不错的结果,而 小,就得小心调参了。

Accumulating Model Updates with Momentum

针对这个问题论文提出了一种缓解办法: 加动量,简单有效,公式如下:

fedavg算法得到的总梯度

梯度更新

验证结果如下:

可以说是在 小的区域表现非常nice了,直接提升40%多。

论文又定义了一个相对学习率,探索了不同C和E下相对学习率的敏感性,在C比较小的时候,相对学习率比较敏感,应该设置较大的动量和低学习率。其中E太大,会导致方差高,应该结合较低学习率。

来源:知乎

作者:超脱

深延科技|

深延科技成立于2018年1月,中关村高新技术企业,是拥有全球领先人工智能技术的企业AI服务专家。以计算机视觉、自然语言处理和数据挖掘核心技术为基础,公司推出四款平台产品——深延智能数据标注平台、深延AI开发平台、深延自动化机器学习平台、深延AI开放平台,为企业提供数据处理、模型构建和训练、隐私计算、行业算法和解决方案等一站式AI平台服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
塞尔维亚第一夫人换发型!一头卷发半扎马尾显温婉,蜻蜓头饰好美

塞尔维亚第一夫人换发型!一头卷发半扎马尾显温婉,蜻蜓头饰好美

八八尚语
2026-05-26 10:52:56
伊朗总统佩泽希齐扬:我们不寻求核武器,也不寻求地区动荡

伊朗总统佩泽希齐扬:我们不寻求核武器,也不寻求地区动荡

澎湃新闻
2026-05-25 10:39:22
全球4个最顶尖大脑作出共同判断,留给人类的时间只有5年了

全球4个最顶尖大脑作出共同判断,留给人类的时间只有5年了

史政先锋
2026-05-23 15:03:56
原来她是黎家盈的姐姐,祖籍广东移居香港,主动替妹妹扛起上一代

原来她是黎家盈的姐姐,祖籍广东移居香港,主动替妹妹扛起上一代

阿凫爱吐槽
2026-05-25 10:54:40
化痰第一名!吃三天扫光肺里脏东西,比梨汤管用多了!

化痰第一名!吃三天扫光肺里脏东西,比梨汤管用多了!

宝哥精彩赛事
2026-05-03 21:36:21
12轮不败的蓉城,赛前干了一件“蠢事”:请主力吃饭,让替补看着

12轮不败的蓉城,赛前干了一件“蠢事”:请主力吃饭,让替补看着

酷侃体坛
2026-05-25 16:41:23
台湾网红馆长陈之汉开启川渝之行,无滤镜直播展现大陆真实面貌

台湾网红馆长陈之汉开启川渝之行,无滤镜直播展现大陆真实面貌

天空空啊
2026-05-25 19:23:30
5年2.69亿美金!0分+1分+13分!NBA退步最快球星诞生

5年2.69亿美金!0分+1分+13分!NBA退步最快球星诞生

世界体育圈
2026-05-25 21:04:11
买比亚迪车别急!2026年6月最值得期待6款新车,最低或7万起掀桌

买比亚迪车别急!2026年6月最值得期待6款新车,最低或7万起掀桌

趣味萌宠的日常
2026-05-25 14:57:50
李晨郑恺停更后续,节目中更多被欺凌片段爆出,沙溢评论区已沦陷

李晨郑恺停更后续,节目中更多被欺凌片段爆出,沙溢评论区已沦陷

乐天闲聊
2026-05-25 13:59:46
“这让我很难过!”鲁尼怒斥曼城列队致敬,瓜迪奥拉感动落泪

“这让我很难过!”鲁尼怒斥曼城列队致敬,瓜迪奥拉感动落泪

绿茵情报局
2026-05-25 16:53:07
奇才试训历史第二弹跳球员,他是两个次轮签的潜在竞争者?

奇才试训历史第二弹跳球员,他是两个次轮签的潜在竞争者?

稻谷与小麦
2026-05-26 12:00:52
赖昌星的情人蔡玲玲:悔不该委身于他,58岁的她现状如何?

赖昌星的情人蔡玲玲:悔不该委身于他,58岁的她现状如何?

细品名人
2026-04-29 07:06:35
全网都被日本骗了!

全网都被日本骗了!

安安说
2026-05-26 11:13:10
成都通报维也纳酒店、全季酒店被曝卫生问题:约谈涉事酒店负责人,责令整改

成都通报维也纳酒店、全季酒店被曝卫生问题:约谈涉事酒店负责人,责令整改

界面新闻
2026-05-25 22:33:45
长安汽车内幕交易案曝光:与华为合作前夜,员工6100万突击抢筹

长安汽车内幕交易案曝光:与华为合作前夜,员工6100万突击抢筹

21世纪经济报道
2026-05-26 01:02:15
82人遇难!市长还能升书记吗?

82人遇难!市长还能升书记吗?

仕道
2026-05-25 10:44:54
全英吃瓜!35岁蛇蝎宝妈跨国勾结迪拜大毒枭,实时定位泼硫酸把毒贩渣夫嘎了?

全英吃瓜!35岁蛇蝎宝妈跨国勾结迪拜大毒枭,实时定位泼硫酸把毒贩渣夫嘎了?

英国报姐
2026-05-19 21:42:03
倒下的从来不是委内瑞拉,而只是马杜罗一个人

倒下的从来不是委内瑞拉,而只是马杜罗一个人

律法刑道
2026-04-10 21:04:03
换衣服都来不及!波波赛后追进更衣室,20岁新秀的眼泪藏不住了

换衣服都来不及!波波赛后追进更衣室,20岁新秀的眼泪藏不住了

窥史
2026-05-26 10:53:28
2026-05-26 12:12:49
深兰深延AI
深兰深延AI
让AI赋能更简单!
71文章数 0关注度
往期回顾 全部

科技要闻

今年秋季,麒麟芯片将首次落地"逻辑折叠"

头条要闻

牛弹琴:"两个铁杆"来北京 一个当场落泪一个带来喜讯

头条要闻

牛弹琴:"两个铁杆"来北京 一个当场落泪一个带来喜讯

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

景甜被曝停工失联 富商索要2亿和解费

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

启境GT7定档5月29日预售 提供三电机版本

态度原创

家居
健康
本地
公开课
军事航空

家居要闻

生与命相依 旧公寓改造

几百块一瓶的外泌体精华,涂脸上是“智商税”吗?

本地新闻

用云锦的方式,打开江苏南京

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄军出动“榛树”导弹袭击乌克兰

无障碍浏览 进入关怀版