网易首页 > 网易号 > 正文 申请入驻

联邦学习 | Non-IID数据 论文:测量联邦视觉分类中不相同数据分布的影响

0
分享至

该论文是麻省理工学院MIT的人工智能实验室CSAIL和谷歌研究院的成果,在图像分类任务中,对FL的非独立同分布数据的影响做了比较细致的实验。

主要内容:

1、基于迪利克雷分布,提出了一种FL中Non-IID数据的生成方法;

2、对不同程度的Non-IID数据下,进行了较多的对比试验,研究客户端数据量、本地迭代轮数、学习率等参数对性能的影响;

3、提出了一种基于动量的解决方案,可以有效缓解Non-IID带来的性能下降。

论文地址:https://arxiv.org/pdf/1909.06335.pdf

01

Introduction 介绍

介绍了一下FL和Non-IID数据的背景知识,不清楚的小伙伴可以看之前的文章。

02

Related Work 相关工作

在FL中图像分类数据集的相关生成工作,一部分是在MNIST、CIFAR-10等数据集上进行划分,存在分布极端、划分数据池不够大等问题,不符合实际情况;另一部分工作就是使用 的Dirichlet分布来合成Non-IID数据集。作者主要是使用连续的 生成一系列分布,来研究超参数的设置和优化方案。

下图中2018那篇论文之前的文章分享给过,有兴趣的小伙伴可以看看:

03

Synthetic Non-Identical Client Data 生成客户端Non-IID数据

这部分介绍了一种基于迪利克雷分布的Non-IID数据的生成方法,把10个类别当作一个categorical distribution类别分布p,然后利用参数为 的迪利克雷分布生成每个客户端的分布q, 越大,客户端的分布与基分布约i相似,当趋于无穷大的时候,变为同分布; 越小,非独立同分布程度越高,当等于0时,每个客户端只有一个类别的数据。

数据集:CIFAR-10,10类,训练集50000,测试集10000,分成100份,每份500张图片

04

Experiments and Results

Classification Performance with Non-Identical Distributions

C:参与客户端的数据/总客户端的数据100

E:客户端本地训练轮数

C、E、 、学习率 几个超参数共同影响了FL模型最终的性能,最后一个实验探索了在不同 下学习率的敏感性,发现如果 大,学习率可能在两个数量级的范围内调节都可以获得不错的结果,而 小,就得小心调参了。

Accumulating Model Updates with Momentum

针对这个问题论文提出了一种缓解办法: 加动量,简单有效,公式如下:

fedavg算法得到的总梯度

梯度更新

验证结果如下:

可以说是在 小的区域表现非常nice了,直接提升40%多。

论文又定义了一个相对学习率,探索了不同C和E下相对学习率的敏感性,在C比较小的时候,相对学习率比较敏感,应该设置较大的动量和低学习率。其中E太大,会导致方差高,应该结合较低学习率。

来源:知乎

作者:超脱

深延科技|

深延科技成立于2018年1月,中关村高新技术企业,是拥有全球领先人工智能技术的企业AI服务专家。以计算机视觉、自然语言处理和数据挖掘核心技术为基础,公司推出四款平台产品——深延智能数据标注平台、深延AI开发平台、深延自动化机器学习平台、深延AI开放平台,为企业提供数据处理、模型构建和训练、隐私计算、行业算法和解决方案等一站式AI平台服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
苹果iOS 26.3 更新,新界面长这样!

苹果iOS 26.3 更新,新界面长这样!

科技堡垒
2026-02-14 10:34:35
高市早苗病情恶化,有生命危险吗?

高市早苗病情恶化,有生命危险吗?

雪中风车
2026-02-14 16:17:05
莫文蔚的腿真不是开玩笑的,连超模奚梦瑶坐在她旁边都被比下去了

莫文蔚的腿真不是开玩笑的,连超模奚梦瑶坐在她旁边都被比下去了

情感大头说说
2026-02-15 23:22:12
美财长紧急飞往北京!真实目的竟是为这事低头求情

美财长紧急飞往北京!真实目的竟是为这事低头求情

吃货的分享
2026-02-15 15:58:59
1月份房屋销量创下近四年以来最大单月跌幅

1月份房屋销量创下近四年以来最大单月跌幅

新浪财经
2026-02-13 15:10:35
朱之文女儿大婚仅1天,男方被扒底朝天,500万陪嫁传闻是冰山一角

朱之文女儿大婚仅1天,男方被扒底朝天,500万陪嫁传闻是冰山一角

可乐谈情感
2026-02-14 18:11:36
哈登爽了!你好,DPOY!骑士四巨头即将合体

哈登爽了!你好,DPOY!骑士四巨头即将合体

篮球实战宝典
2026-02-15 17:39:57
央视春晚首次将手机接入广播级系统,华为Mate 80系列为指定设备

央视春晚首次将手机接入广播级系统,华为Mate 80系列为指定设备

PChome电脑之家
2026-02-13 14:36:58
整容成瘾、抛妻娶粉?“消失”的宋小宝,终究为曾经的荒唐买了单

整容成瘾、抛妻娶粉?“消失”的宋小宝,终究为曾经的荒唐买了单

启迪你的思维
2026-02-02 20:56:29
刘少昂被犯规判进决赛!孙龙稳第二!中国2人晋级1500米决赛!

刘少昂被犯规判进决赛!孙龙稳第二!中国2人晋级1500米决赛!

篮球资讯达人
2026-02-15 05:06:26
创造历史 中国队晋级速度滑冰男子团体追逐半决赛

创造历史 中国队晋级速度滑冰男子团体追逐半决赛

体坛周报
2026-02-16 00:52:24
出轨、净身出户?这次,74岁的梁锦松,终究在伏明霞身上栽了跟头

出轨、净身出户?这次,74岁的梁锦松,终究在伏明霞身上栽了跟头

秋姐居
2026-02-10 09:19:42
11家公司2月15日夜晚发布重大利好,其中2家回购 3家并购重组等

11家公司2月15日夜晚发布重大利好,其中2家回购 3家并购重组等

股市皆大事
2026-02-15 20:17:46
美国每天20万人卖血创收!当地媒体坐实斩杀线,中产也无法逃脱

美国每天20万人卖血创收!当地媒体坐实斩杀线,中产也无法逃脱

火山詩话
2026-02-14 15:40:52
老杜在《人民日报》上撒谎

老杜在《人民日报》上撒谎

蜻蜓世音
2026-02-14 10:31:50
从46败到40胜,冲上联盟第1!NBA最大黑马,成哈登争冠路上绊脚石

从46败到40胜,冲上联盟第1!NBA最大黑马,成哈登争冠路上绊脚石

老侃侃球
2026-02-16 03:30:04
菲律宾总统:欢迎中国决定!

菲律宾总统:欢迎中国决定!

占豪
2026-02-16 01:31:57
内塔尼亚胡:解除哈马斯的武装必须包括6万支步枪

内塔尼亚胡:解除哈马斯的武装必须包括6万支步枪

桂系007
2026-02-16 03:30:20
为何历史上华侨在东南亚屡遭屠杀?原来是他亲手递上了屠刀!

为何历史上华侨在东南亚屡遭屠杀?原来是他亲手递上了屠刀!

智慧天气通
2026-02-16 02:29:53
如果最近突然爱上吃这2样东西,说明你的身体确实老了

如果最近突然爱上吃这2样东西,说明你的身体确实老了

扬子晚报
2026-02-14 14:32:29
2026-02-16 04:27:00
深兰深延AI
深兰深延AI
让AI赋能更简单!
71文章数 0关注度
往期回顾 全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

大学生寒假为妈妈店铺当中老年服装模特 撞脸明星

头条要闻

大学生寒假为妈妈店铺当中老年服装模特 撞脸明星

体育要闻

NBA三分大赛:利拉德带伤第三次夺冠

娱乐要闻

2026央视春晚最新剧透 重量级嘉宾登场

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

亲子
数码
旅游
公开课
军事航空

亲子要闻

从小“吃零食”和“不吃零食”的孩子,离了父母的严管,差距拉大

数码要闻

盲测显示:音频发烧友无法分辨铜线、香蕉与湿泥传输的音频信号

旅游要闻

开放机关事业单位床位给游客,“宠客”还要善始善终

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:在俄乌冲突问题上 泽连斯基必须行动起来

无障碍浏览 进入关怀版