网易首页 > 网易号 > 正文 申请入驻

ICLR 2023 | 半监督学习最高分论文FreeMatch:自适应阈值法

0
分享至

在大模型被广泛应用的今天,研究半监督学习还有意义吗?

我们的答案是:有的。即使大模型大行其道,在下游任务微调时,仍然不可避免要遇到标签数据稀少的问题,而半监督学习旨在只有少量标注数据的时候利用大量无标注数据提升模型的泛化性。我们的NeurIPS 2022的工作 USB中已验证了预训练模型在半监督场景下的局限性。现在,我们将从算法创新层面再对半监督进行提升。

论文链 接: https://arxiv.org/abs/2205.07246 代码链接: https://github.com/microsoft/Semi-supervised-learning

近年来,基于阈值的伪标签方法的半监督方法取得了巨大的成功。然而,我们认为现有的方法可能无法有效地利用未标记的数据,因为它们要么使用预定义 / 固定阈值,要么使用专门的启发式阈值调整方案。这将导致模型性能低下和收敛速度慢。在本文中,我们首先理论分析一个简单的二分类模型,以获得关于理想阈值和模型学习状态之间关系的直觉。基于分析,我们因此提出FreeMatch来根据模型的学习状态以自适应方式调整置信度阈值。我们进一步引入自适应类公平正则化惩罚,以鼓励模型在早期训练阶段进行多样化预测。广泛的实验表明FreeMatch的优越性,尤其是当标记数据极其稀少时。

文章已被机器学习顶级会议ICLR2023录用,其在录用之前就收到了多方关注、有多人索要代码。文章第一作者为微软亚洲研究院实习生、东京工业大学硕士生王一栋,共同第一作者为卡耐基梅隆大学的陈皓。通讯作者为微软亚洲研究院的王晋东。

一、对半监督学习而言,

什么是好的阈值?

我们从一个简单的二分类问题出发来分析:好的半监督学习的阈值是怎么样的。

假设真实的数据分布来自两个高斯分布的混合:

再考虑输出概率如下的分类器:

如果我们采用一个固定的阈值 ,那么不难证明伪标签 有如下的概率分布;

详细证明过程可以参考论文。

观察上面的公式,我们可以获得一些明显的推论:

· 首先,不难看出未标注数据的采样率是直接由 决定的: 越大,伪标签的数量越少。更有趣的是,当 时, 。这可 能导致伪标签分布不均匀从而损害模型表现。

· 同时,伪标签采用率 随着 μ μ 变小而下降。换言之,两个类越接近,模型的置信度越低,因此 τ 也应相应降低以保证伪标签的分布均匀。

这些推论为我们设计一个自适应阈值提供了如下的启发:

· 在训练的早期, τ 应该相对较小,以促使伪标签多元化,提升未标注数据的利用率,提升模型收敛速度。

· 随着训练的进行( β 变大),较低的阈值会导致确认误差。在理想的情况下, τ 应该随着 β 变大以维持一个稳定的伪标签采用比例。

· 同时由于类内多样性( σ σ )以及类邻接 ( μ μ 相对较小),某些类的分类难度要大于其余类,我们应该对每个类设置一个局部阈值。

二、FreeMatch:

自适应阈值方法

我们提出的FreeMatch包含两部分:自适应阈值自适应公平正则化惩罚。下面分别进行介绍。

自适应阈值 (SAT)

如下图所示,自适应阈值具体可以分为自适应全局阈值、自适应局部阈值。局部阈值旨在以类特定的方式调整全局阈值,以考虑类内多样性和可能的类邻接。

自适应全局阈值

我们根据以下两个原则设计全局阈值。首先,全局阈值应该与模型对未标记数据的置信度相关,反映整体学习状态。此外,全局阈值应在训练期间稳定增加,以确保在训练后期丢弃噪声伪标签。我们将全局阈值 设置为模型对未标记数据的平均置信度,其中 表示第 个时间步(迭代)。

然而,由于未标注数据数量庞大,在每个时间步甚至每个训练时期计算所有未标记数据的置信度将非常耗时。因此,我们将全局置信度估计为每个训练时间步长置信度的指数移动平均值 (EMA)。具体来说,我们将 初始化为 ,其中 表示类数。

具体而言, 全局阈值 定义和调整为:

其中 是 EMA 的动量衰减。

自适应局部阈值

我们 计算模型对每个 类别 的预测 的期望,以估计特定于类别的学习状态:

其中 是包含所有 的列表。

最终的阈值自适应调整

其中 MaxNorm MaxNorm 是最大归一化(即 )。

最后,第 次迭代的无监督训练目标 是:

自适应公平正则化惩罚 (SAF)

我们没有使用之前常被使用的类平均先验来惩罚模型(因为真实场景往往不满足类平衡条件),而是使用来自模型预测的滑动平均EMA 作为期望的估计未标记数据的预测分布。

我们优化 和 的交叉熵批处理作为 的估计。

考虑到潜在的伪标签分布可能不均匀,我们建议以自适应的方式调节公平性目标,即通过伪标签的直方图分布对概率的期望进行归一化,以抵消不平衡的负面影响:

与 相似, 我们这样计算 :

第 步的自适应公平正则化惩罚(SAF) 表示如下:

最终模型的训练目标由对标注数据的交叉熵,无监督训练目标 和自适应公平正则化惩罚 组成。

具体细节可以参考文章内容。

三、实验

我们进行了详尽的实验,包括在 经典benchmark 与之前的算法进行对比(Table 1)和 ImageNet 结果对比(Table2)。为了证明 FreeMatch 不需要预定义阀值,我们在表十中提供了 FixMatch 和 FlexMatch 不同阀值的实验。

经典Benchmark结果

ImageNet结果

不同阈值实验

从表一,表二和表十可以看出,FreeMatch有助于减少超参数调整计算或整体训练时间(在别的算法使用最佳选择的阈值情况下,FreeMatch无需预定义阈值即可获得更优异的性能)并且FreeMatch的性能优于任何固定阈值的方法。

详细分析

为了更好的理解FreeMatch,我们在图3中分析了FreeMatch在STL-10 40标签的实验中阈值,无标签数据的利用率,和准确率随训练的变化。可以看出,FreeMatch在训练初始阶段自适应的采取了较低的阈值,所以更多的无标签数据参与到学习中。随着模型从无标签数据中学习,阈值快速上升(与dash手动定义相比),使得不准确的无标签数据被筛出,从而达到更准确的利用无标签数据的目的。

我们还在论文中提供了详细的消融实验,感兴趣的读者可以自行查看。

四、总结

我们提出了FreeMatch方法,该方法提出了自适应阈值和自适应公平性正则化。FreeMatch在各种SSL基准测试中优于其他SOTA算法,尤其是在标注数据极其稀少的情况下。我们认为置信度阈值在SSL中具有很大的潜力。我们希望我们的方法能够激发更多关于最优阈值的研究。

作者:王晋东 文章来源:公众号【王晋东不在家】

Illustration by Delesign Graphics from I conScout

-TheEnd-

本周上新!

扫码观看!

多家技术企业招聘来啦!

多家技术企业招聘来啦!有求必应的小将收集到来自TechBeat技术社群内技术企业的招人需求,包含来自科技大厂微软亚研、腾讯、小红书等企业,科技明星公司始途科技、梅卡曼德等企业的算法工程师等正式及实习岗位,欢迎有需求的大家向这些公司投递简历哦!

扫描了解详情~

关于我“

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务将门技术社群以及将门创投基金

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网店称频遭“薅羊毛”:同一消费者半年7次下单小米,吃掉大半后申请退全款,平台回应

网店称频遭“薅羊毛”:同一消费者半年7次下单小米,吃掉大半后申请退全款,平台回应

潇湘晨报
2026-06-29 19:55:25
德国青年中心爆发惨烈枪击案,已致6人死亡,两名嫌疑人落网

德国青年中心爆发惨烈枪击案,已致6人死亡,两名嫌疑人落网

意大利华人网0039
2026-06-30 02:49:33
WTT美国大满贯:6月30日赛程公布!国乒8场对决,孙颖莎连续登场

WTT美国大满贯:6月30日赛程公布!国乒8场对决,孙颖莎连续登场

全言作品
2026-06-29 13:10:57
没有证据?那就发明证据!从中国第一“女福尔摩斯”到冤案制造者

没有证据?那就发明证据!从中国第一“女福尔摩斯”到冤案制造者

许三岁
2026-06-24 11:06:59
入选国少!前足球小将核心父亲示好 董路回应:永远不会原谅你 原因曝光

入选国少!前足球小将核心父亲示好 董路回应:永远不会原谅你 原因曝光

林子说事
2026-06-29 17:50:12
少林寺新方丈释印乐,上任才10个月,少林寺被曝一下少了800多万

少林寺新方丈释印乐,上任才10个月,少林寺被曝一下少了800多万

许三岁
2026-06-14 09:57:24
“小孩”曾卓君又拿冠军!EVO官方吹爆:第七冠到手

“小孩”曾卓君又拿冠军!EVO官方吹爆:第七冠到手

游民星空
2026-06-29 12:33:21
用赃款买通国际刑事法院调查杜特尔特?菲政坛曝惊天黑幕,引诉讼

用赃款买通国际刑事法院调查杜特尔特?菲政坛曝惊天黑幕,引诉讼

人类的关注
2026-06-28 22:56:56
医生:希望你的血脂报告里,永远不要出现这3项异常

医生:希望你的血脂报告里,永远不要出现这3项异常

华庭讲美食
2026-06-23 16:28:06
14岁女孩被40余名男子施暴8年,母亲明码标价:“想玩给钱就行”

14岁女孩被40余名男子施暴8年,母亲明码标价:“想玩给钱就行”

历来都很现实
2026-06-17 02:02:33
谢霆锋王菲甜蜜牵手离开西安,56岁王菲穿粉紫色上衣好有少女感!

谢霆锋王菲甜蜜牵手离开西安,56岁王菲穿粉紫色上衣好有少女感!

娱乐团长
2026-06-29 17:45:37
世界杯卫冕冠军阿根廷三连胜 淘汰赛将战佛得角

世界杯卫冕冠军阿根廷三连胜 淘汰赛将战佛得角

新京报
2026-06-28 12:10:14
梅西19球刷新世界杯历史射手榜,连续7场进球,举世无双

梅西19球刷新世界杯历史射手榜,连续7场进球,举世无双

姜大叔侃球
2026-06-28 12:08:37
补时绝杀!送日本回家 卡塞米罗扳平马丁内利制胜 巴西2-1逆转晋

补时绝杀!送日本回家 卡塞米罗扳平马丁内利制胜 巴西2-1逆转晋

越岭寻踪
2026-06-30 03:11:12
医生提醒:一旦吃上氨糖,5物就不要吃了,别害了自己

医生提醒:一旦吃上氨糖,5物就不要吃了,别害了自己

荆医生科普
2026-06-26 17:05:15
40年前今日,美国DRAM反击日本

40年前今日,美国DRAM反击日本

半导体行业观察
2026-04-20 09:32:48
瞒不住了!台海都是假象,美国真正的恶仗,已经打到中国家门口

瞒不住了!台海都是假象,美国真正的恶仗,已经打到中国家门口

铭记历史呀
2026-06-30 00:29:14
为什么农村的大龄剩女很少?

为什么农村的大龄剩女很少?

加油丁小文
2026-06-07 08:00:09
永暑岛长大了,1年建造280万平方米,南沙中心地位不可撼动

永暑岛长大了,1年建造280万平方米,南沙中心地位不可撼动

抽象派大师
2026-06-30 02:25:27
为什么穿越者顶替原主却不会被原身父母揭穿?看完评论醍醐灌顶!

为什么穿越者顶替原主却不会被原身父母揭穿?看完评论醍醐灌顶!

夜深爱杂谈
2026-06-29 21:26:22
2026-06-30 04:20:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2415文章数 596关注度
往期回顾 全部

科技要闻

杀疯了!深圳一天出两家200亿具身智能公司

头条要闻

巴西2-1逆转日本 卡塞米罗头槌马丁内利96分钟绝杀

头条要闻

巴西2-1逆转日本 卡塞米罗头槌马丁内利96分钟绝杀

体育要闻

他和伊朗队,再次赢得全世界的尊重

娱乐要闻

跟风电影《给阿公的牛肉丸》开机

财经要闻

万达广场批量易主 多位投资人正式入局

汽车要闻

全新宝马iX3长轴版将于成都车展预售 四季度交付

态度原创

家居
游戏
艺术
本地
手机

家居要闻

传奇筑 日常诗

魔坛节奏丨Life带病擒Happy,Sky队后来居上晋级全能王决赛

艺术要闻

16幅 冉茂芹小幅风景油画写生

本地新闻

贵州小城的新目标:举办“村超”世界杯!

手机要闻

华为nova17 Air曝光:7000mAh电池+16:10阔直屏,要搅局中端市场

无障碍浏览 进入关怀版