网易首页 > 网易号 > 正文 申请入驻

Masked Autoencoders Are Scalable Vision Learners 论文导读

0
分享至

Facebook 人工智能研究 (FAIR) 团队发表的论文 Masked Autoencoders Are Scalable Vision Learners 已成为计算机视觉社区的热门话题。这也是KaiMing大神在2年后的第一篇一作论文。

采用带有掩码的语言建模系统,如谷歌的 BERT 及其自回归对应物,如 OpenAI 的 GPT,已经在自然语言处理 (NLP) 任务中取得了惊人的性能,并能够训练包含超过 1000 亿个参数的泛化 NLP 模型。

但是在计算机视觉中自编码方法的进展和性能远远落后于它们在 NLP 能力。 一个问题自然会出现:掩码自动编码在视觉和语言领域有何不同? FAIR 论文解决了这个问题,并证明了 Masked Autoencoders (MAE) 可以是用于计算机视觉的可扩展自监督学习器。

研究人员首先讨论了视觉和语言领域中带有掩码的自编码器的差异,总结为以下三点:1) 到现在为止两者架构还是不同的; 2)语言和图像的信息密度不同; 3)自动编码器的解码器将潜在表示映射回输入,在重建文本或图像时扮演不同的角色。

然后,该论文提出了一种简单、有效且可扩展的 用于视觉表示学习的MAE方法。所提出的 MAE 方法背后的想法很简单——将来自输入图像的随机块被屏蔽,然后在像素空间中重建丢失的块。该团队将其 MAE 的双核心设计和方法总结为:

我们开发了一个非对称编码器-解码器架构,其中一个编码器只对可见的patches子集进行操作(没有掩码标记),以及一个轻量级解码器,可以从潜在表示和掩码标记重建原始图像。

我们发现屏蔽大部分输入图像,例如 75%,会产生重要且有意义的自监督任务。将这两种设计结合起来使我们能够高效地训练大型模型,将训练速度提高 3 倍或更多,并提高准确性。

论文在 ImageNet-1K (IN1K) 训练集上进行了自监督的预训练,然后进行了监督训练,以通过端到端的微调或线性探测来评估表示。他们使用 ViT-Large (ViT-L/16) 作为他们的模型并验证Top1准确性。

结果表明,MAE 学习了非常高容量的模型,这些模型也能很好地泛化。 使用普通的 ViT-Huge 模型,MAE 在 ImageNet-1K 上进行微调时达到了 87.8% 的准确率。

论文认为,扩展性好的简单算法是深度学习的核心。在NLP中,简单的自监督学习方法可以指数级别的增益模型。在计算机视觉中,尽管在自监督学习方面取得了进展,但实际的预训练模式仍主要受到监督。在ImageNet和迁移学习中观察到,自动编码器(autoencoder)提供了非常强的优势。视觉中的自监督学习现在可能正走上与NLP类似的轨道。

论文地址:arxiv/abs/2111.06377

本文来自 syncedreview,作者:Hecate He

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
贾乃亮迎来42岁生日,女儿甜馨亲自做蛋糕,父女长相如同复制粘贴

贾乃亮迎来42岁生日,女儿甜馨亲自做蛋糕,父女长相如同复制粘贴

知法而形
2026-04-12 22:46:39
52岁男子一年后血管斑块消失!养成6个习惯,斑块或可慢慢消失

52岁男子一年后血管斑块消失!养成6个习惯,斑块或可慢慢消失

岐黄传人孙大夫
2026-03-28 20:35:03
刘嘉玲对张兰家事心里门清,劝好友爱自己,只字不提马筱梅

刘嘉玲对张兰家事心里门清,劝好友爱自己,只字不提马筱梅

乡野小珥
2026-04-13 03:25:52
张敬轩公开道歉:以前年少无知,今后不会再犯同类错误!

张敬轩公开道歉:以前年少无知,今后不会再犯同类错误!

荷叶连田田
2026-04-12 19:40:18
21小时、四轮谈判之后,美伊宣布没谈成,真正的失败者是谁?

21小时、四轮谈判之后,美伊宣布没谈成,真正的失败者是谁?

山河路口
2026-04-12 12:43:44
1艘护卫舰,造价36亿,11家船企竞争

1艘护卫舰,造价36亿,11家船企竞争

龙de船人
2026-04-12 15:12:50
两岸热议!郑丽文书法题词罕曝,造诣不输洪秀柱,网友:女侠风骨

两岸热议!郑丽文书法题词罕曝,造诣不输洪秀柱,网友:女侠风骨

御前带刀大人
2026-04-13 03:41:26
闭门会谈一小时,郑丽文发出邀请,大陆说出一句话,定调两岸统一

闭门会谈一小时,郑丽文发出邀请,大陆说出一句话,定调两岸统一

观星赏月
2026-04-13 03:41:46
演员朱珠疑似塌房?照片流出,惊呆网友!

演员朱珠疑似塌房?照片流出,惊呆网友!

大眼妹妹
2025-12-15 10:39:19
1-2!蓉城获利,国安又输给裁判!京媒晒证据:不服,等裁判评议

1-2!蓉城获利,国安又输给裁判!京媒晒证据:不服,等裁判评议

建哥说体育
2026-04-12 23:15:23
光通信核心赛道CPO!龙头十五强,谁值得长期关注?

光通信核心赛道CPO!龙头十五强,谁值得长期关注?

普陀动物世界
2026-04-12 09:18:48
非夫妻开房,民警提醒:只要不干这个,谁管你是不是夫妻

非夫妻开房,民警提醒:只要不干这个,谁管你是不是夫妻

君说舆情
2026-04-07 08:35:16
为了郑丽文专机能顺利落地,解放军果断亮出底牌,痛击台独要害

为了郑丽文专机能顺利落地,解放军果断亮出底牌,痛击台独要害

流史岁月
2026-04-09 16:30:07
美国上空划过7 吨重物,疑似导弹袭击本土,解体时发出巨响

美国上空划过7 吨重物,疑似导弹袭击本土,解体时发出巨响

知识TNT
2026-04-11 10:05:06
农村酒席新规落地!三类酒不准办,一桌超标都罚款,多地已开罚单

农村酒席新规落地!三类酒不准办,一桌超标都罚款,多地已开罚单

复转这些年
2026-04-11 21:08:57
伊朗、美国与巴基斯坦新一轮三方谈判已启动

伊朗、美国与巴基斯坦新一轮三方谈判已启动

财联社
2026-04-12 04:16:06
丰田凯美瑞不装了!现起售价13.88万,网友:终于等到了

丰田凯美瑞不装了!现起售价13.88万,网友:终于等到了

汽车网评
2026-04-11 21:31:43
一次偶然的邂逅,让我知道了原来还可以这样穿衣服

一次偶然的邂逅,让我知道了原来还可以这样穿衣服

牛弹琴123456
2026-04-09 15:55:53
全红婵后续:网友喊话接着抓,有人开始慌乱,利益链条被曝光!

全红婵后续:网友喊话接着抓,有人开始慌乱,利益链条被曝光!

眼光很亮
2026-04-11 18:25:25
温瑞博4-2夺冠,太原常规赛4赢家3输家,向鹏在列

温瑞博4-2夺冠,太原常规赛4赢家3输家,向鹏在列

小哆说体育
2026-04-13 00:24:22
2026-04-13 05:03:00
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
1974文章数 1461关注度
往期回顾 全部

科技要闻

理想称遭恶意拉踩,东风日产:尊重同行

头条要闻

伊媒:美驱逐舰遭革命卫队锁定 距离被摧毁仅差几分钟

头条要闻

伊媒:美驱逐舰遭革命卫队锁定 距离被摧毁仅差几分钟

体育要闻

创造历史!五大联赛首位女性主教练诞生

娱乐要闻

赌王女儿何超蕸病逝,常年和乳癌斗争

财经要闻

美伊谈判破裂的三大症结

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

手机
教育
游戏
亲子
健康

手机要闻

华为阔折叠设计图曝光!这外观你喜欢吗?

教育要闻

小班教学,9月开校,树德派校长!这所中学,正在招老师

太宠玩家:《红沙》BUG被转正成技能!玩家舒服了

亲子要闻

“晚上疼得睡不着”!8岁女童双眼、身上被灼伤!警惕这东西,不少人家里有

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版