网易首页 > 网易号 > 正文 申请入驻

TPAMI 2022 | 程明明团队提出LUSS:大规模无监督语义分割

0
分享至

语义分割是计算机视觉领域中被广泛关注的一个研究方向,其旨在针对图像中每一个像素进行分类。由于语义分割的固有挑战,目前大多数工作都关注于多样性受限(例如几十类)且数据规模受限场景的语义分割。尽管许多方法在这些受限的场景中取得了显著的效果,但是面对现实世界中常用的几百上千类物体规模带来的新挑战时,现有方法难以解决。这促使我们思考一个更具有挑战性的问题:语义分割是否可能用于多样性更强且规模更大的现实世界场景呢?

论文链接: https://arxiv.org/abs/2106.03149 代码链接: https://github.com/LUSSeg

由于巨大的数据规模和隐私问题,为现实世界场景的海量图像进行像素级标注是十分昂贵的。缺乏足够的标注数据限制了大规模语义分割任务的发展。另一方面,用数百万张甚至数十亿张图片(例如ImageNet, JFT-300M, 和Instagram-1B)进行无监督/自监督训练得到的分类模型已经展现出与有监督学习相当的分类能力。这促使我们考虑是否可以通过无监督学习的方式实现真实世界场景语义分割的目标。为此我们提出了一个新的问题:大规模无监督语义分割(Large-scale Unsupervised Semantic Segmentation,LUSS)。如图1所示,LUSS 任务的目标是在没有人工标注监督的情况下,通过模型自我学习从大规模图像数据中总结出多样化的语义类别,并将成百上千个类别分配给数百万以上的图像中的每个像素。

图表 1 LUSS任务的目标是模型在没有人类标注的情况下,通过自我学习将数百上千个类别中的标签分配给数百万以上的图像中的像素。
一、挑战

实现LUSS这一目标面临许多挑战,例如需要同时解决大规模数据下的形状相关的表征学习,类别相关的表征学习以及无监督的语义聚类。具体而言,模型需要提取类别相关的表征来区分大量类别,并利用物体形状、纹理和边界等像素级表征实现对物体的分割。两种表征在不冲突的情况下相互配合对实现 LUSS 至关重要。基于相关表征,模型需要利用鲁棒且高效的聚类算法从大规模数据中生成语义类别。同时,对像素进行分割需要准确地区分语义相关和无关的区域。

二、前景

实现LUSS任务使在现实世界场景下实现语义分割成为可能。同时,解决LUSS的挑战也能进一步提升许多相关任务的性能。例如,在LUSS任务中学习到的形状、类别相关的表征使LUSS模型可以被用作语义分割和实例分割等像素级下游任务的预训练模型。此外,利用小部分人工标注数据微调LUSS模型的半监督学习策略能够使LUSS 模型快速得到实际应用。


三、LUSS Benchmark和ImageNet-S数据集

为了方便评测对比,我们提出了一个LUSS benchmark,包括一个具有高度多样性的大规模数据集ImageNet-S和侧重不同角度的多种评价指标。

ImageNet-S数据集:

基于广泛使用的ImageNet[1]数据集中的精确像素级标签[1,2],我们提出了一个用于LUSS 任务的大规模像素级语义分割数据集 ImageNet-S。在移除了部分不可分割的类别后,ImageNet-S含有 ImageNet中的919 个类别和约120 万张训练图片。为更加全面地评测LUSS 任务并且探索未来的应用,我们为4万余张测试图片和约1%的训练图片(约9千张)提供了像素级语义分割标注。

ImageNet-S 数据集为LUSS任务提供了多样性强的大规模数据,在充分展示LUSS任务的挑战性的同时也为模型获取丰富的表征信息提供了数据支持。如图表2所示,ImageNet-S在数量规模和类别多样性上远高于常用的语义分割数据集。且得益于ImageNet的WordTree结构,ImageNet-S具有层次化的多粒度类别分级(图3)。为方便在计算资源有限的情况下进行研究,我们也划分了包含300类和50类的子集。ImageNet-S可在https://github.com/LUSSeg/ImageNet-S下载使用。

图表 2语义分割数据集图片数量类别统计。

图表 3 ImageNet-S层次化类别结构树。

ImageNet-S数据集除了可支持LUSS任务外,也可通过部分的训练集像素级标注实现半监督的大规模语义分割,从而对backbone模型的表征能力和自监督模型的表征能力进行评估。我们开源了一个用于半监督大规模语义分割的代码库,正在集成常见的backbone模型和自监督模型。

半监督大规模语义分割代码库 https://github.com/LUSSeg/ImageNetSegModel

LUSS的丰富评测指标:

由于在训练过程中没有人工标注的类别监督,LUSS模型不能像有监督模型一样进行直接评测。为此,我们为LUSS提出了三个评估方案,包括完全无监督评测,半监督评测以及基于距离匹配的评测。完全无监督评测将GT类别与模型生成的类别相匹配实现评测;半监督评测通过利用ImageNet-S的部分训练集语义分割标注来微调模型实现评测;基于距离匹配的评测通过对比训练集和测试集的表征距离实现评测。我们提供了测试集在线评测网站以供大家公平对比。

在线评测网站 https://lusseg.github.io

四、LUSS 基线方法

图表 4 LUSS任务的基线方法(PASS)。

如图表4所示,我们提出了一个用于 LUSS 任务的基线方法(名为PASS),包含自监督表征学习,伪标签生成和微调三个步骤。对于自监督表征学习,我们提出了

1. 一种非对比的像素级表征对齐策略,以在不损害类别表征的情况下增强像素级的表征。

2. 一个提高网络中间层表征质量的自深到浅的监督策略。

以上两种策略保证模型学到高质量且可共存的形状和类别表征信息。在标签生成阶段,我们提出了一种像素注意力机制来突出对类别贡献大的语义区域,以实现在大数据量下高效的像素级伪标签生成和微调。

PASS方法首次实现大规模的无监督语义分割(可视化结果见图表5),且相较于针对小规模数据设计的无监督语义分割方法有明显优势(见图表6)。此外如图表7所示,针对LUSS任务训练的PASS模型可以作为预训练模型提升下游有监督分割任务的性能。

PASS方法开源代码: https://github.com/LUSSeg/PASS

五、展望

LUSS任务与模型预训练、半监督学习、语义聚类、高效网络结构设计等方向密切相关。即使在算力有限的情况下,依然可以基于现有的自监督预训练模型来设计更强的大规模无监督语义分割算法。研究者也可使用ImageNet-S 300/50类的子集用较少算力进行包括自监督预训练在内LUSS算法的研究,例如只需要2张GPU用十几小时即可完成50类子集上无监督语义分割的完整训练。此外,得益于ImageNet-S的部分训练集像素级标注,可以用极低的计算开销进行半监督训练,例如只用单张GPU只需约1小时即可完成近千类语义分割任务的finetune训练。

图表 5 PASS方法在大规模无监督语义分割的可视化效果。

图表 6 PASS在LUSS任务下的性能。

图表 7 针对LUSS任务训练的PASS方法可以作为预训练提升有监督下游分割任务的性能。
Reference

[1] Deng, et al. “Imagenet: A large-scale hierarchical image database.” IEEE CVPR 2009.

[2] Beyer, et al. “Are we done with imagenet?.” arXiv 2020.

[3] Gao, et al. “Large-scale Unsupervised Semantic Segmentation”, IEEE TPAMI 2022.

作者:程明明 文章来源:知乎文章【https://zhuanlan.zhihu.com/p/579982777】

Illustr ation by Pixel true from Ic o n Scout

-The End-‍

扫码观看!

本周上新!

关于我“

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务将门技术社群以及将门创投基金

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
莴笋不能随便吃?提醒:这3种人尽量少吃,别不当回事,了解下!

莴笋不能随便吃?提醒:这3种人尽量少吃,别不当回事,了解下!

秀厨娘
2026-04-01 11:58:39
菲利普亲王其实瞒了全世界8年:他得了胰腺癌,一个人扛着,直到死.....

菲利普亲王其实瞒了全世界8年:他得了胰腺癌,一个人扛着,直到死.....

英国那些事儿
2026-03-31 23:19:21
毛主席坚决不让北京卫戍区司令吴忠,兼任北京军区副司令,为何?

毛主席坚决不让北京卫戍区司令吴忠,兼任北京军区副司令,为何?

微史纪
2026-04-01 13:29:58
上汽集团:2025年净利润同比增长506.45% 拟10派2.66元

上汽集团:2025年净利润同比增长506.45% 拟10派2.66元

证券时报
2026-04-01 18:34:06
发布21天,比亚迪闪充就成了“过气”技术?这才是顶级“阳谋”

发布21天,比亚迪闪充就成了“过气”技术?这才是顶级“阳谋”

小李车评李建红
2026-04-01 08:00:03
俄罗斯要求乌克兰尽快决定从顿巴斯地区撤军

俄罗斯要求乌克兰尽快决定从顿巴斯地区撤军

新华社
2026-04-01 20:20:24
小孩子的嘴果然是口无遮拦啥都往外说!爸妈:以后还怎么见人

小孩子的嘴果然是口无遮拦啥都往外说!爸妈:以后还怎么见人

另子维爱读史
2026-04-01 19:28:39
演员宋宁峰发长文回应出轨,并宣布无限期暂停所有演艺工作

演员宋宁峰发长文回应出轨,并宣布无限期暂停所有演艺工作

韩小娱
2026-04-01 11:15:08
意外,冯德莱恩突然认错,欧洲核能大转向,但已经太迟了

意外,冯德莱恩突然认错,欧洲核能大转向,但已经太迟了

星海情报局
2026-03-31 18:52:35
NASA宇航员晒了1张照片,网友集体破防:快烧了它

NASA宇航员晒了1张照片,网友集体破防:快烧了它

Ping值焦虑
2026-03-30 14:08:36
A股:今天,收在3948点,明天,周四走势分析!

A股:今天,收在3948点,明天,周四走势分析!

明心
2026-04-01 15:12:19
广州旧村猛拆!广佛线挤爆,成“牛马专列”了...

广州旧村猛拆!广佛线挤爆,成“牛马专列”了...

佛山楼市发布
2026-03-31 14:13:37
人到中年,主动砍掉这三样开支,存钱会越来越多

人到中年,主动砍掉这三样开支,存钱会越来越多

洞读君
2026-04-01 21:10:03
4月1日医保新规落地!中老年人看病5步走,少说一句多花几百元

4月1日医保新规落地!中老年人看病5步走,少说一句多花几百元

复转这些年
2026-03-31 19:50:14
广东汕头两名女子在礁石上拍照时坠海,游客和消防接力救援,当地消防:两人情况稳定,大家游玩时务必远离危险礁石和陡坡

广东汕头两名女子在礁石上拍照时坠海,游客和消防接力救援,当地消防:两人情况稳定,大家游玩时务必远离危险礁石和陡坡

潇湘晨报
2026-04-01 19:51:13
猪肝再次成为关注对象!医生发现:常吃猪肝,可能会收获4大好处

猪肝再次成为关注对象!医生发现:常吃猪肝,可能会收获4大好处

摇感军事
2025-11-30 18:57:30
地铁员工大量辞职,直言不只是因为工资低,还有4大原因太现实!

地铁员工大量辞职,直言不只是因为工资低,还有4大原因太现实!

平说财经
2026-04-01 00:02:32
"一个时代落幕了",马斯克:Model S和Model X的定制订单已结束

"一个时代落幕了",马斯克:Model S和Model X的定制订单已结束

华尔街见闻官方
2026-04-01 15:12:56
斯皮:我已为国家队效力九年了,却至今没能参加过一届世界杯

斯皮:我已为国家队效力九年了,却至今没能参加过一届世界杯

懂球帝
2026-04-01 10:39:40
郑丽文将访问大陆,江启臣徐巧芯正式表态,卢秀燕回应相当不简单

郑丽文将访问大陆,江启臣徐巧芯正式表态,卢秀燕回应相当不简单

DS北风
2026-03-31 15:06:05
2026-04-01 21:44:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2331文章数 596关注度
往期回顾 全部

科技要闻

甲骨文血洗3万人,47人团队仅留3人

头条要闻

凯越机车疑内涵张雪机车夺冠:在你来之前我们就是冠军

头条要闻

凯越机车疑内涵张雪机车夺冠:在你来之前我们就是冠军

体育要闻

NBA扩军,和篮球无关?

娱乐要闻

宋宁峰人设崩塌!带娃偷情+反向索赔

财经要闻

电商售械三水光针 机构倒货or假货猖獗?

汽车要闻

三电可靠 用料下本 百万公里的蔚来ES6 拆开看

态度原创

家居
数码
时尚
教育
艺术

家居要闻

经典配色 昼色银河

数码要闻

DDR4-3600 vs DDR5-5600游戏实测:低延迟与高带宽谁更适合游戏

大牌必修课|| 为什么那些很会穿的人,都迷上了优雅运动风?

教育要闻

复试残酷真相!淘汰率最高 91.7%!

艺术要闻

Alexandra Manukyan油画选刊(二)

无障碍浏览 进入关怀版