网易首页 > 网易号 > 正文 申请入驻

香港大学提出无需数据标记的ViT密集表征增强方法

0
分享至



本文共同第一作者为陈寅杰、颜子鹏,相关研究工作于香港大学科研实习期间完成;通讯作者 Andrew F. Luo 为香港大学助理教授。该工作已经被 NeurIPS 2025 会议接受为 Spotlight。

在视觉处理任务中,Vision Transformers(ViTs)已发展成为主流架构。然而,近期研究表明,ViT 模型的密集特征中会出现部分与局部语义不一致的伪影(artifact),进而削弱模型在精细定位类任务中的性能表现。因此,如何在不耗费大量计算资源的前提下,保留 ViT 模型预训练核心信息并消除密集特征中的伪影?

香港大学团队提出一种无需数据标记的 ViT 密集表征增强方法 PH-Reg(Post Hoc Registers),为该挑战提供了全新且高效的解决方法。该方法融合测试时增强(test-time augmentation)的去噪策略,去除教师模型密集特征中的伪影;并通过自蒸馏方法,在无需额外数据标记的条件下,得到能够输出无伪影密集特征的学生模型。

PH-Reg 具备良好的架构适配性,可灵活应用于 CLIP、DINOv2 等不同模型架构,能够高效去除密集特征的伪影,以此显著提升模型在下游任务中的性能表现。



  • 论文标题:Vision Transformers with Self-Distilled Registers
  • 论文地址:https://arxiv.org/abs/2505.21501
  • 代码地址:https://github.com/0raiser0/PH-Reg

伪影破坏模型密集特征的语义一致性

尽管当前 ViT 模型基于数据驱动的注意力机制具备强大表示能力,但模型密集特征中存在的伪影往往会破坏其精细定位能力,而该能力对于语义分割等需高空间精度的任务而言至关重要。传统的优化方法,如在模型架构中添加 register tokens 并从头开始训练,需要消耗大量的计算资源,导致现有模型的性能提升既昂贵又耗时。

为解决上述问题,该论文提出一种高效的 PH-Reg 自蒸馏框架。该框架无需数据标记,且不再依赖 “从头开始” 的全量训练,而是通过巧妙结合测试时(test-time)密集特征增强和自蒸馏策略,仅优化学生模型中少量解锁的权重参数,即可实现无伪影的密集特征增强。



自蒸馏框架结合免训练实现去除伪影,无需数据标记实现无伪影的密集特征

1. 免训练去噪算法

研究发现,伪影并非相对于图像内容保持静态,因此当图像经过增强处理(如随机偏移、水平翻转等)时,密集特征中的伪影并不会以相同方式或幅度同步偏移。受此启发,此算法在无需梯度反向传播的情况下,能够生成去噪且无伪影的密集特征。

2. 自蒸馏框架

PH-Reg 采用自蒸馏策略,无需依赖数据标记,仅通过引入 register tokens,以最小侵入性方式对学生模型架构进行增强。在蒸馏过程中,仅对 register tokens、卷积层、位置嵌入(positional embeddings)及最后一个 Transformer 模块进行针对性更新,既最大限度保留了 ViT 模型预训练权重的核心信息,又显著节省了计算资源。

实验结果

本文应用该方法对多个 ViT 主干模型在多种密集特征预测任务上进行了系统验证,实现结果表明在不同模型与任务类型下均展现出一致且稳定的替身效果,体现了该方法的鲁棒性的广泛适用性。主要实验结果如下:

1. 开放词汇语义分割任务

  • 在 VOC、COCO、ADE20K 等八个开放词汇语义分割基准数据集上,PH-Reg 在其中七个数据集上的性能超越了 MaskCLIP、SCLIP、NACLIP、ClearCLIP 等主流方法。
  • 此外,与 DVT 这一相似去噪方法相比,PH-Reg 能为 MaskCLIP 与 NACLIP 带来更加显著的性能提升。



2. 线性探测任务

  • 在语义分割任务中,该方法为所有 ViT 骨干模型带来了实质性性能增益。特别对于 CLIP 模型,其在 VOC21 数据集上的 mIoU 显著提升 5.04%,在 ADE20k 数据集上的 mIoU 提升 3.64%。
  • 在深度估计任务中,该方法同样为预训练 ViT 骨干模型带来了稳定的性能提升,且仅通过引入 register tokens,便在参数量增加可忽略不计的前提下,取得了更优结果。



3. 高效的蒸馏过程

  • 该方法的核心优势在于无需依赖基于梯度的神经场学习,因此采用单阶段蒸馏方式训练学生模型,与 DVT 相比,训练时间节省超 58.9%。
  • 此外,DVT 在训练过程中需存储 1.4 TB 的神经场特征数据,而该方法可实时计算所有蒸馏目标,全程无需额外存储空间。



总结与展望

PH-Reg 框架包含了一种无需重训、即插即用的 ViT 模型去噪方案,在无需数据标记的条件下,通过自蒸馏能够高效修复 CLIP、DINOv2 等现有预训练模型中的伪影问题。

该研究不仅有效提升了 ViT 主干模型中密集特征的语义一致性,更为未来大规模视觉模型的快速微调与蒸馏机制探索提供了全新思路与研究方向。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
18年未解!徐朵亲生母亲是谁?3大线索

18年未解!徐朵亲生母亲是谁?3大线索

手工制作阿歼
2026-01-20 02:45:26
60岁以后打断筋都不要做的14件事,做三件就糊涂到家了,马上收藏

60岁以后打断筋都不要做的14件事,做三件就糊涂到家了,马上收藏

情感大使馆
2025-12-01 10:40:53
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
打嗨了!王俊杰100%命中率!中国男篮第一核心前锋

打嗨了!王俊杰100%命中率!中国男篮第一核心前锋

篮球实战宝典
2026-01-19 22:07:03
国产手机集体沉默鸿蒙:5大核心原因,不是不愿是不能

国产手机集体沉默鸿蒙:5大核心原因,不是不愿是不能

时尚的弄潮
2026-01-18 12:13:35
瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

古书记史
2026-01-06 16:31:56
央视怒批,人民日报点名封杀,这5位目无法纪的大网红,彻底凉凉

央视怒批,人民日报点名封杀,这5位目无法纪的大网红,彻底凉凉

一娱三分地
2025-12-04 17:00:33
河南农村冷得下不了床,评论炸锅:盖3层楼舍得,开暖气却心疼?

河南农村冷得下不了床,评论炸锅:盖3层楼舍得,开暖气却心疼?

夜深爱杂谈
2026-01-19 18:53:53
弘一法师:不要太操心你的孩子和在意的亲人,每个人都有自己的命

弘一法师:不要太操心你的孩子和在意的亲人,每个人都有自己的命

木言观
2026-01-18 13:56:24
副院长风波新料:原配在同一家医院上班,工作照和履历都被挖出来

副院长风波新料:原配在同一家医院上班,工作照和履历都被挖出来

没有偏旁的常庆
2026-01-19 09:44:50
眼瞳:一扇无法看穿的窗

眼瞳:一扇无法看穿的窗

疾跑的小蜗牛
2026-01-19 21:56:30
TVB小生荣升内地短剧男一,曾自爆收入微薄,要打5份工帮补家计

TVB小生荣升内地短剧男一,曾自爆收入微薄,要打5份工帮补家计

章眽八卦
2026-01-19 13:44:20
快船险胜!哈登36分20罚,乔治18+6榜眼大爆发,米勒16+5全队第一

快船险胜!哈登36分20罚,乔治18+6榜眼大爆发,米勒16+5全队第一

鱼崖大话篮球
2026-01-20 06:46:03
姆巴佩:我理解球迷的不满,但要嘘应该嘘全队

姆巴佩:我理解球迷的不满,但要嘘应该嘘全队

懂球帝
2026-01-19 22:01:36
36岁男明星晒南极旅游!天天吃泡面,吐槽企鹅屎臭,网友:祛魅了

36岁男明星晒南极旅游!天天吃泡面,吐槽企鹅屎臭,网友:祛魅了

瓜汁橘长Dr
2025-12-29 17:52:06
底层老百姓戾气越来越重了

底层老百姓戾气越来越重了

放牛娃的遐想
2026-01-20 08:21:18
恩里克:世界杯上若不是西班牙夺冠,我很乐意看到葡萄牙夺冠

恩里克:世界杯上若不是西班牙夺冠,我很乐意看到葡萄牙夺冠

懂球帝
2026-01-20 04:00:11
“买英国精子生3娃”的山东女人,8年后现状曝光!如今她后悔不?

“买英国精子生3娃”的山东女人,8年后现状曝光!如今她后悔不?

说历史的老牢
2026-01-19 10:33:42
网友建议西贝给嫣然医院捐款两千万解决房租问题,好消除舆论

网友建议西贝给嫣然医院捐款两千万解决房租问题,好消除舆论

映射生活的身影
2026-01-19 21:35:59
震惊!耶鲁大学已清除了所有支持共和党的教授

震惊!耶鲁大学已清除了所有支持共和党的教授

大洛杉矶LA
2026-01-19 07:09:47
2026-01-20 09:44:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12147文章数 142546关注度
往期回顾 全部

科技要闻

去年预亏60亿后再投百亿 两大车企紧抱华为

头条要闻

女子求职收到66元红包和感谢信 公司:希望表达尊重

头条要闻

女子求职收到66元红包和感谢信 公司:希望表达尊重

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

2026股市猜想

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

游戏
亲子
时尚
房产
家居

史低倒计时 ! 96%好评解压神器: 我在“故宫”做装修!

亲子要闻

总提别人家的孩子会有什么影响:孩子迎合家长容易迷失自我

码住抄作业!春节见人不翻车就靠这8样!

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

家居要闻

隽永之章 清雅无尘

无障碍浏览 进入关怀版