网易首页 > 网易号 > 正文 申请入驻

NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

0
分享至

来源:市场资讯

(来源:机器之心)

本文共同第一作者为陈寅杰、颜子鹏,相关研究工作于香港大学科研实习期间完成;通讯作者 Andrew F. Luo 为香港大学助理教授。该工作已经被 NeurIPS 2025 会议接受为 Spotlight。

在视觉处理任务中,Vision Transformers(ViTs)已发展成为主流架构。然而,近期研究表明,ViT 模型的密集特征中会出现部分与局部语义不一致的伪影(artifact),进而削弱模型在精细定位类任务中的性能表现。因此,如何在不耗费大量计算资源的前提下,保留 ViT 模型预训练核心信息并消除密集特征中的伪影?

香港大学团队提出一种无需数据标记的 ViT 密集表征增强方法 PH-Reg(Post Hoc Registers),为该挑战提供了全新且高效的解决方法。该方法融合测试时增强(test-time augmentation)的去噪策略,去除教师模型密集特征中的伪影;并通过自蒸馏方法,在无需额外数据标记的条件下,得到能够输出无伪影密集特征的学生模型。

PH-Reg 具备良好的架构适配性,可灵活应用于 CLIP、DINOv2 等不同模型架构,能够高效去除密集特征的伪影,以此显著提升模型在下游任务中的性能表现。


  • 论文标题:Vision Transformers with Self-Distilled Registers

  • 论文地址:https://arxiv.org/abs/2505.21501

  • 代码地址:https://github.com/0raiser0/PH-Reg

伪影破坏模型密集特征的语义一致性

尽管当前 ViT 模型基于数据驱动的注意力机制具备强大表示能力,但模型密集特征中存在的伪影往往会破坏其精细定位能力,而该能力对于语义分割等需高空间精度的任务而言至关重要。传统的优化方法,如在模型架构中添加 register tokens 并从头开始训练,需要消耗大量的计算资源,导致现有模型的性能提升既昂贵又耗时。

为解决上述问题,该论文提出一种高效的 PH-Reg 自蒸馏框架。该框架无需数据标记,且不再依赖 “从头开始” 的全量训练,而是通过巧妙结合测试时(test-time)密集特征增强和自蒸馏策略,仅优化学生模型中少量解锁的权重参数,即可实现无伪影的密集特征增强。


自蒸馏框架结合免训练实现去除伪影,无需数据标记实现无伪影的密集特征

1. 免训练去噪算法

研究发现,伪影并非相对于图像内容保持静态,因此当图像经过增强处理(如随机偏移、水平翻转等)时,密集特征中的伪影并不会以相同方式或幅度同步偏移。受此启发,此算法在无需梯度反向传播的情况下,能够生成去噪且无伪影的密集特征。

2. 自蒸馏框架

PH-Reg 采用自蒸馏策略,无需依赖数据标记,仅通过引入 register tokens,以最小侵入性方式对学生模型架构进行增强。在蒸馏过程中,仅对 register tokens、卷积层、位置嵌入(positional embeddings)及最后一个 Transformer 模块进行针对性更新,既最大限度保留了 ViT 模型预训练权重的核心信息,又显著节省了计算资源。

实验结果

本文应用该方法对多个 ViT 主干模型在多种密集特征预测任务上进行了系统验证,实现结果表明在不同模型与任务类型下均展现出一致且稳定的替身效果,体现了该方法的鲁棒性的广泛适用性。主要实验结果如下:

1. 开放词汇语义分割任务

  • 在 VOC、COCO、ADE20K 等八个开放词汇语义分割基准数据集上,PH-Reg 在其中七个数据集上的性能超越了 MaskCLIP、SCLIP、NACLIP、ClearCLIP 等主流方法。

  • 此外,与 DVT 这一相似去噪方法相比,PH-Reg 能为 MaskCLIP 与 NACLIP 带来更加显著的性能提升。


2. 线性探测任务

  • 在语义分割任务中,该方法为所有 ViT 骨干模型带来了实质性性能增益。特别对于 CLIP 模型,其在 VOC21 数据集上的 mIoU 显著提升 5.04%,在 ADE20k 数据集上的 mIoU 提升 3.64%。

  • 在深度估计任务中,该方法同样为预训练 ViT 骨干模型带来了稳定的性能提升,且仅通过引入 register tokens,便在参数量增加可忽略不计的前提下,取得了更优结果。


3. 高效的蒸馏过程

  • 该方法的核心优势在于无需依赖基于梯度的神经场学习,因此采用单阶段蒸馏方式训练学生模型,与 DVT 相比,训练时间节省超 58.9%。

  • 此外,DVT 在训练过程中需存储 1.4 TB 的神经场特征数据,而该方法可实时计算所有蒸馏目标,全程无需额外存储空间。


总结与展望

PH-Reg 框架包含了一种无需重训、即插即用的 ViT 模型去噪方案,在无需数据标记的条件下,通过自蒸馏能够高效修复 CLIP、DINOv2 等现有预训练模型中的伪影问题。

该研究不仅有效提升了 ViT 主干模型中密集特征的语义一致性,更为未来大规模视觉模型的快速微调与蒸馏机制探索提供了全新思路与研究方向。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宗馥莉输了?娃哈哈大会背后的四个真相

宗馥莉输了?娃哈哈大会背后的四个真相

数字财经智库
2025-11-19 11:56:47
“你儿子以后多半是个力工”,母亲晒学习环境,地面已经说明问题

“你儿子以后多半是个力工”,母亲晒学习环境,地面已经说明问题

熙熙说教
2025-11-16 18:59:41
中导撤离,高市早苗被骗了!日本全国将沦为战场,这句美军听懂了

中导撤离,高市早苗被骗了!日本全国将沦为战场,这句美军听懂了

起喜电影
2025-11-19 14:21:36
机关事业单位退休人员迎来好消息,除了养老金外,还有一笔钱能领

机关事业单位退休人员迎来好消息,除了养老金外,还有一笔钱能领

社保小达人
2025-10-27 14:50:06
无法共情!俞敏洪连发10条南极游视频,公开信激怒全网打工人

无法共情!俞敏洪连发10条南极游视频,公开信激怒全网打工人

雷科技
2025-11-18 15:48:27
勇士又把文班亚马“废了”,这下马刺百分百跌出季后赛资格区…!

勇士又把文班亚马“废了”,这下马刺百分百跌出季后赛资格区…!

田先生篮球
2025-11-18 22:32:34
谷歌深夜炸场:Gemini 3正式发布!自ChatGPT发布以来最激动人心的事件

谷歌深夜炸场:Gemini 3正式发布!自ChatGPT发布以来最激动人心的事件

AI寒武纪
2025-11-19 01:42:12
中方的一句话,日本30年努力全白费,绝无可能成为联合国“五常”

中方的一句话,日本30年努力全白费,绝无可能成为联合国“五常”

乐天闲聊
2025-11-19 14:51:05
日本对中国的反击好猛,一个接一个,高市早苗断定:友国定会帮忙

日本对中国的反击好猛,一个接一个,高市早苗断定:友国定会帮忙

娱乐圈的笔娱君
2025-11-19 13:13:38
随着韩国1-0越南,熊猫杯最终积分榜:国足屈居亚军,汪士钦染红

随着韩国1-0越南,熊猫杯最终积分榜:国足屈居亚军,汪士钦染红

侃球熊弟
2025-11-18 17:26:04
5-1,53岁波切蒂诺发威:率队大胜乌拉圭,世界杯东道主豪取3连胜

5-1,53岁波切蒂诺发威:率队大胜乌拉圭,世界杯东道主豪取3连胜

侧身凌空斩
2025-11-19 09:57:31
女子离婚1年想复婚,结果前夫娶了小6岁娇妻,网友:被秒杀

女子离婚1年想复婚,结果前夫娶了小6岁娇妻,网友:被秒杀

农村情感故事
2025-11-05 13:08:58
发现一个残酷真相:如今,十个离婚的女性中,有九个都会后悔

发现一个残酷真相:如今,十个离婚的女性中,有九个都会后悔

伊人河畔
2025-09-26 16:26:26
杭州母亲偷看00后女儿手机大吃一惊:月薪九千元的女儿每月花五千元购买秒回师服务

杭州母亲偷看00后女儿手机大吃一惊:月薪九千元的女儿每月花五千元购买秒回师服务

观威海
2025-11-15 15:06:06
不出意外的话!苏林会成为第二个黎笋

不出意外的话!苏林会成为第二个黎笋

近史谈
2025-11-02 18:54:35
hr每次都疼怎么办?

hr每次都疼怎么办?

性学研究僧
2025-11-18 23:18:30
这8种东西不能用酒精擦,一擦就坏,再也修复不回来了!

这8种东西不能用酒精擦,一擦就坏,再也修复不回来了!

装修秀
2025-11-13 11:50:03
顶流小生人设崩塌!私底下竟是圈内玩咖,手段惊人……

顶流小生人设崩塌!私底下竟是圈内玩咖,手段惊人……

毒舌八卦
2025-11-17 23:05:50
俄军出动装甲冲锋队拼死救援多布罗皮利亚包围圈惨遭歼灭

俄军出动装甲冲锋队拼死救援多布罗皮利亚包围圈惨遭歼灭

环球热点快评
2025-10-28 13:35:40
八村垒把身价打没了!篮下终结拉胯,防守+篮板毒瘤,下替补吧!

八村垒把身价打没了!篮下终结拉胯,防守+篮板毒瘤,下替补吧!

细话篮球
2025-11-19 15:12:21
2025-11-19 16:03:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1428522文章数 4570关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

男子吐槽乱插队被80多岁老人打伤 对方喊话"谁敢拦我"

头条要闻

男子吐槽乱插队被80多岁老人打伤 对方喊话"谁敢拦我"

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

又反转!曝喻恩泰出轨美女律师

财经要闻

黄金税改两周,水贝低价神话终结?

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

艺术
数码
游戏
手机
公开课

艺术要闻

启功:我是画家,但书名超过了画名

数码要闻

闪存全面大幅涨价 最高涨幅达38.46%

KK官方对战平台StarsWar12线下赛圆满结束,传奇不老,战魂不灭!

手机要闻

华为Mate X7折叠屏手机今日开启预订:搭载麒麟9030芯片

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版