图异常检测(Graph Anomaly Detection, GAD)旨在识别与大多数节点差异显著的异常节点,近年来受到广泛关注。然而,现有通用图模型在迁移到GAD任务时仍面临挑战,主要原因在于难以捕捉跨领域的低频、不规则和异质异常模式。
为此,本文提出 AnomalyGFM ——一个面向GAD的图基础模型,支持跨图的零样本推理与小样本提示调优。其核心思想是学习图无关的正常与异常类原型,并将其与节点残差特征(节点与邻居表示的偏差)对齐,从而在统一特征空间中度量异常性。在11个覆盖社交、金融与评论网络的真实数据集上,实验结果表明,AnomalyGFM在零样本和小样本场景下均显著优于现有最新方法。
一、介绍
图异常检测(Graph Anomaly Detection,GAD)旨在识别与图中大多数节点不同的异常节点,近年来已受到广泛关注。
现有的一般化图模型虽然在多种图任务中取得了显著成功,但在推广到 GAD 任务时仍然面临挑战。这一局限主要源于其难以学习可泛化的知识来捕捉跨不同领域图中固有的低频、不规则和异质的异常模式。
为应对这一挑战,我们提出了 AnomalyGFM,一个面向 GAD 的图基础模型,能够在多样化的图数据集上支持零样本推理和小样本提示调优(prompt tuning)。其核心洞察在于,需要图无关的正常与异常类表示,才能支持跨不同图的有效零/小样本 GAD。
受此启发,AnomalyGFM 通过预训练,将数据无关、可学习的正常和异常类原型,与节点表示残差(即节点与其邻居的表示偏差)进行对齐。残差特征实质上将节点信息投射到统一的特征空间中,使得我们能够以一致的方式衡量来自不同图的节点异常性。
这为学习图无关、具有判别性的正常与异常类原型提供了驱动力,并可直接用于在新图上进行零样本 GAD,包括超大规模图。如果在新图中存在少量标注的正常节点,AnomalyGFM 还可以进一步支持提示调优,以利用这些节点实现更好的适应。
在覆盖社交网络、金融网络和共同评论网络的 11 个广泛使用的真实异常 GAD 数据集上的综合实验表明,AnomalyGFM 在零样本和小样本 GAD 设置下均显著优于现有的最新方法。
论文题目: AnomalyGFM: Graph Foundation Model for Zero/Few-shot Anomaly Detection 论文地址: https://arxiv.org/abs/2502.09254 代码地址: https://github.com/mala-lab/AnomalyGFM二、方法
尽管图基础模型在通用图分类任务上取得了较好的效果,目前仍然缺乏一种基础模型,能够在跨不同领域的图中有效捕捉异常,并同时支持零样本和小样本的图异常检测。
为填补这一空白,本文提出 AnomalyGFM,一个面向 GAD 的图基础模型(Graph Foundation Model,GFM),能够在零样本和小样本场景下都有效地解决 GAD 问题。
其核心洞察在于:为了避免对预训练图数据的过拟合,需要学习图无关的正常类和异常类表示,从而支持跨不同图的有效零/小样本 GAD。在这一动机的驱动下
AnomalyGFM 通过预训练,将数据无关、可学习的正常类和异常类原型,与节点表示残差(即节点与其邻居节点的表示偏差)进行对齐。
与原始特征空间中正常与异常模式在不同数据集里呈现的不规则和异质性分布(见图 (b))相比,残差特征本质上将节点信息投射到一个统一的特征空间中,在该空间里我们能够以一致且 相同的方式有效衡量来自不同图的节点异常性(见图 (c))。
这是因为无论节点来自哪个图,正常节点都预期与其邻居之间的残差/偏差较小,而异常节点的残差通常较大。
通过学习将这些残差特征与可学习的正常和异常类原型对齐,AnomalyGFM 将基于残差特征的异常可判别性蒸馏到两个图无关的原型中,从而在无需额外调优/训练的情况下,实现对新图中 GAD 的强泛化能力。
进一步地,如果在新图中存在少量标注的正常节点,AnomalyGFM 还能支持图提示调优(graph prompt tuning),以利用这些节点实现更好的适应性。
在推理时异常分数由目标节点的表示残差与两个原型的相似性计算得到。除此之外,通过学习图无关的原型,AnomalyGFM 可以通过一种基于子图的推理方法推广到超大规模图。
AnomalyGFM 能够在无需考虑整个图结构的情况下有效推断异常分数,从而消除在 GAD 推理中必须加载完整图的瓶颈。该子图推理方式在隐私敏感的场景中同样具有优势,因为在这些场景下我们不希望将完整的图结构暴露给检测模型。
三、实验
我们建立了一个覆盖零样本和小样本设置的综合基准,使用了 11 个真实世界的 GAD 数据集,在此基准上:
i) AnomalyGFM 的表现显著优于最新的无监督、监督以及通用 GAD 方法;
ii) 在小样本 GAD 场景下,AnomalyGFM 在大多数数据集上的 AUROC 和 AUPRC 指标上均优于一些通用方法。
iii) AnomalyGFM 具有良好的可扩展性,能够应用于超大规模图。
四、结论
本文构建了一个面向 GAD 的图基础模型 AnomalyGFM,能够在小样本和零样本场景下均有效工作。AnomalyGFM 通过预训练,将可区分且数据无关的原型与图无关的节点表示残差进行对齐,从而学习到判别性原型。
这种方式为异常性测度提供了一种一致且统一的途径,即通过比较节点残差表示与已学习类原型之间的相似性来判断,从而在零样本和小样本推理中都具备强泛化能力。在 11 个数据集上的大量实验结果验证了 AnomalyGFM 的有效性和泛化性。
来源:公众号【PaperWeekly】
llustration From IconScout By IconScout Store
-The End-
扫码观看!
本周上新!
“AI技术流”原创投稿计划
TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线700+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。
投稿内容
// 最新技术解读/系统性知识分享 //
// 前沿资讯解说/心得经历讲述 //
投稿须知
稿件需要为原创文章,并标明作者信息。
我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励
投稿方式
发送邮件到
michellechang@thejiangmen.com
或添加工作人员微信(michelle333_)投稿,沟通投稿详情
关于我“门”
将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。
将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:
bp@thejiangmen.com
点击右上角,把文章分享到朋友圈
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.