网易首页 > 网易号 > 正文 申请入驻

IJCAI 2023 | 知识外推综述:在知识图谱中如何泛化到新出现的未知实体或关系

0
分享至

本文主要总结了当前的知识外推方法,按照我们提出的分类法进行分类,描述了它们之间的相互关系,并介绍了该领域下一些常用的基准数据集,最后提出了在该领域下未来研究的潜在方向。

论文名称: Generalizing to Unseen Elements: A Survey on Knowledge Extrapolation for Knowledge Graphs 论文链接: https://arxiv.org/abs/2302.01859

一、引言

知识图谱(KG)已成为各种应用中重要的知识资源,同时知识图谱嵌入(KGE)方法近年来备受关注。然而,传统的KGE方法在模型测试中仍然面临着处理未知实体或关系(Unseen Entities or Relations)的挑战。最近的研究也在不同场景中对知识图谱中未知元素的泛化问题进行了研究。例如,一些研究着重于预测对于知识图谱之外(Out-Of-Knowledge-Base,OOKB)实体的缺失三元组,另一些归纳式关系(Inductive Relation Prediction)预测方法研究了如何泛化到包含未知实体的全新知识图谱。此外,对于在低资源环境中(如少样本和零样本情况下)泛化到未知关系的问题也得到了深入研究。

当前很多方法虽然都在讨论如何处理未知实体或者关系,但往往分散在不同的设定场景或者语境下。本综述将这些不同的方法进行抽象,使用一组通用的术语统一这些方法,并将它们统称为“知识外推”(Knowledge Extrapolation)。在本论文中,我们总结了当前的知识外推方法,按照我们提出的分类法进行分类,并描述了它们之间的相互关系。此外,我们介绍了该领域下一些常用的基准数据集。最后,我们提出了在该领域下未来研究的潜在方向。

二、知识外推的设定

知识外推方法旨在进行对未知元素(包括未知实体或关系)的链接预测。为了统一处理这些未知元素的现有研究,我们引入了一组通用术语。具体而言,在知识外推过程中,有两个用于测试的数据集:一个提供有关未知元素的支持信息(例如它们的结构或文本特征),另一个用于评估模型的链接预测能力,类似于原始测试集。我们将这两个数据集分别称为支持集 和查询集 ,测试集被构建为 。尽管不同的研究可能使用不同的术语,但它们在知识外推过程中都都会涉及这两个数据集。为了方便起见,我们统一称之为支持集和查询集。

在本研究中,我们将现有的处理未知元素的知识外推方法分为两类:实体外推(Entity Extrapolation)和关系(Relation Extrapolation)外推。如下图所示,我们使用术语“实体外推”来指代在测试集中出现训练时未见过的实体的情况,而使用“关系外推”来描述在测试集中存在训练时未见过的关系的情况。

三、知识外推方法的分类

如下图所示,我们根据这些方法的模型设计将它们进行分类。对于每一类方法,我们首先介绍其一般思想,然后深入探讨现有方法的具体细节。

四、实体外推

4.1 Entity Encoding-based Entity Extrapolation

传统的知识图谱嵌入方法通常学习了一个实体的嵌入表。然而,这一范式阻碍了模型对未知实体的外推。为了处理未知实体,一个直观的方法是学习如何编码实体,而不是学习固定的实体嵌入表。这些学到的编码器可以在实体的支持集上操作,为测试阶段新出现的实体生成合理的嵌入。我们将这一类方法称为基于实体编码的实体外推(Entity Encoding-based Entity Extrapolation)。

现有研究设计了各种编码模型 ,对应于支持集 中不同类型的信息。如果支持集是有关未知实体的三元组,那么 会从结构信息中编码这些实体。如果支持集包含关于未知实体的其他类型信息(例如文本描述),我们将这种情况称为从其他信息中编码未知实体。

这一类方法的典型模型有LAN、MorsE、StAR等。

4.2 Subgraph Predicting-based Entity Extrapolation

前述的基于实体编码的方法通常单独处理三元组中的头实体、关系和尾实体。然而,一些研究提供了另一种观点,它们将三元组中的头实体和尾实体一起处理,并编码它们之间的关系子图。这种观点假定了两个实体之间的子图语义可以用来预测它们的关系。编码两个实体的子图的能力可以外推到未知实体,因为子图结构与实体无关。

这一类方法的典型模型有GraIL、CoMPILE、TACT等。

4.3 Rule Learning-based Entity Extrapolation

还有一些研究探索了从知识图谱中学习规则从而完成知识外推,因为这些逻辑规则本质上不依赖于特定的实体,从而可以外推到未知实体。基于规则学习的方法可以分为两类。纯符号方法通过统计从现有知识中生成规则,并使用预定义的指标对其进行筛选,还有一类方法结合了神经网络和符号规则。

这一类方法的典型模型有AMIE、Neural LP、CBGNN等。

五、关系外推5.1 Entity Encoding-based Entity Extrapolation

与实体外推类似,传统的知识图谱嵌入方法在关系外推方面的不足之处在于它们不能为未知关系提供合理的嵌入表示。然而,由于未知关系的支持集中可以利用一些观察到的信息,将这些信息编码以嵌入表示关系是一个直观的解决方案。根据用于编码关系的信息类型,我们还将这些方法分类为从结构信息编码和从其他信息编码。

这一类方法的典型模型有MetaR、ZSGAN、OntoZSL等。

5.2 Entity Pair Matching-based Relation Extrapolation

另一种解决方案,不是直接对关系进行编码,而是对未知关系的头实体和尾实体对进行编码,然后将这些编码的实体对与查询集中的实体对进行匹配,以预测它们是否由相同的未知关系连接。

这一类方法的典型模型有GMatching、FSRL、FAAN。

六、未来展望

目前,大多数知识外推方法主要通过在测试集上进行链接预测来评估。尽管链接预测可以证明模型的有效性并有助于知识图谱的补全,但在各种下游应用中研究如何泛化到未知的知识图谱元素也具有重要价值。

同时现有的知识外推方法主要以自然语言作为未知元素的支持信息。然而,我们认为图像等多模态信息也可以用于泛化,因为它们可以被特定的预训练编码器所理解。此外,超关系型知识图谱也可以提供不同的模态信息。

现有知识外推研究主要集中在解决实体外推和关系外推,但在实际应用中,未知实体和关系可能同时出现。如何同时考虑未知关系和实体也是未来值得研究的方向之一。

在实际应用中,一些知识图谱包含了时间约束,需要在知识图谱外推中考虑时间信息。此外,现有的知识外推方法通常假定单次外推,但最近的一些研究考虑了多批次和终身学习设定下未知元素出现的情况。

七、总结

近年来,解决如何泛化到测试阶段知识图谱中未知元素的研究逐渐增多。本文对当前这些研究提供了相对全面的综述,并使用一组通用术语对它们进行总结。我们采用我们提出的系统分类法对现有方法进行分类,并列出了常用的基准测试以及采用这些基准测试的方法。我们希望这一探索可以为该领域提供清晰的描述,并促进未来的研究。如果对该综述的细节感兴趣,欢迎各位研究者阅读本综述的论文原文。

作者:陈名杨 来源:公众号【ZJUKG】

Illustration by IconScout Store Delesign Graphics

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线500+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

chenhongyuan@thejiangmen.com

或添加工作人员微信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
父亲当30年放疗科主任,自己肺癌却没做一次治疗,临终后悔3件事

父亲当30年放疗科主任,自己肺癌却没做一次治疗,临终后悔3件事

荷兰豆爱健康
2026-05-26 10:18:43
沙利文万字长文承认:面对中国,我们确实错了!

沙利文万字长文承认:面对中国,我们确实错了!

浪子的烟火人间
2026-05-26 01:30:03
妻子惨死家中,丈夫被判死缓,19年洗清沉冤,真凶已是三级警督!

妻子惨死家中,丈夫被判死缓,19年洗清沉冤,真凶已是三级警督!

易玄
2026-05-25 20:07:32
反转了!那个戴“金耳环”救灾的女干部,真的不是作秀?

反转了!那个戴“金耳环”救灾的女干部,真的不是作秀?

李昕言温度空间
2026-05-25 20:35:48
媒体人:北京国安接近签约成都门将蹇韬,后者还有半年合同

媒体人:北京国安接近签约成都门将蹇韬,后者还有半年合同

懂球帝
2026-05-26 11:07:47
16+14+9!尼克斯全队第一!布伦森斩获MVP,但他才是东决“奇兵”

16+14+9!尼克斯全队第一!布伦森斩获MVP,但他才是东决“奇兵”

后仰跳投绝杀
2026-05-26 16:43:21
北极"尸体点"正在融化:数百年前的水手遗骨暴露于世

北极"尸体点"正在融化:数百年前的水手遗骨暴露于世

闪存猎手
2026-05-25 04:36:07
美国漫展惊现“新鲜脚汁” 一杯卖15美元

美国漫展惊现“新鲜脚汁” 一杯卖15美元

3DM游戏
2026-05-25 15:33:17
朱可夫晚年道出实情,莫斯科击退德军根源是斯大林绝密指令

朱可夫晚年道出实情,莫斯科击退德军根源是斯大林绝密指令

唠叨说历史
2026-05-25 16:35:52
我国已累计发布1750项食品安全标准

我国已累计发布1750项食品安全标准

北青网-北京青年报
2026-05-26 07:35:02
林丽发文我错了 奶奶接纳她了 用心劝导怀远 不希望辰辰走金牌的老路

林丽发文我错了 奶奶接纳她了 用心劝导怀远 不希望辰辰走金牌的老路

起喜电影
2026-05-26 06:25:57
沪电股份盘中涨停

沪电股份盘中涨停

每日经济新闻
2026-05-26 13:37:31
“几内亚称正敲定铝土矿出口限制方案,而中国进口的铝土矿中约四分之三来自几内亚”,外交部:作为原则,所有国家都有责任维护产供链稳定

“几内亚称正敲定铝土矿出口限制方案,而中国进口的铝土矿中约四分之三来自几内亚”,外交部:作为原则,所有国家都有责任维护产供链稳定

极目新闻
2026-05-26 16:05:53
上海广厦G1打响!CCTV5直播有变!裁判全换不用中国籍,做到公平

上海广厦G1打响!CCTV5直播有变!裁判全换不用中国籍,做到公平

老吴说体育
2026-05-26 11:21:50
从152斤减到98斤,我发现常吃这2种碳水,体重反而下降很快!

从152斤减到98斤,我发现常吃这2种碳水,体重反而下降很快!

健身狂人
2026-05-25 09:50:05
不是政变,是处决!

不是政变,是处决!

安安说
2026-05-26 11:04:20
比开塞露还管用!这3种“推屎”食物,每天吃一点,清空宿便

比开塞露还管用!这3种“推屎”食物,每天吃一点,清空宿便

白宸侃片
2026-05-19 11:56:50
半导体大佬集体减持后,杭州豪宅被抢疯了!

半导体大佬集体减持后,杭州豪宅被抢疯了!

樱桃大房子
2026-05-25 21:52:46
死伤惨重!90枚导弹、600架无人机突袭基辅,榛树导弹击穿乌大楼

死伤惨重!90枚导弹、600架无人机突袭基辅,榛树导弹击穿乌大楼

小嵩
2026-05-26 05:18:35
数百元轮椅上千元采购,适老化改造不能成了糊涂账 |新京报快评

数百元轮椅上千元采购,适老化改造不能成了糊涂账 |新京报快评

新京报
2026-05-25 16:06:11
2026-05-26 17:43:00
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2389文章数 596关注度
往期回顾 全部

教育要闻

高代价追责!已上大学的,全部被清退

头条要闻

25岁海归男恋上32岁离异女 因88.8万彩礼闹掰追讨12万

头条要闻

25岁海归男恋上32岁离异女 因88.8万彩礼闹掰追讨12万

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

游戏
手机
家居
亲子
本地

《女神异闻录4重制版》评级过审!定档已迫在眉睫

手机要闻

4月智能手机出货量同比增长12.3% 5G手机同比增长24.4%

家居要闻

生与命相依 旧公寓改造

亲子要闻

汪汪队莱德梳理交通 #汪汪队#大型挖掘机挖土玩具

本地新闻

用云锦的方式,打开江苏南京

无障碍浏览 进入关怀版