网易首页 > 网易号 > 正文 申请入驻

IJCAI 2023 | 知识外推综述:在知识图谱中如何泛化到新出现的未知实体或关系

0
分享至

本文主要总结了当前的知识外推方法,按照我们提出的分类法进行分类,描述了它们之间的相互关系,并介绍了该领域下一些常用的基准数据集,最后提出了在该领域下未来研究的潜在方向。

论文名称: Generalizing to Unseen Elements: A Survey on Knowledge Extrapolation for Knowledge Graphs 论文链接: https://arxiv.org/abs/2302.01859

一、引言

知识图谱(KG)已成为各种应用中重要的知识资源,同时知识图谱嵌入(KGE)方法近年来备受关注。然而,传统的KGE方法在模型测试中仍然面临着处理未知实体或关系(Unseen Entities or Relations)的挑战。最近的研究也在不同场景中对知识图谱中未知元素的泛化问题进行了研究。例如,一些研究着重于预测对于知识图谱之外(Out-Of-Knowledge-Base,OOKB)实体的缺失三元组,另一些归纳式关系(Inductive Relation Prediction)预测方法研究了如何泛化到包含未知实体的全新知识图谱。此外,对于在低资源环境中(如少样本和零样本情况下)泛化到未知关系的问题也得到了深入研究。

当前很多方法虽然都在讨论如何处理未知实体或者关系,但往往分散在不同的设定场景或者语境下。本综述将这些不同的方法进行抽象,使用一组通用的术语统一这些方法,并将它们统称为“知识外推”(Knowledge Extrapolation)。在本论文中,我们总结了当前的知识外推方法,按照我们提出的分类法进行分类,并描述了它们之间的相互关系。此外,我们介绍了该领域下一些常用的基准数据集。最后,我们提出了在该领域下未来研究的潜在方向。

二、知识外推的设定

知识外推方法旨在进行对未知元素(包括未知实体或关系)的链接预测。为了统一处理这些未知元素的现有研究,我们引入了一组通用术语。具体而言,在知识外推过程中,有两个用于测试的数据集:一个提供有关未知元素的支持信息(例如它们的结构或文本特征),另一个用于评估模型的链接预测能力,类似于原始测试集。我们将这两个数据集分别称为支持集 和查询集 ,测试集被构建为 。尽管不同的研究可能使用不同的术语,但它们在知识外推过程中都都会涉及这两个数据集。为了方便起见,我们统一称之为支持集和查询集。

在本研究中,我们将现有的处理未知元素的知识外推方法分为两类:实体外推(Entity Extrapolation)和关系(Relation Extrapolation)外推。如下图所示,我们使用术语“实体外推”来指代在测试集中出现训练时未见过的实体的情况,而使用“关系外推”来描述在测试集中存在训练时未见过的关系的情况。

三、知识外推方法的分类

如下图所示,我们根据这些方法的模型设计将它们进行分类。对于每一类方法,我们首先介绍其一般思想,然后深入探讨现有方法的具体细节。

四、实体外推

4.1 Entity Encoding-based Entity Extrapolation

传统的知识图谱嵌入方法通常学习了一个实体的嵌入表。然而,这一范式阻碍了模型对未知实体的外推。为了处理未知实体,一个直观的方法是学习如何编码实体,而不是学习固定的实体嵌入表。这些学到的编码器可以在实体的支持集上操作,为测试阶段新出现的实体生成合理的嵌入。我们将这一类方法称为基于实体编码的实体外推(Entity Encoding-based Entity Extrapolation)。

现有研究设计了各种编码模型 ,对应于支持集 中不同类型的信息。如果支持集是有关未知实体的三元组,那么 会从结构信息中编码这些实体。如果支持集包含关于未知实体的其他类型信息(例如文本描述),我们将这种情况称为从其他信息中编码未知实体。

这一类方法的典型模型有LAN、MorsE、StAR等。

4.2 Subgraph Predicting-based Entity Extrapolation

前述的基于实体编码的方法通常单独处理三元组中的头实体、关系和尾实体。然而,一些研究提供了另一种观点,它们将三元组中的头实体和尾实体一起处理,并编码它们之间的关系子图。这种观点假定了两个实体之间的子图语义可以用来预测它们的关系。编码两个实体的子图的能力可以外推到未知实体,因为子图结构与实体无关。

这一类方法的典型模型有GraIL、CoMPILE、TACT等。

4.3 Rule Learning-based Entity Extrapolation

还有一些研究探索了从知识图谱中学习规则从而完成知识外推,因为这些逻辑规则本质上不依赖于特定的实体,从而可以外推到未知实体。基于规则学习的方法可以分为两类。纯符号方法通过统计从现有知识中生成规则,并使用预定义的指标对其进行筛选,还有一类方法结合了神经网络和符号规则。

这一类方法的典型模型有AMIE、Neural LP、CBGNN等。

五、关系外推5.1 Entity Encoding-based Entity Extrapolation

与实体外推类似,传统的知识图谱嵌入方法在关系外推方面的不足之处在于它们不能为未知关系提供合理的嵌入表示。然而,由于未知关系的支持集中可以利用一些观察到的信息,将这些信息编码以嵌入表示关系是一个直观的解决方案。根据用于编码关系的信息类型,我们还将这些方法分类为从结构信息编码和从其他信息编码。

这一类方法的典型模型有MetaR、ZSGAN、OntoZSL等。

5.2 Entity Pair Matching-based Relation Extrapolation

另一种解决方案,不是直接对关系进行编码,而是对未知关系的头实体和尾实体对进行编码,然后将这些编码的实体对与查询集中的实体对进行匹配,以预测它们是否由相同的未知关系连接。

这一类方法的典型模型有GMatching、FSRL、FAAN。

六、未来展望

目前,大多数知识外推方法主要通过在测试集上进行链接预测来评估。尽管链接预测可以证明模型的有效性并有助于知识图谱的补全,但在各种下游应用中研究如何泛化到未知的知识图谱元素也具有重要价值。

同时现有的知识外推方法主要以自然语言作为未知元素的支持信息。然而,我们认为图像等多模态信息也可以用于泛化,因为它们可以被特定的预训练编码器所理解。此外,超关系型知识图谱也可以提供不同的模态信息。

现有知识外推研究主要集中在解决实体外推和关系外推,但在实际应用中,未知实体和关系可能同时出现。如何同时考虑未知关系和实体也是未来值得研究的方向之一。

在实际应用中,一些知识图谱包含了时间约束,需要在知识图谱外推中考虑时间信息。此外,现有的知识外推方法通常假定单次外推,但最近的一些研究考虑了多批次和终身学习设定下未知元素出现的情况。

七、总结

近年来,解决如何泛化到测试阶段知识图谱中未知元素的研究逐渐增多。本文对当前这些研究提供了相对全面的综述,并使用一组通用术语对它们进行总结。我们采用我们提出的系统分类法对现有方法进行分类,并列出了常用的基准测试以及采用这些基准测试的方法。我们希望这一探索可以为该领域提供清晰的描述,并促进未来的研究。如果对该综述的细节感兴趣,欢迎各位研究者阅读本综述的论文原文。

作者:陈名杨 来源:公众号【ZJUKG】

Illustration by IconScout Store Delesign Graphics

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线500+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

chenhongyuan@thejiangmen.com

或添加工作人员微信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子因肺栓塞不幸走了!医生:天冷宁愿躺一天,也别干这5事!

女子因肺栓塞不幸走了!医生:天冷宁愿躺一天,也别干这5事!

健康之光
2026-01-13 10:54:55
48小时内4人接连遇难!调查指向同一“元凶”

48小时内4人接连遇难!调查指向同一“元凶”

贵港市消防救援支队
2026-01-18 16:14:33
为夺格陵兰岛 美再挥关税大棒 欧洲8国集体反击

为夺格陵兰岛 美再挥关税大棒 欧洲8国集体反击

极目新闻
2026-01-18 07:16:25
美放弃对伊行动,F-35A集结琉球,侦察船潜入台海

美放弃对伊行动,F-35A集结琉球,侦察船潜入台海

随遇而安之心
2026-01-19 01:01:02
虚晃一枪,不打伊朗了?美军突然在台海出现异动

虚晃一枪,不打伊朗了?美军突然在台海出现异动

兵国大事
2026-01-18 20:11:07
成都警方:两男子为博流量编造熊猫虚假新闻,被行拘

成都警方:两男子为博流量编造熊猫虚假新闻,被行拘

澎湃新闻
2026-01-18 20:02:27
国乒退队潮来袭!6男2女悄悄告别,主力伤病逼出最残酷新老交替

国乒退队潮来袭!6男2女悄悄告别,主力伤病逼出最残酷新老交替

老特有话说
2026-01-18 22:49:06
原来宋祖英年轻的时候,颜值这么能打,而且还是纯天然的

原来宋祖英年轻的时候,颜值这么能打,而且还是纯天然的

东方不败然多多
2026-01-19 00:36:29
血债必须偿还,中方通牒已经发往东京,高市敢做两件事,后果自负

血债必须偿还,中方通牒已经发往东京,高市敢做两件事,后果自负

时时有聊
2026-01-18 13:13:48
2014年,北京女博士李香蓉因接受不了新郎身份,在车内将其几刀刺死

2014年,北京女博士李香蓉因接受不了新郎身份,在车内将其几刀刺死

红豆讲堂
2024-10-14 15:30:03
WTT赛今天继续!国乒27人参加,林诗栋梁靖崑再战,日韩全体放弃

WTT赛今天继续!国乒27人参加,林诗栋梁靖崑再战,日韩全体放弃

全言作品
2026-01-19 00:56:03
军事专家李莉清空账号作品,是频频被打脸到无脸见人了么?

军事专家李莉清空账号作品,是频频被打脸到无脸见人了么?

廖保平
2026-01-16 09:53:38
联盟第一爆冷倒下!维金斯三分立功,亚历山大砍39分,热巴30+12

联盟第一爆冷倒下!维金斯三分立功,亚历山大砍39分,热巴30+12

老梁体育漫谈
2026-01-18 11:54:46
3-5!希金斯连扳两局打出决赛悬念,大师赛冠军归属存悬念!

3-5!希金斯连扳两局打出决赛悬念,大师赛冠军归属存悬念!

世界体坛观察家
2026-01-19 00:41:17
当你接触的人多了,你会明白:如果一个人还在穿5年前的衣服,只说明3个问题

当你接触的人多了,你会明白:如果一个人还在穿5年前的衣服,只说明3个问题

二胡的岁月如歌
2026-01-16 18:51:52
县域资金总量20强排行:昆山存款7800亿,义乌人更爱存钱

县域资金总量20强排行:昆山存款7800亿,义乌人更爱存钱

小蜜情感说
2026-01-19 03:46:23
房价加速下跌!官方:采取有力措施巩固房地产市场止跌回稳态势

房价加速下跌!官方:采取有力措施巩固房地产市场止跌回稳态势

猫叔东山再起
2026-01-17 11:05:08
四川成都一佳人好漂亮,身高168cm,体重47kg 美的让人移不开眼

四川成都一佳人好漂亮,身高168cm,体重47kg 美的让人移不开眼

东方不败然多多
2026-01-07 10:20:04
申军:李昊是邵佳一推荐来当第二门将的,他的心理素质很好

申军:李昊是邵佳一推荐来当第二门将的,他的心理素质很好

懂球帝
2026-01-18 18:00:09
欠薪千万、关店100家!昔日家居龙头的体面,终究是碎了一地

欠薪千万、关店100家!昔日家居龙头的体面,终究是碎了一地

品牌观察官
2026-01-17 18:06:29
2026-01-19 05:12:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2302文章数 596关注度
往期回顾 全部

教育要闻

这锅该谁来背? 12岁女生因英语作业自杀,家长告老师败诉!

头条要闻

特朗普建"联合国"自任主席 邀60国加入仅1国接受

头条要闻

特朗普建"联合国"自任主席 邀60国加入仅1国接受

体育要闻

21年后,中国男足重返亚洲四强

娱乐要闻

香港武打演员梁小龙去世:享年77

财经要闻

BBA,势败如山倒

科技要闻

AI大事!马斯克:索赔9300亿元

汽车要闻

又一次闷声干大事,奇瑞进入2.0 AI+时代

态度原创

家居
房产
旅游
健康
游戏

家居要闻

岁月柔情 现代品质轻奢

房产要闻

真四代来了!这次,海口楼市将彻底颠覆!

旅游要闻

泸溪河畔藏千年,避开商业化,这座千年古镇才是真江南!

血常规3项异常,是身体警报!

《GTA6》两大主角开场任务泄露 60%的建筑可进去

无障碍浏览 进入关怀版