网易首页 > 网易号 > 正文 申请入驻

AAAI 2025 | TrustUQA:统一结构化数据问答的可信框架

0
分享至

结构化数据问答(TableQA、KGQA、TKGQA 等)在学术界与工业界备受关注。结构化知识问答方法如NL2Query针对特定数据类型将问题转化为对应查询函数,这限制了实际场景中的通用性。随着LLM和RAG方法的发展,一些更加通用的方法被提出,但依然存在如下问题:

  • 检索到无关知识或LLM训练参数本身导致导致LLM幻觉

  • 将结构化数据暴露到第三方LLM中,可能产生隐私数据泄漏

  • 通过结构化数据很难提供高质量的问题解释

因此,我们提出TrustUQA,统一结构化数据问答的可信框架,可以同时支持不同类型的结构化数据表示与问答,在提供可信的推理基础上最大程度避免数据泄露。

论文题目: TrustUQA: A Trustful Framework for Unified Structured Data Question Answering 论文链接: https://arxiv.org/abs/2406.18916 代码链接: https://github.com/zjukg/TrustUQA

一、方法

图1 TrustUQA流程图

TrustUQA的整体框架如图1所示,主要由三部分组成:

  • 通过条件图(Condition Graph, 简称CG)实现结构化知识的统一表示。

  • 提出两阶段查询函数实现结构化知识的统一推理与问答。

  • 提出动态样例检索器进一步提升LLM生成查询函数的准确率。

条件图定义与结构化数据转换规则

条件图表示带标签的有向图 , 其中 为节点, 为条件三元组。条件图的定义如下

  • 对于节点: 有明确的语义信息, 如:实体(Earth)、关系(has friends)、属性(time)、数值(2024)

  • 对于条件三元组:表示为,即 和 由于 相连。同时如果condition可以为空 表示 和 相连无需额外条件。

将不同结构化数据转换为条件图

  • 对于表格,如图2所示,每行添加等于行顺序的序号,并为除了第一行以外的每个表格的值生成两个条件三元组,即

图2 表格转换为条件图

  • 对于知识图谱,如图3所示,知识图谱中的所有元素都为条件图中的节点 ,其中条件三元组为

图3 知识图谱转换为条件图

  • 对于时序知识图谱,时序知识图谱中的所有元素都为条件图中的节点,除知识图谱部分转换之外,还将起始时间、终止时间、时间等信息转换为条件三元组

两阶段查询函数

通过两阶段查询函数实现结构化知识推理与问答。首先通过LLM生成一阶段查询函数,后通过预定义的规则将一阶段查询函数转化为二阶段可执行函数,得到问题答案。

在一阶段查询函数,我们设计如下搜索函数从条件图中搜索信息:

除上述搜索函数之外,我们还设计了集合操作函数及数值计算函数。

在二阶段查询函数,搜索函数将转化为以下可执行函数:

  • :返回 中的节点 ,默认情况下 表示所有条件事实

  • :返回满足 要求的 ,即 ( n o d e 1 , n o d e 2 , ?)

  • 查询比较函数,返回True或False

表1 两阶段查询函数转化规则

两阶段查询函数转化规则如表1所示。

动态样例检索器

不同Few-shot样本对LLM的In-Context Learning影响明显,本文提出了动态演示检索器,从训练数据集 中检索与问题 的 个最相似的问题。具体来说,给定一个问题 ,我们使用文本编码器 将 和训练问题编码为向量,通过计算问题向量的相似度,并选择 个最相似的训练问题,其中 。之后,对训练问题迭代生成一阶段查询,如果查询结果与标记的答案一致,则将检索到的问题与对应查询作为少样本样例,提升LLM生成查询函数的准确率。

二、实验结果

我们选用gpt-3.5-turbo-0613作为基础模型进行试验,并选择SentenceBERT作为检索器,在三种结构化数据问答任务:表格问答(WikiSQL,WTQ)、知识图谱问答(MetaQA,WebQSP),时序知识图谱问答(CronQuestion)中5个数据集上进行试验,实验结果如下:

表2 表格问答实验结果

表格问答实验结果如表2所示,TrustUQA在WikiSQL数据集中表现优于其他统一的问答方法,但在WTQ中仍有差距。

表3 知识图谱问答实验结果

知识图谱问答实验结果如表3所示,TrustUQA在MetaQA下的表现有更强竞争力,但在WebQSP效果显著。

表4 时序知识图谱问答实验结果

时序知识图谱问答实验结果如表4所示,我们的方法在各类指标下均取得最优结果。

表5 消融实验

表5所示的消融实验分别对个模块进行消融,实验表明动态检索和两阶段查询函数的有效性。

图4 参数及效率分析

为进一步探索试验对超参的敏感性,图4为各个参数(样例数量、重试次数、自适应数量)及每个步骤时间的分析,进一步验证方法的高效性。

图5 错误分析

图5展示了在运行过程中的3种错误类型,其中出现错误类型最多的是查询生成错误

图6 跨结构化数据问答分析

在文章最后,我们还探索了TrustUQA在混合结构化数据上的QA和跨结构化数据的QA方面的潜力。如图6所示,解答图中的问题依次需要用到表格、知识图谱、时序知识图谱中的数据,通过TrustUQA可以实现跨结构化数据的问答,证明TrustUQA跨结构化数据的问答的潜力。

三、总结与展望

在本文中,我们提出了名为TrustUQA的统一的结构化数据问答的可信框架,其基于一种全新的、通用的数据表示方法——条件图及两阶段查询函数。通过实验证明了TrustUQA在不同类型的结构化数据上的有效性,并展示了处理更一般和更具挑战性的场景的潜力。在未来,我们将探索混合结构化数据问答和跨结构化数据问答等更具挑战性的场景,使得更接近实际应用。

作者:张文,金龙‍‍‍ 来源:公众号【ZJUKG 】

llustration From IconScout By IconScout Store

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(

www.techbeat.net
) 。 社区上线600+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

melodybai@thejiangmen.com

或添加工作人员微信(yellowsubbj)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美不准中国买伊石油?不到24小时伊朗火速致电中国,中方只回一句

美不准中国买伊石油?不到24小时伊朗火速致电中国,中方只回一句

近史博览
2026-04-18 03:32:20
拒不报销?国民党主席郑丽文访问花费480万元新台币

拒不报销?国民党主席郑丽文访问花费480万元新台币

小马姨
2026-04-17 11:30:29
内塔尼亚胡:在特朗普的请求下同意

内塔尼亚胡:在特朗普的请求下同意

第一财经资讯
2026-04-17 08:12:01
那晚我住女朋友家,她妈说你俩今晚敢睡一个被窝,我就掀你们被子

那晚我住女朋友家,她妈说你俩今晚敢睡一个被窝,我就掀你们被子

千秋文化
2026-04-16 20:08:23
看!波兰超模阿里亚纳的惊艳写真,身材让人心动不已!

看!波兰超模阿里亚纳的惊艳写真,身材让人心动不已!

国际艺术大观
2026-04-16 00:10:27
特朗普对全球下令,180天内废掉中方王牌,美媒

特朗普对全球下令,180天内废掉中方王牌,美媒

往事我敬你一杯酒人
2026-04-17 20:13:14
西伯利亚:吃不完的鹿肉,收不完的粮;砍不完的森林,挖不完的矿

西伯利亚:吃不完的鹿肉,收不完的粮;砍不完的森林,挖不完的矿

小莜读史
2026-04-17 20:53:45
本田被曝将关停广州、武汉两座燃油车工厂 年产能砍至72万辆

本田被曝将关停广州、武汉两座燃油车工厂 年产能砍至72万辆

金融界
2026-04-17 13:45:07
一台卖4000块还被疯抢,国产激光灭蚊神器,凭什么在海外爆单?

一台卖4000块还被疯抢,国产激光灭蚊神器,凭什么在海外爆单?

Thurman在昆明
2026-04-17 18:35:13
弃伦纳德?勇士休赛期计划曝光:再追詹姆斯!只因他更配库里+追梦格林

弃伦纳德?勇士休赛期计划曝光:再追詹姆斯!只因他更配库里+追梦格林

冷桂零落
2026-04-18 02:41:46
特朗普14日访华,普京随后到,遗憾拒在华会晤

特朗普14日访华,普京随后到,遗憾拒在华会晤

无情有思可
2026-04-16 13:40:56
天啊!看到1987年春晚观众席的迟重瑞,才懂陈丽华为啥一见钟情

天啊!看到1987年春晚观众席的迟重瑞,才懂陈丽华为啥一见钟情

真的八卦小学弟
2026-04-12 00:30:12
俞强声叛逃美国始末:一场美人计,让谍王37年潜伏功亏一篑

俞强声叛逃美国始末:一场美人计,让谍王37年潜伏功亏一篑

干史人
2026-04-14 15:05:03
首钢总经理:李楠对过去发生事情有很深刻反思 自己也有很深的沉淀

首钢总经理:李楠对过去发生事情有很深刻反思 自己也有很深的沉淀

狼叔评论
2026-04-17 15:44:06
王传福官宣:比亚迪全固态电池已造出,续航超1200公里

王传福官宣:比亚迪全固态电池已造出,续航超1200公里

生活魔术专家
2026-04-17 13:47:08
紫牛头条|男子转让自己买的自行车坐垫被厂家告了,说是假货索赔2万

紫牛头条|男子转让自己买的自行车坐垫被厂家告了,说是假货索赔2万

扬子晚报
2026-04-16 17:30:22
NBA官网预测附加赛:勇士晋级首轮战雷霆 黄蜂搭上东部末班车

NBA官网预测附加赛:勇士晋级首轮战雷霆 黄蜂搭上东部末班车

罗说NBA
2026-04-17 11:14:41
朱迅抗癌20年首曝真相:7次手术,每天只吃七分饱,坚决不碰烫食

朱迅抗癌20年首曝真相:7次手术,每天只吃七分饱,坚决不碰烫食

观鱼听雨
2026-04-17 22:29:40
大快人心!许家印结局已定,3个女人被他连累,才懂白珊珊有多冤

大快人心!许家印结局已定,3个女人被他连累,才懂白珊珊有多冤

风信子的花
2026-04-16 16:37:45
中国建筑中标阿联酋首个高铁项目

中国建筑中标阿联酋首个高铁项目

GA环球建筑
2026-04-17 22:16:10
2026-04-18 04:48:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2347文章数 596关注度
往期回顾 全部

科技要闻

7家头部平台被罚没35.97亿元

头条要闻

知情人:伊朗为霍尔木兹海峡通行设定三个条件

头条要闻

知情人:伊朗为霍尔木兹海峡通行设定三个条件

体育要闻

中超-泰山1-1海港 杨希处子球克雷桑任意球扳平

娱乐要闻

刘德华挚友潘宏彬离世 曾一起租房住

财经要闻

"影子万科"2.0:管理层如何吸血万物云?

汽车要闻

又快又稳的开挂动力! 阿维塔06T全系搭分布式电驱

态度原创

旅游
健康
家居
房产
手机

旅游要闻

三月三登泰山!蟠桃会+古风巡游惊艳出圈

干细胞抗衰4大误区,90%的人都中招

家居要闻

法式线条 时光静淌

房产要闻

重磅利好!2500个学位,海口滨江片区,要建九年一贯制学校!

手机要闻

vivo万级电池新机曝光:10200mAh电池+90W快充,友商接得住吗!

无障碍浏览 进入关怀版