网易首页 > 网易号 > 正文 申请入驻

宾大联合UCLA提出新型推理框架,助力大模型解决专业领域推理难题

0
分享至

最近两年,尽管大语言模型在各类问答和生成任务中的表现已有显著提升,但其在需要高专业度和强推理性的任务中仍然面临挑战。

近期,美国宾夕法尼亚大学博士研究生贺家澍及其所在课题组,提出了一种名为图启发式可信度外推(GIVE,Graph Inspired Veracity Extrapolation)的新型推理框架。

具体来说,该框架旨在解决三方面问题:

其一,结合有限外部信息与内部知识。

该团队的研究目标是,在仅有少量外部信息可用的情况下,依然能让模型产生准确且连贯的推理过程。

其中,之所以强调“有限”外部信息,是因为在实际场景中,详尽的知识库或文献资源并不总是容易获得。

其二,保证推理过程的“忠实性”。

由于传统的提示词工程方法,不足以保证模型给出的思维链完全依据事实或专业知识,因此他们希望通过结构化的方式,将有限的外部信息当作一种“提示”,通过与模型内部知识有效结合,以减少不实内容的出现。

其三,应对专业领域的推理难题。

实际上,在如生物医药等专业度高的领域,问答任务往往需要跨越多个概念和关系,数据也往往呈现稀疏或难以收集的特征。

所以,如何在有限数据条件下开展多层次或多阶段推理,是他们希望重点解决的难题。

近日,相关论文以《GIVE:基于知识图谱启发的可信度外推的结构化推理》(GIVE: Structured Reasoning with Knowledge Graph Inspired Veracity Extrapolation)为题在预印本平台arXiv上发表 [1]。

来自宾夕法尼亚大学的贺家澍和 UCLA 的马明宇分别是第一作者和第二作者,宾夕法尼亚大学亚历桑德罗·里贝罗(Alejandro Ribeiro)教授担任通讯作者。

总的来看,GIVE 主要实现了以下几项创新。

首先,引入知识图谱,提供结构化提示。

与文本形式的知识库相比,知识图谱在概念及其关系上具有更明确的结构性。将其用作“提示”,可以帮助模型更便捷地发掘关键词之间可能存在的关联。

一旦关键词被知识图谱连接在一起,模型就能更加顺畅地展开“慢思考”,并逐步推导出完整的推理链。

其次,兼顾内部与外部知识的优势。

对于该课题组而言,其并不假设外部信息足以提供完备的推理链,而是将其视作与内部知识协同的“补充”与“催化剂”。

这不但节约了构建大规模知识库的成本,也让大语言模型原本在预训练中学到的丰富语义信息得以充分发挥。

再次,发散性思维与多阶段推理。

借助知识图谱的高结构化,该研究让模型能够围绕与关键词相关的概念进行发散性搜索,并逐步缩小范围,形成更加精确和可信的推理过程。对复杂任务而言,这种逐步扩展与筛选的过程尤为重要。

“我们在 PubMedQA 数据集上的实验非常成功:只用了一个包含 135 个节点的稀疏知识图谱,就让 GPT3.5T 的准确度达到了可媲美甚至超越 GPT4 的水平。”贺家澍表示。

很明显,通过引入知识图谱作为结构化提示,该团队在“有限外部信息”与“模型内部知识”之间找到了平衡,让模型更灵活、高效且具有可解释性。

这样的方法,不仅能为生物医药等专业领域的问答与推理任务提供新思路,也为未来在更多知识密集型任务中平衡成本与准确性、泛化性与可解释性提供了借鉴价值。

贺家澍表示,该论文在发表后,已经有相关企业基于他们的方法,成功解决了业务中面临的实际问题。

例如,美国初创公司 Lamics 旨在通过为临床医生提供自动病例记录来减少保险拒赔,增加医疗保险透明度。

其通过实施 GIVE,开发了一套整合稀疏知识图与现有系统的定制化解决方案,能够帮助理解医疗编码间的复杂依赖关系、有效应对数据稀疏、提高合规性与准确性等。

贺家澍表示,好的科研离不开团队成员的共同努力。“从确定研究问题到论文发表,我和明宇进行了不计其数的头脑风暴,许多细节都经过反复的实验和推敲,才从利用知识图谱进行推理的初步思想逐步构建出了 GIVE 的框架。”

另外,基于目前的研究,贺家澍也介绍了后续计划:将 GIVE 中图谱启示的理念与强化学习训练过程结合,让模型在生成思维链的同时,能根据知识图谱给出的提示进行“修正”或“补充”。

“如果能够在模型的后训练过程中就把 GIVE 的理念融入进去,让模型‘学会’如何高效利用外部信息来进行推理,那么在调用阶段无需再额外执行繁琐的外部信息处理流程,这有望进一步降低推理成本,推动构建具有‘高推理能力’的下一代模型。”贺家澍如是说。

参考资料:

1.He J, Ma M D, Fan J, et al. GIVE: Structured Reasoning with Knowledge Graph Inspired Veracity Extrapolation.arXiv:2410.08475, 2024.https://doi.org/10.48550/arXiv.2410.08475

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大结局要来了?伊朗开出六大停战条件,特朗普回应4个字

大结局要来了?伊朗开出六大停战条件,特朗普回应4个字

混沌录
2026-03-25 16:22:08
美日达成一致,特朗普让日本在台海“打响第一枪”!中方反击到了

美日达成一致,特朗普让日本在台海“打响第一枪”!中方反击到了

寻迹追心
2026-03-26 09:15:11
黄金跳水跌破4430美元,白银失守70美元

黄金跳水跌破4430美元,白银失守70美元

21世纪经济报道
2026-03-26 14:15:54
现货黄金突破4540美元/盎司

现货黄金突破4540美元/盎司

证券时报
2026-03-26 09:22:05
你知道我在床上有多厉害吗?

你知道我在床上有多厉害吗?

果粉之家
2026-03-20 12:35:16
特斯拉车主被售后暖到,15 万元电池免费换,还送带 FSD 的 Model 3 代步!

特斯拉车主被售后暖到,15 万元电池免费换,还送带 FSD 的 Model 3 代步!

新浪财经
2026-03-25 01:53:52
王国本:江西省人大常委会原副主任

王国本:江西省人大常委会原副主任

王姐懒人家常菜
2026-03-26 13:38:47
国安名宿炮轰:中超边路断档!认可杨希实力,邓捷夫是“半吊子”

国安名宿炮轰:中超边路断档!认可杨希实力,邓捷夫是“半吊子”

体坛鉴春秋
2026-03-26 12:23:21
1981年,彭真狱中见江青,江青出言不逊提出:我要见华国锋邓小平

1981年,彭真狱中见江青,江青出言不逊提出:我要见华国锋邓小平

微野谈写作
2026-01-27 06:00:03
王晶曝陈百强真正死因,64岁何超琼颜面尽失

王晶曝陈百强真正死因,64岁何超琼颜面尽失

君笙的拂兮
2026-03-22 03:44:36
以色列真敢丢核弹!美国顶流媒体警告:四种情况下以色列会动核武

以色列真敢丢核弹!美国顶流媒体警告:四种情况下以色列会动核武

星辰大海路上的种花家
2026-03-25 13:09:41
20亿美元还不够!中企宣布,对巴拿马索赔涨价,巴政府内部已乱套

20亿美元还不够!中企宣布,对巴拿马索赔涨价,巴政府内部已乱套

李健政观察
2026-03-26 11:11:27
以色列批准战争期间征召40万名预备役人员!美国陆军将新兵征召年龄上限从35岁提升至42岁,还给曾犯大麻持有罪的人开绿灯

以色列批准战争期间征召40万名预备役人员!美国陆军将新兵征召年龄上限从35岁提升至42岁,还给曾犯大麻持有罪的人开绿灯

大象新闻
2026-03-25 22:45:22
稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

田先生篮球
2026-03-26 14:23:29
中东睿评|表层冲突烈火焚烧,深层矛盾坚如寒冰:美以对伊朗战争的表与里

中东睿评|表层冲突烈火焚烧,深层矛盾坚如寒冰:美以对伊朗战争的表与里

澎湃新闻
2026-03-25 13:14:37
马刺大胜送灰熊出局,本赛季常规赛西部前十球队已全部出炉

马刺大胜送灰熊出局,本赛季常规赛西部前十球队已全部出炉

懂球帝
2026-03-26 12:27:11
同样是妹妹,王熙凤为何称呼薛宝钗为薛姑娘,称呼林黛玉为林丫头

同样是妹妹,王熙凤为何称呼薛宝钗为薛姑娘,称呼林黛玉为林丫头

铭记历史呀
2026-03-26 11:13:56
玄学提醒:如果一个人还在穿着10年前的衣服,只说明3个问题

玄学提醒:如果一个人还在穿着10年前的衣服,只说明3个问题

洞读君
2026-03-04 14:30:12
昨天杭州有医院门诊突然多了不少“跑友”,主动要求检查心脏功能!医生:长期跑步不等于心肺功能没问题

昨天杭州有医院门诊突然多了不少“跑友”,主动要求检查心脏功能!医生:长期跑步不等于心肺功能没问题

大风新闻
2026-03-26 08:55:08
等不来特朗普,普京抢先一步来华!美国终于认栽:拦不住中国了

等不来特朗普,普京抢先一步来华!美国终于认栽:拦不住中国了

小聪明说科普
2026-03-25 17:19:57
2026-03-26 14:59:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16487文章数 514797关注度
往期回顾 全部

教育要闻

教育部确保2小时课间15分钟落到每所学校

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
本地
时尚
公开课
军事航空

艺术要闻

哪一座桥不是风景?

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

2026年了,最好看的还是“这件针织”!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版