网易首页 > 网易号 > 正文 申请入驻

中科院团队提出CK-PLUG:仅一个参数,实现大模型知识依赖的精准动态调控

0
分享至

在大语言模型(LLMs)检索增强生成(RAG)技术快速迭代的今天,一个根本性难题始终存在困扰 RAG 的可信生成:当模型参数记忆与外部检索知识冲突时,如何实现知识依赖的精准调控?

目前方法只能依赖大模型自身判断知识可信度,这超过了模型能力的范围;并且现有的对齐技术都是单边提升模型的知识偏好,无法有效的实现知识依赖的双向控制。

然而现实场景中,大模型使用者应该根据具体的 RAG 部署场景(如模型先进性、检索质量等)来灵活调控模型更多的相信检索上下文还是自己的参数知识,从而得到更可靠的模型生成。

中科院计算所联合新加坡国立大学、加州大学默塞德分校团队提出创新解决方案CK-PLUG,一个功能强大但随查随用的知识依赖调控技术,仅通过一个参数 token-level 地精准控制语言模型在生成过程中对内外部知识的依赖程度

CK-PLUG 能够在模型生成时自动检测并调整知识冲突,使得模型能够在不同的 RAG 场景下灵活应对,并在准确性和流畅性之间找到最佳平衡。

CK-PLUG 的提出为大语言模型的知识依赖控制技术提供了重要支持,推动了 LLM 向更加智能、可调节的知识生成方向发展。

论文标题: Parameters vs. Context: Fine-Grained Control of Knowledge Reliance in Language Models 论文链接: https://arxiv.org/pdf/2503.15888 代码链接: https://github.com/byronBBL/CK-PLUG
一、引言

图1. LLM 很难在参数化知识和上下文知识之间确定优先级,尤其是在面对过时的参数或误导性的上下文时,这降低了现实场景中的可靠性

检索增强生成(Retrieval-Augmented Generation, RAG)作为大语言模型(LLMs)应用的关键技术,通过结合外部知识与语言模型的生成能力,显著提高了文本生成的准确性。然而,外部上下文与模型内部知识之间的冲突问题严重影响了生成结果的可靠性,常导致事实矛盾或逻辑谬误。

当前技术面临的核心挑战在于知识依赖的不可控性:依赖模型内部知识难以有效处理知识更新缓慢的问题,而过于依赖检索上下文又容易受到低质量信息的干扰。如图 1 所示,当模型知识库过时但检索质量高时,应倾向采纳外部知识;反之,在检索结果存在大量噪声时,则应优先依靠模型内部知识。

现有方法(如通过对齐技术实现单一维度的 factuality、faithfulness 优化)通常缺乏灵活、双向的动态知识依赖控制能力,严重限制了 RAG 系统在实际应用中的表现。

为此,我们提出了 CK-PLUG,一种在推理阶段进行知识依赖动态控制的有效方法,其创新点包括:

  • 置信增益度量(Confidence-Gain):通过衡量插入外部上下文后参数感知令牌的信息增益,量化模型参数知识与外部上下文之间的一致性,从而有效检测知识冲突。

  • 知识可控调制机制:基于可调参数 对参数依赖与上下文依赖的预测分布进行精细的加权融合,实现对知识偏好的灵活动态控制。

  • 自适应平衡策略:引入基于熵的自动化置信评估模块,自适应选择最佳的知识依赖策略,无需手动调参,有效降低系统部署难度。

具体而言,CK-PLUG 通过Confidence-Gain指标准确检测知识冲突,保留具有正置信度增益(表明参数知识与外部知识一致)的令牌,并对负置信度增益(参数与外部知识冲突)的令牌动态调整预测策略。

对于后者,CK-PLUG 利用可调参数 实现了参数感知与上下文感知概率分布的精细配比融合。同时,CK-PLUG 还提供了无需人工干预的自适应模式,通过熵值置信评估实现内部知识和外部上下文的自动平衡。

在实际的 RAG 任务评测中,CK-PLUG 表现出明显的优势:在手动的 控制下,该框架在具有反事实检索上下文的 QA 任务的记忆召回(MR)中实现了大幅度的调整。

例如,在 LLaMA3-8B-instruct上,CK-PLUG 将 MR 从 9.89% 调制到 71.93%,明显区别于 42.09% 的基线 MR。在自主模式( -free)下,CK-PLUG 则能在六个不同的 RAG 下游任务中持续实现性能的稳定提升。

此外,我们通过深入的解释性分析进一步阐明了 CK-PLUG 实现有效知识依赖控制的内在机制。综上所述,CK-PLUG 为推动大模型在知识可控性和可信生成能力方面的实际应用,提供了一种更具普适性和实用性的方案。

二、基于置信增益的冲突检测

作者首先提出了一种知识冲突检测机制,作为 CK-PLUG 激活控制的开关。该机制可以有效识别模型参数知识与检索到的外部上下文之间存在潜在冲突的令牌,以进行针对性的干预,避免全局调整导致的生成质量崩溃。

首先作者定义两种预测概率分布

  • 参数化分布:仅基于输入问题 的模型预测概率,反映模型内部知识。

  • 上下文增强分布:结合问题 与检索上下文 的预测概率,融合内外知识。

基于上述定义,图 2 可以很好反映插入不同上下文后关键 token 预测概率分布的熵变化:

  • 冲突上下文:增加熵值,概率分布更无序,模型对答案更不确定。

  • 支持上下文:显著降低熵值,模型因内外知识一致而更自信。

图2. 在纳入冲突或支持上下文后,知识敏感令牌的概率分布熵的变化

基于定义置信增益(CG)为上述两种分布的熵之差,衡量上下文引入后模型置信度的变化:

CG > 0表示外部上下文增强模型置信度(支持性知识);CG < 0或低于阈值)则意味外部上下文引发潜在冲突,导致置信度下降(冲突性知识)。图 3 展示了两种类型的冲突检测实例。

图3. 在 LLaMA3-8B 上对两种类型的冲突上下文下生成的令牌的置信度增益的说明,证明了在检测潜在知识冲突方面的有效性 三、CK-PLUG:参数和上下文的依赖调制

CK-PLUG 在下一令牌预测阶段,对于检测到有潜在冲突的 token 通过调制参数感知与上下文感知的概率分布,实现精细的知识依赖控制,图 4 清晰的展示 CK-PLUG 的框架。

图4. CK-PLUG 控制 LLM 输出中知识依赖的实例。在令牌生成过程中,它检测潜在的冲突并调节冲突令牌的概率分布。调制首先计算上下文感知分布,然后通过基于调优参数的加权和将其与参数感知分布集成。

首先,定义参数感知的对数概率分布为:

而上下文感知的概率分布则通过从整体对数概率分布中剥离参数贡献来获得:

如图 4 所示,CK-PLUG 的核心思想是通过调制上述两个分布的权重,针对可能存在知识冲突的令牌进行干预。具体计算公式如下:

其中,置信增益(CG)用于指示外部上下文是否引入了知识冲突。调制函数 定义为:

其中 为自适应合理性约束:

通过可调超参数 ,用户可实现灵活的知识依赖调控。增大 使模型更依赖参数知识,减小 则更倾向于检索上下文知识,从而有效处理知识冲突问题。

此外,CK-PLUG 还提供了一种自适应模式,基于熵值自动平衡参数与上下文依赖,无需手动设置 ,显著增强了系统的实用性和可信度。具体实现为通过基于熵的困惑度来自动化配置 :

四、实验

作者在广泛的注入反事实上下文的 RAG 任务(NQ、ConFIQA、MQuAKE)以及通用的 RAG 任务(NQ、HotpotQA、FEVER、T-REX、ELI5、WOW)上分别全面地评估了 CK-PLUG 对 LLMs 的知识依赖调控自适应增强能力。

除此之外,作者设计知识捕获算法进行了深入的可解释研究,部分任务表现和解释分析的实验结果如下表所示。更多结果烦请移步我们的文章或代码。

表1. CK-PLUG 在各注入反事实上下文的数据集上的知识依赖调控效果

图5. CK-PLUG 在关键知识 token 上的解释性分析展示

来源:公众号【PaperWeekly】

llustration From IconScout By IconScout Store

-The End-

本周上新!

扫码观看!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线500+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

melodybai@thejiangmen.com

或添加工作人员微信(yellowsubbj)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
雷军带火蕉内滑雪服:客服表示299元优惠已结束,当前为629元

雷军带火蕉内滑雪服:客服表示299元优惠已结束,当前为629元

PChome电脑之家
2026-02-24 17:02:37
400亿!沈腾彻底飞驰了

400亿!沈腾彻底飞驰了

华商韬略
2026-02-25 10:34:36
大年初三失联的四川26岁男子已离世,被发现地方距家并不远

大年初三失联的四川26岁男子已离世,被发现地方距家并不远

大象新闻
2026-02-25 16:21:04
仅2小时微塑料就可入侵大脑!医生:家里有这几种物品,赶紧丢掉

仅2小时微塑料就可入侵大脑!医生:家里有这几种物品,赶紧丢掉

垚垚分享健康
2026-02-25 10:11:10
0比3惨败震惊乒坛!王艺迪关键战失利,状态下滑引发热议

0比3惨败震惊乒坛!王艺迪关键战失利,状态下滑引发热议

卿子书
2026-02-25 08:43:09
深夜十点!宏远陈老板宣布新决定,朱芳雨正式行动,徐杰最新伤情

深夜十点!宏远陈老板宣布新决定,朱芳雨正式行动,徐杰最新伤情

多特体育说
2026-02-25 22:03:36
文科生 72 小时杀入 GitHub 全球榜:我没写一行代码,但指挥了一支 AI 军队

文科生 72 小时杀入 GitHub 全球榜:我没写一行代码,但指挥了一支 AI 军队

极客公园
2026-02-24 12:13:10
逛公园要先付69元拍照费?深圳一免费公园现收费“园中园”引质疑

逛公园要先付69元拍照费?深圳一免费公园现收费“园中园”引质疑

深圳晚报
2026-02-25 12:16:54
春晚已经播完8天了,这5人成最大受益者,有人从低谷成功翻身!

春晚已经播完8天了,这5人成最大受益者,有人从低谷成功翻身!

叨唠
2026-02-24 17:38:34
新娘爸爸婚礼现场退还18.8万彩礼?新娘回应:是真的,一开始就没想过要收彩礼

新娘爸爸婚礼现场退还18.8万彩礼?新娘回应:是真的,一开始就没想过要收彩礼

扬子晚报
2026-02-25 07:33:40
吵架将孩子扔河里后续:原因曝光,夫妻身份被扒,娃状态让人担忧

吵架将孩子扔河里后续:原因曝光,夫妻身份被扒,娃状态让人担忧

社会日日鲜
2026-02-24 09:37:52
大战可能马上开始了

大战可能马上开始了

安安说
2026-02-25 10:11:39
张兰惹争议!称马筱梅顺产15分钟无痛生娃,睁眼照不像爸爸!

张兰惹争议!称马筱梅顺产15分钟无痛生娃,睁眼照不像爸爸!

古希腊掌管月桂的神
2026-02-25 14:13:50
跌成白菜价,也没人买?14亿人输给3亿美国人,电视到底怎么了?

跌成白菜价,也没人买?14亿人输给3亿美国人,电视到底怎么了?

百科密码
2026-02-23 16:49:28
离婚才几年,杨颖这是怎么了?

离婚才几年,杨颖这是怎么了?

文刀万
2026-02-24 17:40:03
斯诺克16强战况:中国名将3-1逆转晋级

斯诺克16强战况:中国名将3-1逆转晋级

阿嚼影视评论
2026-02-25 20:26:11
宝马车顶载21只鸡鸭鹅开800公里返程 一路被网友拍下 当事人:都是爷爷奶奶特意准备的

宝马车顶载21只鸡鸭鹅开800公里返程 一路被网友拍下 当事人:都是爷爷奶奶特意准备的

闪电新闻
2026-02-25 17:21:14
15天310万!赵心童请6名中国球员吃饭 10连胜冲93万奖金+3连冠

15天310万!赵心童请6名中国球员吃饭 10连胜冲93万奖金+3连冠

念洲
2026-02-25 09:16:03
詹姆斯:东契奇最后机会不错没找好节奏 我接球后也有点失去平衡

詹姆斯:东契奇最后机会不错没找好节奏 我接球后也有点失去平衡

罗说NBA
2026-02-25 14:53:00
中央三部门重磅定调:公务员不允许弹性延迟退休!

中央三部门重磅定调:公务员不允许弹性延迟退休!

浅深说
2026-02-24 13:12:00
2026-02-25 23:11:00
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2302文章数 596关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

美官员称6个月内三国政府或被亲美政权取代 中方回应

头条要闻

美官员称6个月内三国政府或被亲美政权取代 中方回应

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

上海楼市放大招,地产预期别太大

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

亲子
游戏
本地
数码
公开课

亲子要闻

宝妈必学,孩子这样不是偏激而是应激!

玩家拿首份工资预购《生化9》!功勋制作人亲自回复

本地新闻

津南好·四时总相宜

数码要闻

2026款联想YOGA Pro 15/16笔记本电脑预热

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版