网易首页 > 网易号 > 正文 申请入驻

句子级溯源+生成式归因,C²-Cite重塑大模型可信度

0
分享至



在人工智能快速发展的今天,大语言模型已经深入到我们工作和生活的方方面面。然而,如何让AI生成的内容更加可信、可追溯,一直是学术界和工业界关注的焦点问题。想象一下,当你向ChatGPT提问时,它不仅给出答案,还能像学术论文一样标注每句话的信息来源——这就是"溯源大语言模型"要解决的核心问题。

北邮百家AI团队联合小米大模型团队提出的溯源大模型C²-Cite,首创上下文感知的归因生成技术,不仅能让大模型在生成内容时自动标注精准的信息来源,更能确保生成内容与引用的外部知识高度语义对齐,实现每一处表述都有溯源依据、与参考来源深度协同,从根本上解决大模型生成内容的可信度问题。该工作已被国际顶级会议WSDM 2026收录。C²-Cite针对现有归因模型存在的关键缺陷,通过引入"上下文感知"机制,让引用标记从被动的占位符转变为带有上下文语义的特殊令牌,显著提升了引用质量和模型回答准确性。



  • 论文标题:

C²-Cite:Contextual-Aware Citation Generation for Attributed Large Language Models

  • 论文链接:

https://github.com/BAI-LAB/c2cite/blob/main/paper_wsdm_c2cite.pdf

  • 代码仓库:

https://github.com/BAI-LAB/c2cite

引言

在信息爆炸的时代,大语言模型虽然能够生成流畅的文本,但"幻觉"问题(即生成虚假或不准确的内容)始终困扰着研究者。为了增强模型输出的可信度,研究人员提出了归因技术——在生成内容中添加明确的引用标记(如[1]、[2]),将每句话链接到具体的信息源。然而现有归因模型存在显著缺陷:

1.技术路径存在固有局限:上下文学习归因(P-ICL/I-ICL)依赖提示工程或迭代检索,耗时且泛化性弱;指令微调归因过度依赖高质量训练数据,缺乏对引用上下文的主动关联,大大削弱大模型的溯源能力;事后归因(Post-Hoc)采用两阶段处理,难以精确到句子级别,缺乏内在归因能力。

2.引用标记沦为“通用占位符”:现有模型未赋予引用标记(如 [i])上下文语义,仅将其视为无意义符号,导致引用与所指内容脱节、知识整合效果差;

3.引用质量与回答准确性失衡:部分模型虽能提升引用精准度,但会破坏回答的语义连贯性和正确性;另一部分模型则因引用混乱,难以支撑回答可信度;

这些问题导致现有模型要么引用错误/ 虚构、溯源失效,要么回答逻辑断裂、准确性下滑,难以同时满足 “引用可信” 与 “回答有效” 的核心需求。

C²-Cite溯源机制

为解决上述缺陷,北邮百家AI团队联合小米提出上下文感知的溯源大模型框架(C²-Cite),核心思路是通过“上下文语义融入” 让引用标记从被动占位符转变为带有明确语义指向的主动知识指针,具体包含三大关键组件:

1.上下文感知嵌入机制(Contextual-Aware Embedding):将多令牌引用标记(如“[i]”)标准化为单一引用符号令牌(如“ᵢ>”),并通过均值池化计算对应检索文档的语义嵌入,替换传统无意义占位符嵌入,使引用标记携带所指文档的语义信息;

2.上下文引用对齐机制Contextual Citation Alignment:引入引用路由器(二进制分类器)区分默认令牌与引用令牌,分别优化两类令牌的损失函数—— 默认令牌采用交叉熵损失保证回答流畅性,引用令牌通过语义相似度匹配实现与检索文档的精准对齐;

3.上下文注意力增强机制:通过距离衰减系数和注意力约束,放大后续生成令牌对先前引用令牌的关注度,维持引用与内容的语义连贯性,避免因引用插入导致回答逻辑断裂。

模型最终损失函数为默认损失、引用对齐损失、路由器损失与注意力增强损失的加权和,确保引用质量与回答准确性的协同优化。



实验

研究团队在ALCE基准测试的三个数据集(ASQA、ELI5、QAMPARI)上进行了全面评估,对比了多种主流归因方法

3.1 主实验结果



实验结果令人振奋:

  • 引用质量大幅提升:C²-Cite++在引用F1分数上平均提升5.8%
  • 回答准确性显著增强:在回答正确性指标上平均提升17.4%
  • 泛化能力强:在不同质量的训练数据(SynSciQA 系列)上均表现稳定,即使使用普通训练数据也能超越依赖高质量数据的传统微调模型。

3.2 效率分析

在保证效果的同时,C²-Cite++还展现出卓越的计算效率。吞吐量(每秒处理样本数)测试显示,相比需要多轮迭代的方法(如Blueprint),C²-Cite++实现了最高的处理速度,在实际应用中具有明显优势。



3.3溯源生成模型中注意力模式的转变

注意力热力图可视化,直观展示了C²-Cite的工作机制。在原生LLM中,引用符号前后的句子几乎没有交互;而在C²-Cite中,后续句子对前文的注意力显著增强,形成了紧密的语义连接。这种"跨引用的语义桥梁"正是模型生成高质量溯源内容的关键。



总结

C²-Cite框架通过"上下文感知"这一核心理念,成功解决了现有归因大语言模型的关键痛点:

  • 从符号到语义:将引用标记从被动占位符转化为主动知识指针
  • 精准对齐:通过路由机制确保引用编号与文档内容的准确匹配
  • 语义连贯:利用注意力增强保持引用前后内容的流畅性
  • 双重优化:同时提升引用质量和回答准确性,而非顾此失彼

最后,仅仅优化训练数据是不够的,大模型的溯源能力需设计有效的学习机制。相比于复杂的数据合成流程,C²-Cite通过其"上下文感知"的设计思想,在内容生成的过程依赖可靠的引用知识库,为构建更加可靠、透明的AI溯源系统提供了重要的技术路径。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
电视剧《太平年》没人敢拍的五代十国,才是真正的魔鬼乱世

电视剧《太平年》没人敢拍的五代十国,才是真正的魔鬼乱世

白羽居士
2026-01-24 21:26:13
睡完首富睡首相:从厂妹到顶级名媛,靠男人捞到268亿,她凭什么

睡完首富睡首相:从厂妹到顶级名媛,靠男人捞到268亿,她凭什么

深度报
2026-01-21 22:54:05
王楠没想到,她养大、不让打乒乓球的儿子,如今成全家的骄傲

王楠没想到,她养大、不让打乒乓球的儿子,如今成全家的骄傲

白面书誏
2026-01-24 19:33:09
国安部“点名”张艺谋,释放三个强烈信号,原来我们确实低估他了

国安部“点名”张艺谋,释放三个强烈信号,原来我们确实低估他了

生命之泉的奥秘
2026-01-25 06:30:36
苦涩空砍,亚历山大28中17得47分4板4助,罚球12中12正负值+4

苦涩空砍,亚历山大28中17得47分4板4助,罚球12中12正负值+4

懂球帝
2026-01-24 11:44:05
1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

南权先生
2026-01-20 15:49:53
美国放话:谁敢拦截军售,就是宣战!中国用实力划下红线!

美国放话:谁敢拦截军售,就是宣战!中国用实力划下红线!

华山穹剑
2026-01-23 20:19:29
密谈4小时彻底变天!普京开出最终停战条件,乌克兰不低头就打到底

密谈4小时彻底变天!普京开出最终停战条件,乌克兰不低头就打到底

妙知
2026-01-24 18:42:36
这场面20年都没见过!美元血崩,美联储做梦都没想到败得这么快

这场面20年都没见过!美元血崩,美联储做梦都没想到败得这么快

户外钓鱼哥阿旱
2026-01-24 15:57:48
0-3爆大冷门,梅西首发哑火,迈阿密国际遭遇新年开门黑

0-3爆大冷门,梅西首发哑火,迈阿密国际遭遇新年开门黑

俯身冲顶
2026-01-25 07:56:54
销量暴跌19%,理想汽车想靠内卷增程自救

销量暴跌19%,理想汽车想靠内卷增程自救

识礁Farsight
2026-01-22 22:04:15
没有阳刚之气就别演“大侠”,《镖人》中谢霆锋,给内娱上了一课

没有阳刚之气就别演“大侠”,《镖人》中谢霆锋,给内娱上了一课

糊咖娱乐
2026-01-22 11:48:48
澳网第一个八强诞生!萨巴伦卡改写抢七历史!剑指澳网第三冠!

澳网第一个八强诞生!萨巴伦卡改写抢七历史!剑指澳网第三冠!

徐骧老表哥
2026-01-25 11:14:53
丹麦如何白捡50倍大领土格陵兰岛的?格陵兰岛的原住民,为啥长得像中国人?

丹麦如何白捡50倍大领土格陵兰岛的?格陵兰岛的原住民,为啥长得像中国人?

犀利强哥
2026-01-23 06:59:12
刺激!华为突然官宣:1月24日,开启全品降价!

刺激!华为突然官宣:1月24日,开启全品降价!

科技堡垒
2026-01-24 12:40:11
“我要回国祸害人了”!澳洲女留学生在外网兴致勃勃的宣布!

“我要回国祸害人了”!澳洲女留学生在外网兴致勃勃的宣布!

达文西看世界
2026-01-23 20:28:45
高市早苗选择“政治豪赌”,在野政党痛批“没有大义”,日本迎来“最匆忙”大选

高市早苗选择“政治豪赌”,在野政党痛批“没有大义”,日本迎来“最匆忙”大选

环球网资讯
2026-01-24 06:51:18
决赛不敌日本,中国队收获U23亚洲杯亚军,创历史最佳战绩

决赛不敌日本,中国队收获U23亚洲杯亚军,创历史最佳战绩

澎湃新闻
2026-01-25 01:25:11
波士顿拥有麻省理工和哈佛,为什么最好的科技公司却在旧金山

波士顿拥有麻省理工和哈佛,为什么最好的科技公司却在旧金山

狐狸先森讲升学规划
2026-01-23 21:22:23
百年孤土:外东北有着肥沃的平原和茂密的森林,为啥人口却这么少

百年孤土:外东北有着肥沃的平原和茂密的森林,为啥人口却这么少

向航说
2026-01-07 00:35:03
2026-01-25 11:47:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12179文章数 142549关注度
往期回顾 全部

科技要闻

马斯克SpaceX背后的她:现实版钢铁侠小辣椒

头条要闻

黑龙江农民工被拖欠35万工资 总包方想用甘肃房子抵薪

头条要闻

黑龙江农民工被拖欠35万工资 总包方想用甘肃房子抵薪

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

王玉雯方严正声明 剧方回应:涉事人员已被开除

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

房产
教育
艺术
时尚
健康

房产要闻

正式官宣!三亚又一所名校要来了!

教育要闻

马年特色寒假作业清单来了!各科全覆盖,老师一定用得上!

艺术要闻

全认识这13个字的人,能否复印王羲之的作品?

冬天最佳“显瘦”公式:上短+下长

耳石脱落为何让人天旋地转+恶心?

无障碍浏览 进入关怀版