网易首页 > 网易号 > 正文 申请入驻

NeurIPS 2024|杜克大学&谷歌SLED解码框架,无需外部数据与训练

0
分享至

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

此项研究成果已被 NeurIPS 2024 录用。该论文的第一作者是杜克大学电子计算机工程系的博士生张健一,其主要研究领域为生成式 AI 的概率建模与可信机器学习,导师为陈怡然教授。

大语言模型(LLM)在各种任务上展示了卓越的性能。然而,受到幻觉(hallucination)的影响,LLM 生成的内容有时会出现错误或与事实不符,这限制了其在实际应用中的可靠性。

针对这一问题,来自杜克大学和 Google Research 的研究团队提出了一种新的解码框架 —— 自驱动 Logits 进化解码(SLED),旨在提升大语言模型的事实准确性,且无需依赖外部知识库,也无需进行额外的微调。

  • 论文地址:https://arxiv.org/pdf/2411.02433
  • 项目主页:https://jayzhang42.github.io/sled_page/
  • Github地址:https://github.com/JayZhang42/SLED
  • 作者主页:https://jayzhang42.github.io

研究背景与思路总结

近期相关研究显示,尽管用户在访问大语言模型(LLM)时可能无法得到正确的答案,但 LLM 实际上可能已经基于海量的训练数据和漫长的训练周期学到了正确的答案,并将其存储于模型内部某处。

研究者将这类无法直观从模型输出中获得的信息称为 “潜在知识”,并用图一精炼出了对应的 “三体问题”。

图一:Factuality Decoding 的 “三体问题”

图二:SLED 框架的主要流程

方法设计

图三:研究者对三个不同规模的 LLaMA-2 模型计算了每一层对应的交叉熵损失。结果证实,就 KL 散度而言,最终层的 Logits 输出分布比所有早期层更接近真实世界的分布

实验验证

作为一种新型的层间对比解码架构,研究者首先将 SLED 与当前最先进的方法 DoLa 进行了比较。实验覆盖了多种 LLM families(LLaMA 2, LLaMA 3, Gemma)和不同模型规模(从 2B 到 70B),还有当前备受关注的混合专家(MoE)架构。

结果表明,SLED 在多种任务(包括多选、开放式生成和思维链推理任务的适应性)上均展现出明显的事实准确性提升。

此外 SLED 与其他常见的解码方式(如 contrastive decoding,ITI)具有良好的兼容性,能够进一步提升性能。

最后,研究者发现,与以往的算法相比,SLED 在计算上几乎没有明显的额外开销。同时,在生成质量方面,SLED 显著抑制了以往方法中的重复性问题,进一步优化了输出结果。

引申思考:与目前流行的 inference-time 算法的联系

实际上,不难看出,SLED 为后续的推理时(inference-time )算法提供了一个新的框架。与目前大多数 inference-time computing 方法主要集中于 sentence level 的输出或 logits 进行启发式修改不同,SLED 与经典优化算法衔接,如梯度下降法的结合更为紧密自然。

因此,SLED 不仅优化效率更高,同时有很多的潜在的研究方向可以尝试;另一方面,与 inference time training 方法相比,SLED 不涉及模型参数层面的修改,因此优化效率上开销更小,同时更能保持模型原有性能。

总结

本研究通过引入自驱动 Logits 进化解码(SLED)方法,成功地提升 LLM 在多种任务中的事实准确性。展望未来,可以探索将 SLED 与监督式微调方法结合,以适应其他领域的特定需求如医疗和教育领域。同时,改进框架设计也将是持续关注的方向。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

南权先生
2026-01-20 15:49:53
美军空袭伊朗一触即发

美军空袭伊朗一触即发

星火聊天下
2026-01-25 05:43:22
真的笑发财了!徐冬冬,不愧是被椰树椰汁的长公主!新包装太猛了

真的笑发财了!徐冬冬,不愧是被椰树椰汁的长公主!新包装太猛了

小娱乐悠悠
2026-01-24 08:13:02
黄景瑜官宣上太空刚过一天,航天公司被扒底朝天,离谱事接连发生

黄景瑜官宣上太空刚过一天,航天公司被扒底朝天,离谱事接连发生

一娱三分地
2026-01-24 19:27:30
敢为人先!重庆彭水献血车开进中学,官方回应:避免假期用血紧张

敢为人先!重庆彭水献血车开进中学,官方回应:避免假期用血紧张

火山诗话
2026-01-25 08:09:22
日媒评U23亚洲杯决赛:“功夫足球”还要持续多久?裁判执法不公

日媒评U23亚洲杯决赛:“功夫足球”还要持续多久?裁判执法不公

懂球帝
2026-01-25 10:51:06
国安部披露:个别社交平台账号打着“历史科普”的旗号,通过未经核实的内容、渲染阴谋论等方式歪曲事实,企图让网民陷入历史虚无主义陷阱

国安部披露:个别社交平台账号打着“历史科普”的旗号,通过未经核实的内容、渲染阴谋论等方式歪曲事实,企图让网民陷入历史虚无主义陷阱

扬子晚报
2026-01-26 07:17:27
牢A含金量提升!澳洲中国留学生堕胎率超30%,16年前报道数据扎心

牢A含金量提升!澳洲中国留学生堕胎率超30%,16年前报道数据扎心

火山诗话
2026-01-25 06:48:02
157分钟鏖战!中国金花绽放澳网:决胜盘9-10反转,16进8对手确定

157分钟鏖战!中国金花绽放澳网:决胜盘9-10反转,16进8对手确定

刘姚尧的文字城堡
2026-01-25 16:27:11
“大傻”去世15年后,儿子入狱孙子身亡,王晶曝他旧事:是狠角色

“大傻”去世15年后,儿子入狱孙子身亡,王晶曝他旧事:是狠角色

妙知
2026-01-22 16:41:19
官宣分手?国乒前情侣同日发文 陈幸同:不迎合不将就 周启豪:相信自己

官宣分手?国乒前情侣同日发文 陈幸同:不迎合不将就 周启豪:相信自己

可乐谈情感
2026-01-26 07:32:35
30万人签名:买下加州,改名“新丹麦”,给米老鼠戴上维京头盔

30万人签名:买下加州,改名“新丹麦”,给米老鼠戴上维京头盔

极目新闻
2026-01-25 11:54:04
美国运动员成功徒手攀爬台北101,蒋万安:累计动员上百人次整备

美国运动员成功徒手攀爬台北101,蒋万安:累计动员上百人次整备

海峡导报社
2026-01-25 18:26:10
李小璐写真生图高清

李小璐写真生图高清

翩翩明星
2025-11-14 09:39:36
多家宣布:春节不放假

多家宣布:春节不放假

珠海发布
2026-01-25 22:31:45
广州人注意!阳性率上升,传染性强!目前暂无疫苗或者特效药!

广州人注意!阳性率上升,传染性强!目前暂无疫苗或者特效药!

羊城攻略
2026-01-24 22:58:42
上海地铁海报现“六指美女”,被质疑用AI生成,广告方回应:如果确认存在问题,会第一时间修改替换

上海地铁海报现“六指美女”,被质疑用AI生成,广告方回应:如果确认存在问题,会第一时间修改替换

环球网资讯
2026-01-24 18:11:11
汉武帝玩了一招阳谋,专挑春季发兵打匈奴,致使女人流产人口锐减

汉武帝玩了一招阳谋,专挑春季发兵打匈奴,致使女人流产人口锐减

掠影后有感
2026-01-25 11:33:06
已有6地将器官捐献纳入"见义勇为"评定 专家提醒

已有6地将器官捐献纳入"见义勇为"评定 专家提醒

看看新闻Knews
2026-01-25 13:21:04
人口塌方,当前最大的隐忧

人口塌方,当前最大的隐忧

超级学爸蛋总
2026-01-25 21:13:00
2026-01-26 10:20:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12179文章数 142549关注度
往期回顾 全部

科技要闻

三星闪存,涨价100%

头条要闻

牛弹琴:特朗普非常难过 发文祈祷"中国别接管加拿大"

头条要闻

牛弹琴:特朗普非常难过 发文祈祷"中国别接管加拿大"

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

现货黄金历史首次突破5000美元

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

教育
旅游
艺术
时尚
数码

教育要闻

旋转作图第1讲,一个视频学明白!

旅游要闻

来无锡旅游可领8888元消费大礼包!2026“乐享新春”太湖购物节启动

艺术要闻

你能在5秒内认出这18个字吗?看看专家怎么说!

伊姐周日热推:电视剧《太平年》;电视剧《暗恋者的救赎》......

数码要闻

2025年中国智能投影仪市场创史上最大下滑 行业洗牌加速

无障碍浏览 进入关怀版