网易首页 > 网易号 > 正文 申请入驻

提升AI可信度:MIT团队开发新工具对抗“幻觉”

0
分享至

尽管大型语言模型的能力令人印象深刻,但它们仍然远非完美。这些人工智能模型有时会出现“幻觉”,生成不正确或没有依据的信息来回应查询。

由于这个幻觉问题,模型的响应通常需要由人工审查员进行验证,尤其是在医疗或金融等高风险环境中。然而,验证过程往往要求人们阅读模型引用的长文档,这项繁琐且容易出错的任务可能会让一些用户望而却步,从而不愿意使用生成式 AI 模型。

为帮助人工验证者,MIT 的研究人员创建了一个用户友好的系统,使人们能够更快地验证大型语言模型的响应。这个名为 SymGen 的工具可以让 LLM 生成带有引用的响应,直接指向源文档中的具体位置,比如数据库中的某个单元格。

用户可以悬停在文本响应的高亮部分,以查看模型用于生成特定词汇或短语的数据。同时,未高亮的部分则显示需要额外关注以进行检查和验证的短语。

“我们让人们能够选择性地关注他们需要更加关注的文本部分。最终,SymGen 能够提高人们对模型响应的信心,因为他们可以轻松地仔细检查,以确保信息的可靠性。”电气工程与计算机科学研究生、SymGen 论文的共同第一作者 Shannon Shen 表示。

通过用户研究,Shen 和他的合作者发现,使用 SymGen 进行验证的时间比手动流程缩短了约 20%。通过使人们验证模型输出的过程更快、更简单,SymGen 有助于识别在各种实际应用中使用的 LLM 的错误,从生成临床记录到总结金融市场报告。

Shen 的论文合作者还包括共同第一作者、EECS 研究生Lucas Torroba Hennigen;EECS 研究生 Aniruddha “Ani” Nrusimha;Good Data Initiative 的主席 Bernhard Gapp;以及高级作者 David Sontag,EECS 教授、MIT Jameel Clinic 成员、计算机科学与人工智能实验室(CSAIL)临床机器学习组的负责人;还有助理教授 Yoon Kim,CSAIL 的成员。该研究最近在语言建模会议上进行了展示。

符号引用

为了帮助验证,许多 LLM 被设计为生成引用,指向外部文档,并提供语言基础的响应,以便用户进行检查。然而,这些验证系统通常是事后考虑的,并没有考虑到人们在筛选大量引用时所需的努力,Shen 说。

“生成式 AI 的目的是减少用户完成任务所需的时间。如果您需要花费数小时阅读这些文档,以验证模型的说法是否合理,那么在实际应用中生成的内容就不那么有帮助了。”Shen 表示。

研究人员从将要进行验证工作的人的角度来解决这个问题。

SymGen 用户首先向 LLM 提供可以作为参考的数据,例如包含篮球比赛统计信息的表格。然后,研究人员进行一个中间步骤,而不是立即要求模型完成任务,比如从这些数据生成比赛摘要。他们提示模型以符号形式生成响应。

在这个提示下,每当模型希望在响应中引用词汇时,必须写出数据表中包含该信息的具体单元格。例如,如果模型想在响应中引用“波特兰开拓者”这个短语,它将用数据表中包含这些词的单元格名称替换该文本。

“因为我们有这个中间步骤,使文本以符号格式呈现,我们能够实现非常精细的引用。我们可以明确指出,输出中每一段文本具体对应数据中的哪一部分。”Torroba Hennigen 表示。

SymGen 然后使用基于规则的工具解析每个引用,将相应的文本从数据表复制到模型的响应中。

“这样,我们知道它是逐字复制的,因此可以确保与实际数据变量对应的文本部分不会出错。”Shen 补充道。

简化验证

模型能够生成符号响应,是由于其训练方式。大型语言模型接受来自互联网的大量数据,其中一些数据以“占位符格式”记录,代码替代了实际值。

当 SymGen 提示模型生成符号响应时,它使用类似的结构。

“我们以特定的方式设计提示,以发挥 LLM 的能力。”Shen 补充说。

在用户研究中,大多数参与者表示 SymGen 使验证 LLM 生成的文本变得更容易。他们验证模型响应的速度比使用标准方法快约 20%。

然而,SymGen 的效果受源数据质量的限制。LLM 可能引用错误的变量,而人工验证者可能对此毫不知情。

此外,用户必须以结构化格式(如表格)提供源数据,以便输入到 SymGen。目前,该系统仅适用于表格数据。

展望未来,研究人员正在增强 SymGen 的功能,以便处理任意文本和其他数据形式。有了这个能力,它可以帮助验证 AI 生成的法律文件摘要的某些部分。他们还计划与医生一起测试 SymGen,以研究它如何识别 AI 生成的临床摘要中的错误。

这项工作部分由 Liberty Mutual 和 MIT 智能探索计划资助。

https://news.mit.edu/2024/making-it-easier-verify-ai-models-responses-1021

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子违停竖中指挑衅被撞:正脸被扒已社死,内情流出,司机疑发声

女子违停竖中指挑衅被撞:正脸被扒已社死,内情流出,司机疑发声

社会日日鲜
2026-01-22 00:48:44
向华强曝李亚鹏曾在香港办派对为嫣然天使基金筹款:自己捐了几百万,王菲、刘嘉玲等众星捧场

向华强曝李亚鹏曾在香港办派对为嫣然天使基金筹款:自己捐了几百万,王菲、刘嘉玲等众星捧场

扬子晚报
2026-01-22 21:34:18
特朗普的达沃斯“暴论”看似疯魔,实则藏着清晰的战略意图,千万不可小视!

特朗普的达沃斯“暴论”看似疯魔,实则藏着清晰的战略意图,千万不可小视!

识局Insight
2026-01-22 19:57:22
特朗普为何急转弯?承诺不对格陵兰动武,撤回对欧洲八国关税威胁

特朗普为何急转弯?承诺不对格陵兰动武,撤回对欧洲八国关税威胁

40度观察
2026-01-22 17:51:42
曼联官方:卡塞米罗将在本赛季结束后以自由球员身份离队

曼联官方:卡塞米罗将在本赛季结束后以自由球员身份离队

懂球帝
2026-01-23 01:06:12
丹麦首相:北约秘书长无权代表丹麦谈判

丹麦首相:北约秘书长无权代表丹麦谈判

财联社
2026-01-22 20:18:07
李亚鹏曝明星捐赠:邓超胡军百万,杨恭如千万,王菲超三千万

李亚鹏曝明星捐赠:邓超胡军百万,杨恭如千万,王菲超三千万

最美的巧合
2026-01-22 17:53:34
法媒:历史天平再次向中国倾斜

法媒:历史天平再次向中国倾斜

参考消息
2026-01-21 14:13:48
他就是个下棋的,却被你们当了一辈子鸡血

他就是个下棋的,却被你们当了一辈子鸡血

下岗女神
2026-01-22 17:29:32
央视确认!3家中超争冠队欲签李昊,欧洲队也在关注,身价2000万

央视确认!3家中超争冠队欲签李昊,欧洲队也在关注,身价2000万

我爱英超
2026-01-22 19:24:27
央视曝光毒红薯!商户主动投毒,流窜至全国多地,背后利益链曝光

央视曝光毒红薯!商户主动投毒,流窜至全国多地,背后利益链曝光

阿纂看事
2026-01-22 11:14:33
30元都没人收?马钞“通货”遭集体抛弃,币商这次彻底“不玩了”

30元都没人收?马钞“通货”遭集体抛弃,币商这次彻底“不玩了”

老孟谈钱
2026-01-22 12:05:05
今年多名厅官主动投案!首个投案的是任职8年的州长

今年多名厅官主动投案!首个投案的是任职8年的州长

上观新闻
2026-01-22 14:27:07
女子违停竖中指被撞后续!正脸曝光全网社死,司机发声,警方介入

女子违停竖中指被撞后续!正脸曝光全网社死,司机发声,警方介入

离离言几许
2026-01-22 11:52:29
比亚迪起诉博主“大秦军陕团”一案一审判决:博主被判赔偿201万元;曾编造“方程豹‘豹5’百公里油耗18升”

比亚迪起诉博主“大秦军陕团”一案一审判决:博主被判赔偿201万元;曾编造“方程豹‘豹5’百公里油耗18升”

大风新闻
2026-01-22 15:47:16
U23亚洲杯23日赛程:诞生季军!中国队赛前获喜讯,1-0日本=夺冠

U23亚洲杯23日赛程:诞生季军!中国队赛前获喜讯,1-0日本=夺冠

侃球熊弟
2026-01-23 00:18:00
从“国民妈妈”到1.2亿罚单:闫学晶为何一夜崩盘?

从“国民妈妈”到1.2亿罚单:闫学晶为何一夜崩盘?

社会日日鲜
2026-01-22 12:46:27
载有中国游客的旅游大巴在俄发生事故

载有中国游客的旅游大巴在俄发生事故

新华社
2026-01-22 18:23:37
牢A讲得好:为什么陪读母女一定会被猎艳,是100%,没有例外

牢A讲得好:为什么陪读母女一定会被猎艳,是100%,没有例外

红色少女主播
2026-01-22 17:06:13
俄罗斯发动大规模空袭,导弹中途居然还会转向,基辅一半地区停电

俄罗斯发动大规模空袭,导弹中途居然还会转向,基辅一半地区停电

碳基生物关怀组织
2026-01-20 19:48:05
2026-01-23 02:23:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16165文章数 514519关注度
往期回顾 全部

科技要闻

几千亿只是开胃菜,AI基建还得再砸几万亿

头条要闻

“和平委员会”签约国家名单公布 西欧国家无一参加

头条要闻

“和平委员会”签约国家名单公布 西欧国家无一参加

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

车银优赚800亿 涉嫌逃税200亿!

财经要闻

西贝拿到“救命钱”,然后呢

汽车要闻

配备多块娱乐屏 极氪8X内饰曝光

态度原创

游戏
时尚
本地
旅游
教育

猎魂世界:天斗皇礼通行证性价比分析!算来算去这成本感觉如何?

这些才是最日常的冬季穿搭!不露腿、不扮嫩,简约舒适又保暖

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

旅游要闻

广货行天下!从一粒米到一桌年味,广东文旅的“带货”新玩法

教育要闻

32岁程序员倒在客厅:请告诉孩子,这3条底线比考满分重要!

无障碍浏览 进入关怀版