网易首页 > 网易号 > 正文 申请入驻

提升AI可信度:MIT团队开发新工具对抗“幻觉”

0
分享至

尽管大型语言模型的能力令人印象深刻,但它们仍然远非完美。这些人工智能模型有时会出现“幻觉”,生成不正确或没有依据的信息来回应查询。

由于这个幻觉问题,模型的响应通常需要由人工审查员进行验证,尤其是在医疗或金融等高风险环境中。然而,验证过程往往要求人们阅读模型引用的长文档,这项繁琐且容易出错的任务可能会让一些用户望而却步,从而不愿意使用生成式 AI 模型。

为帮助人工验证者,MIT 的研究人员创建了一个用户友好的系统,使人们能够更快地验证大型语言模型的响应。这个名为 SymGen 的工具可以让 LLM 生成带有引用的响应,直接指向源文档中的具体位置,比如数据库中的某个单元格。

用户可以悬停在文本响应的高亮部分,以查看模型用于生成特定词汇或短语的数据。同时,未高亮的部分则显示需要额外关注以进行检查和验证的短语。

“我们让人们能够选择性地关注他们需要更加关注的文本部分。最终,SymGen 能够提高人们对模型响应的信心,因为他们可以轻松地仔细检查,以确保信息的可靠性。”电气工程与计算机科学研究生、SymGen 论文的共同第一作者 Shannon Shen 表示。

通过用户研究,Shen 和他的合作者发现,使用 SymGen 进行验证的时间比手动流程缩短了约 20%。通过使人们验证模型输出的过程更快、更简单,SymGen 有助于识别在各种实际应用中使用的 LLM 的错误,从生成临床记录到总结金融市场报告。

Shen 的论文合作者还包括共同第一作者、EECS 研究生Lucas Torroba Hennigen;EECS 研究生 Aniruddha “Ani” Nrusimha;Good Data Initiative 的主席 Bernhard Gapp;以及高级作者 David Sontag,EECS 教授、MIT Jameel Clinic 成员、计算机科学与人工智能实验室(CSAIL)临床机器学习组的负责人;还有助理教授 Yoon Kim,CSAIL 的成员。该研究最近在语言建模会议上进行了展示。

符号引用

为了帮助验证,许多 LLM 被设计为生成引用,指向外部文档,并提供语言基础的响应,以便用户进行检查。然而,这些验证系统通常是事后考虑的,并没有考虑到人们在筛选大量引用时所需的努力,Shen 说。

“生成式 AI 的目的是减少用户完成任务所需的时间。如果您需要花费数小时阅读这些文档,以验证模型的说法是否合理,那么在实际应用中生成的内容就不那么有帮助了。”Shen 表示。

研究人员从将要进行验证工作的人的角度来解决这个问题。

SymGen 用户首先向 LLM 提供可以作为参考的数据,例如包含篮球比赛统计信息的表格。然后,研究人员进行一个中间步骤,而不是立即要求模型完成任务,比如从这些数据生成比赛摘要。他们提示模型以符号形式生成响应。

在这个提示下,每当模型希望在响应中引用词汇时,必须写出数据表中包含该信息的具体单元格。例如,如果模型想在响应中引用“波特兰开拓者”这个短语,它将用数据表中包含这些词的单元格名称替换该文本。

“因为我们有这个中间步骤,使文本以符号格式呈现,我们能够实现非常精细的引用。我们可以明确指出,输出中每一段文本具体对应数据中的哪一部分。”Torroba Hennigen 表示。

SymGen 然后使用基于规则的工具解析每个引用,将相应的文本从数据表复制到模型的响应中。

“这样,我们知道它是逐字复制的,因此可以确保与实际数据变量对应的文本部分不会出错。”Shen 补充道。

简化验证

模型能够生成符号响应,是由于其训练方式。大型语言模型接受来自互联网的大量数据,其中一些数据以“占位符格式”记录,代码替代了实际值。

当 SymGen 提示模型生成符号响应时,它使用类似的结构。

“我们以特定的方式设计提示,以发挥 LLM 的能力。”Shen 补充说。

在用户研究中,大多数参与者表示 SymGen 使验证 LLM 生成的文本变得更容易。他们验证模型响应的速度比使用标准方法快约 20%。

然而,SymGen 的效果受源数据质量的限制。LLM 可能引用错误的变量,而人工验证者可能对此毫不知情。

此外,用户必须以结构化格式(如表格)提供源数据,以便输入到 SymGen。目前,该系统仅适用于表格数据。

展望未来,研究人员正在增强 SymGen 的功能,以便处理任意文本和其他数据形式。有了这个能力,它可以帮助验证 AI 生成的法律文件摘要的某些部分。他们还计划与医生一起测试 SymGen,以研究它如何识别 AI 生成的临床摘要中的错误。

这项工作部分由 Liberty Mutual 和 MIT 智能探索计划资助。

https://news.mit.edu/2024/making-it-easier-verify-ai-models-responses-1021

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
口碑反转!王菲没想到,负债累累的李亚鹏,如今却让自己“难堪”

口碑反转!王菲没想到,负债累累的李亚鹏,如今却让自己“难堪”

白面书誏
2026-01-19 17:22:22
前途无量,中国19岁小将3-1胜淘汰林诗栋的达科,连续两站进决赛

前途无量,中国19岁小将3-1胜淘汰林诗栋的达科,连续两站进决赛

真理是我亲戚
2026-01-23 22:48:03
1936 钱壮飞乌江失踪成谜,寻 50 年 1986 金沙县考证结局唏嘘

1936 钱壮飞乌江失踪成谜,寻 50 年 1986 金沙县考证结局唏嘘

磊子讲史
2026-01-08 15:47:38
王岳伦彻底隐身!

王岳伦彻底隐身!

八卦疯叔
2026-01-23 09:40:02
《风语者》—吴宇森:一看电影就知道不是一个擅长拍战争片的导演

《风语者》—吴宇森:一看电影就知道不是一个擅长拍战争片的导演

谁知西去路
2026-01-23 09:02:26
今晚!CCTV5直播U23国足PK日本 英超让路 中超球员冲击亚洲杯冠军

今晚!CCTV5直播U23国足PK日本 英超让路 中超球员冲击亚洲杯冠军

晚池
2026-01-24 02:25:33
一支笔锁死中国14亿人命运:为何90年过去了,这条斜线谁也动不了

一支笔锁死中国14亿人命运:为何90年过去了,这条斜线谁也动不了

半解智士
2026-01-20 18:03:00
河南开封万岁山一NPC演员雪中静立被误以为是假人,景区:有保暖措施,期间会安排换班

河南开封万岁山一NPC演员雪中静立被误以为是假人,景区:有保暖措施,期间会安排换班

台州交通广播
2026-01-22 23:24:46
“矮大紧”事后补料,“牢A”理论更扎实!

“矮大紧”事后补料,“牢A”理论更扎实!

达文西看世界
2026-01-22 10:52:23
孙涛回应闫学晶事件,头发花白委屈到哭,妻子受牵连,朋友误会他

孙涛回应闫学晶事件,头发花白委屈到哭,妻子受牵连,朋友误会他

小彭美识
2026-01-24 00:21:55
面对200%关税,马克龙反击,特朗普称“马上下台”,纽森讽刺欧洲

面对200%关税,马克龙反击,特朗普称“马上下台”,纽森讽刺欧洲

策略述
2026-01-22 12:42:21
中国队vs日本!U23亚洲杯决赛未开始,传来2个不利消息,夺冠难了

中国队vs日本!U23亚洲杯决赛未开始,传来2个不利消息,夺冠难了

侃球熊弟
2026-01-24 00:30:03
一位老人感叹:人没必要活得太长寿。60岁走,太年轻;70岁走,有点早;80岁去世,刚好合适。

一位老人感叹:人没必要活得太长寿。60岁走,太年轻;70岁走,有点早;80岁去世,刚好合适。

二胡的岁月如歌
2026-01-12 18:27:06
什么是性成瘾?患者自述:比烟瘾、酒瘾厉害多了,比戒毒还难

什么是性成瘾?患者自述:比烟瘾、酒瘾厉害多了,比戒毒还难

泠泠说史
2025-10-30 15:20:45
日本球迷:非常期待与史上最强中国队的决赛,要小心向余望!

日本球迷:非常期待与史上最强中国队的决赛,要小心向余望!

邱泽云
2026-01-22 22:54:09
72岁老太被儿子送养老院,卖掉留儿子的5套学区房,1月后儿子傻眼

72岁老太被儿子送养老院,卖掉留儿子的5套学区房,1月后儿子傻眼

黄家湖的忧伤
2025-06-13 17:43:22
美女爆释永信猛料!姐妹住少林寺三天两晚,凌晨众人汇聚他的禅房

美女爆释永信猛料!姐妹住少林寺三天两晚,凌晨众人汇聚他的禅房

小涛叨叨
2026-01-09 16:43:27
美国华人直言:中国手机扫码支付是最不智能的发明!

美国华人直言:中国手机扫码支付是最不智能的发明!

阿伧说事
2026-01-20 12:53:01
原来花小钱就能过得舒服很多,网友:不要心疼电费,该省省该花花

原来花小钱就能过得舒服很多,网友:不要心疼电费,该省省该花花

另子维爱读史
2026-01-23 20:02:10
阿韦洛亚:穆里尼奥的吐槽?他这样的教练说话,我总是认真听

阿韦洛亚:穆里尼奥的吐槽?他这样的教练说话,我总是认真听

懂球帝
2026-01-23 23:19:55
2026-01-24 03:19:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16169文章数 514524关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

疑在达沃斯受挫 79岁的特朗普转发超80条帖子发泄怒气

头条要闻

疑在达沃斯受挫 79岁的特朗普转发超80条帖子发泄怒气

体育要闻

杜兰特鏖战44分钟累瘫 轰36+7却致命失误

娱乐要闻

演员孙涛澄清闫学晶言论 落泪维护妻子

财经要闻

2026年,消费没有新故事?

汽车要闻

主打家庭大六座 奕境首款SUV将北京车展亮相

态度原创

时尚
亲子
旅游
艺术
健康

今日热点:车银优代言广告被隐藏;《巅峰对决》主演担任米兰冬奥会火炬手……

亲子要闻

“一个桃就拐走了!”宝妈在水果店频频拒绝女儿,评论区太真实!

旅游要闻

北京世园“天宫灯会”正式开幕,持续至3月8日

艺术要闻

人像摄影背后的真相,模特并不是全部!

耳石脱落为何让人天旋地转+恶心?

无障碍浏览 进入关怀版