网易首页 > 网易号 > 正文 申请入驻

为了克制AI幻觉,硅谷迷上了检索增强生成技术

0
分享至

现在的生成式AI工具还不完美,经常会“撒谎”,这就是所谓的幻觉。为了克制幻觉,开发者开发出一系列工具,最近在硅谷比较流行的工具是检索增强生成(Retrieval-augmented Generation,简称RAG)。

RAG是一种结合检索和生成技术的模型,它为大模型提供外部知识源,使得大模型具备从指定的知识库中进行检索,并结合上下文信息,生成相对高质量的回复内容,减少模型幻觉问题。例如,企业可以将所有的HR政策和福利信息上传到RAG数据库,AI聊天机器人聚焦于可以从这些文件中找到的答案。

听起来RAG似乎和ChatGPT技术没有什么太大差异,实际上差异蛮大的。Thomson Reuters用RAG技术开发出一套面向法务工作者的AI工具,其公司高管Pablo Arredondo说:“RAG不会单纯依靠初始训练生成的记忆来回答问题,它会利用搜索引擎收集真实文档,比如判例法、论文等,然后根据这些文档锚定模型的响应。”

例如,我们可以将某本杂志的所有内容上传到数据库,根据数据库内容回答问题。因为AI工具关注的信息面比较窄,信息质量更高,基于RAG开发的聊天机器人在回答问题时会比通用机器人更有深度。

RAG机器人会不会犯错呢?当然会,但它捏造内容的概率会降低。

研究人员认为,RAG方法有很大优势,在训练模型时,它所接受的信息都是事实,而且是可以追溯来源的事实。如果你能教模型对提供的数据进行分类,并在每个输出结果中使用、引用,那么人工智能工具就不太可能犯严重的错误。

用了RAG技术,幻觉能降低多少呢?一些研究者认为,幻觉可以达到很低的程度,但无法完全消除。换言之,RAG不是万能药。总体看,幻觉减少程度取决于两个核心要素:一是整体RAG的部署质量,二是对AI幻觉的定义。

并非所有的RAG都是一样的。在自定义数据库中,内容的精度影响着结果质量,但它并不是唯一影响因素。除了要关注内容的质量,还要关注搜索质量及基于问题的正确内容的检索。掌握过程中的每一步都至关重要,因为一个失误就可能使模型完全偏离。

斯坦福教授Daniel Ho说:“凡是在某个搜索引擎中使用自然语言搜索的律师都会发现,许多时候语义相似度影响巨大,它会导出完全不相关的资料。”

如何定义RAG应用中出现的幻觉也很重要。一些专家认为,判断RAG系统是否出现幻觉主要是看输出结果是否与数据检索时模型找到的答案一致。斯坦福大学则认为,要检查结果,看它是否基于提供的数据,是否符合事实。

在回答法律问题时,RAG系统明显比ChatGPT、Gemini更好,但它仍然有可能忽视细节,随机给出错误答案。几乎所有专家都认为,即使有了RAG系统,也需要人类参与,对引用信息进行双重检查,判定结果的准确率。

在法律领域RAG系统可以找到用武之地,在其它领域也一样。凡是需要专业知识的专业领域,AI系统给出的答案都应该锚定真实文件,所以RAG适合专业领域。

Daniel Ho说:“幻觉一直存在,我们还没有找到好办法真正消除幻觉。”虽然RAG可以降低错误率,但还是需要人类来判断结果如何。(小刀)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人民日报曾怒批餐饮粗暴干预!禁止违规吃喝不是禁止吃喝!

人民日报曾怒批餐饮粗暴干预!禁止违规吃喝不是禁止吃喝!

达文西看世界
2026-01-16 18:30:36
有其母必有其子!闫学晶又被爆出新料,她和儿子已经一个也跑不了

有其母必有其子!闫学晶又被爆出新料,她和儿子已经一个也跑不了

奥字侃剧
2026-01-17 05:45:42
1991年,张学良与吕正操重逢,开口便质问:“你咋跑去周恩来那了?”,吕正操的回应十分高明

1991年,张学良与吕正操重逢,开口便质问:“你咋跑去周恩来那了?”,吕正操的回应十分高明

文史明鉴
2026-01-16 22:07:09
美国终于回过味来了:这个世界上,不会再有第二个 “中国” 了

美国终于回过味来了:这个世界上,不会再有第二个 “中国” 了

扶苏聊历史
2026-01-16 17:44:38
碎三观!重庆一男子和妻妹发生不当关系转账380万,妻子默许了…

碎三观!重庆一男子和妻妹发生不当关系转账380万,妻子默许了…

火山诗话
2026-01-14 09:25:46
投诉杨贵妃雕塑的,正眼看他一下,你都输了

投诉杨贵妃雕塑的,正眼看他一下,你都输了

不主流讲话
2026-01-14 18:09:01
大量14T低价硬盘涌入闲鱼!1T折合44元,到底有啥猫腻?

大量14T低价硬盘涌入闲鱼!1T折合44元,到底有啥猫腻?

闲搞机
2026-01-16 11:14:40
132条人命在前,意大利承包商又毁高铁,泰总理放话:黑名单见!

132条人命在前,意大利承包商又毁高铁,泰总理放话:黑名单见!

科普100克克
2026-01-16 14:44:53
伟大的6-0!吴宜泽德比战大获全胜,创造3大纪录,罗伯逊0-3到4-4

伟大的6-0!吴宜泽德比战大获全胜,创造3大纪录,罗伯逊0-3到4-4

刘姚尧的文字城堡
2026-01-17 06:14:49
开拓者官宣下放杨瀚森:今日再为混音出战蓝队 上一场22分7板3助

开拓者官宣下放杨瀚森:今日再为混音出战蓝队 上一场22分7板3助

罗说NBA
2026-01-17 06:26:06
票房从33.9亿下跌到了127万,我感慨:炒冷饭救不了港片

票房从33.9亿下跌到了127万,我感慨:炒冷饭救不了港片

宋垀搞笑配音
2026-01-15 20:37:23
变天了!2026年燃油车迎来降价潮,最大降幅50%,合资车霸榜​​

变天了!2026年燃油车迎来降价潮,最大降幅50%,合资车霸榜​​

夜深爱杂谈
2026-01-14 19:39:52
环保女郎不见了,J·K·罗琳猛批西方左派的伪善

环保女郎不见了,J·K·罗琳猛批西方左派的伪善

移光幻影
2026-01-14 16:31:11
大雪暴雪!零下11℃!阵风8级!安徽发布紧急提醒!

大雪暴雪!零下11℃!阵风8级!安徽发布紧急提醒!

鲁中晨报
2026-01-16 20:35:05
没人要,温德霍斯特的犀利点评让勇士队对库明加交易价值清醒认识

没人要,温德霍斯特的犀利点评让勇士队对库明加交易价值清醒认识

好火子
2026-01-17 07:02:01
上海:多区聚焦重点开展“扫黄打非”专项检查

上海:多区聚焦重点开展“扫黄打非”专项检查

娱乐圈的笔娱君
2026-01-16 15:22:36
村姑冒充京城公主,昆明两位局长轮流伺候,落网:我像太监一样伺候她

村姑冒充京城公主,昆明两位局长轮流伺候,落网:我像太监一样伺候她

黎庶文史
2026-01-09 18:36:23
1月起,四股“降价潮”同时出现,有人捡便宜,有人却开始不安

1月起,四股“降价潮”同时出现,有人捡便宜,有人却开始不安

搬砖营Z
2026-01-17 05:19:27
“后坐力”太大!闫学晶又被爆出猛料,她和儿子已经一个也跑不了

“后坐力”太大!闫学晶又被爆出猛料,她和儿子已经一个也跑不了

乡野小珥
2026-01-17 06:46:06
古巴能源供应被切断,垃圾堆积如山

古巴能源供应被切断,垃圾堆积如山

昊轩看世界
2026-01-14 10:15:12
2026-01-17 07:16:49
极客网 incentive-icons
极客网
科技使能新商业
2782文章数 2599关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

本地
健康
数码
公开课
军事航空

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

血常规3项异常,是身体警报!

数码要闻

熊猫MX34U7 34英寸带鱼屏显示器发布,售价1299元

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

欧洲多国向格陵兰岛派遣军事人员 白宫回应

无障碍浏览 进入关怀版