网易首页 > 网易号 > 正文 申请入驻

生成式AI“幻觉”困境如何破解

0
分享至

刘 霞

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。

主因是数据模糊

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。

多领域面临考验

AI的“幻觉”可能会给人们的工作和生活带来较大影响。

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。

多举措减少“幻觉”

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
事实证明,《镖人》不是输给了《飞驰人生3》,而是输给了自己

事实证明,《镖人》不是输给了《飞驰人生3》,而是输给了自己

娱乐圈笔娱君
2026-02-24 16:27:26
福特号已就位,战争开始读秒?中方不再观望,送出歼-20模型

福特号已就位,战争开始读秒?中方不再观望,送出歼-20模型

通鉴史智
2026-02-24 19:36:29
加拿大将墨西哥多个州列入“避免非必要旅行”区域

加拿大将墨西哥多个州列入“避免非必要旅行”区域

界面新闻
2026-02-23 13:13:17
美国深夜收到消息:中国发两条公告,亚洲震动,日本右翼陷入癫狂

美国深夜收到消息:中国发两条公告,亚洲震动,日本右翼陷入癫狂

古史青云啊
2026-02-24 19:52:54
49年毛主席夜访北平遇恶霸,秘书上去制止,对方:知道我是谁吗?

49年毛主席夜访北平遇恶霸,秘书上去制止,对方:知道我是谁吗?

搜史君
2026-02-22 07:50:08
东北男人“新战袍”:4000元的迪桑特,成了体制内的隐形工牌

东北男人“新战袍”:4000元的迪桑特,成了体制内的隐形工牌

闻香阁
2026-02-23 21:11:24
陈冠希一家洛杉矶参加婚礼,留小胡子像赵本山,女儿更像秦舒培!

陈冠希一家洛杉矶参加婚礼,留小胡子像赵本山,女儿更像秦舒培!

明星私服穿搭daily
2026-01-19 07:30:49
马筱梅晒定制红包,把婆婆张兰放感谢第一位,汪大爷也来陪产

马筱梅晒定制红包,把婆婆张兰放感谢第一位,汪大爷也来陪产

离离言几许
2026-02-23 11:49:37
菲律宾要大乱?杜特尔特之女参选总统 意图求生 小马科斯送三个字

菲律宾要大乱?杜特尔特之女参选总统 意图求生 小马科斯送三个字

军评陈光文
2026-02-24 19:39:44
济宁套圈中汽车后续:花5600元赢大奖被赖账,民警来了老板才认怂

济宁套圈中汽车后续:花5600元赢大奖被赖账,民警来了老板才认怂

奇思妙想草叶君
2026-02-23 15:49:12
崔永熙将改打四号位!广东队被迫阵容大清洗,杜锋交易锋线国手?

崔永熙将改打四号位!广东队被迫阵容大清洗,杜锋交易锋线国手?

绯雨儿
2026-02-24 14:11:20
绝对的超值合同!勇士侧翼新星正在成长为联盟顶级3D侧翼球员?

绝对的超值合同!勇士侧翼新星正在成长为联盟顶级3D侧翼球员?

稻谷与小麦
2026-02-23 23:08:09
新加坡大满贯爆大冷!张本美和一轮游, 松岛辉空惨败!黄友政/陈熠有望冲冠!

新加坡大满贯爆大冷!张本美和一轮游, 松岛辉空惨败!黄友政/陈熠有望冲冠!

好乒乓
2026-02-24 12:36:28
除夕当天,爸爸因病去世,老公得知后,却拦着我:不行,年夜饭谁做!

除夕当天,爸爸因病去世,老公得知后,却拦着我:不行,年夜饭谁做!

阿凯销售场
2026-02-24 20:13:28
15天内开战?伊朗迎来强援:2500枚导弹、16架苏35

15天内开战?伊朗迎来强援:2500枚导弹、16架苏35

兵国大事
2026-02-24 00:05:12
当年举报毕福剑的那位告密者竟然变成这样了!谁能想到啊?

当年举报毕福剑的那位告密者竟然变成这样了!谁能想到啊?

霹雳炮
2026-02-06 13:48:54
李嘉诚噩梦成真!巴拿马通告全球:撤销长和经营权,巴方正式接管

李嘉诚噩梦成真!巴拿马通告全球:撤销长和经营权,巴方正式接管

通鉴史智
2026-02-24 19:27:26
楼市新信号,二手房业主不愿卖房了!

楼市新信号,二手房业主不愿卖房了!

金融界
2026-02-24 07:59:17
一集弃!央视新剧首播差评一片,梅婷肿眼装嫩状态拉胯,真没眼看

一集弃!央视新剧首播差评一片,梅婷肿眼装嫩状态拉胯,真没眼看

翰飞观事
2026-02-24 20:00:13
丰田史无前例新低!全新威兰达AIR版上市:13.78万起

丰田史无前例新低!全新威兰达AIR版上市:13.78万起

快科技
2026-02-24 11:21:07
2026-02-24 20:59:00
金台资讯 incentive-icons
金台资讯
报道全球 传播中国 人民网股份有限公司
1514025文章数 201143关注度
往期回顾 全部

科技要闻

宇树科技发布四足机器人Unitree As2

头条要闻

20家日本实体被列入管制名单 中方:完全正当 合理合法

头条要闻

20家日本实体被列入管制名单 中方:完全正当 合理合法

体育要闻

苏翊鸣总结米兰征程:我仍是那个热爱单板滑雪的少年

娱乐要闻

汪小菲官宣三胎出生:承诺会照顾好3个孩子

财经要闻

县城消费「限时繁荣」了十天

汽车要闻

入门即满配 威兰达AIR版上市 13.78万元起

态度原创

本地
亲子
旅游
艺术
时尚

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

亲子要闻

萌娃质问老爸:妈妈为什么嫁给你,老爸的回答竟让萌娃面露难色

旅游要闻

春节假期北京昌平区实现旅游总花费10.3亿元

艺术要闻

2025年第八届全国青年美展 | 油画作品选刊

50+的女性,大衣、直筒裤、皮草这么穿,冬天保暖显瘦两不误

无障碍浏览 进入关怀版