网易首页 > 网易号 > 正文 申请入驻

当AI“一本正经”地胡说八道?信通院专家谈大模型幻觉之困

0
分享至

随着大模型加速落地,AI幻觉正从技术问题演变为社会议题。6月12日,第21期南都数字经济治理沙龙以“AI出错,谁为模型‘幻觉’买单?”为主题举行。

中国信息通信研究院人工智能研究所安全治理部主任石霖在会上表示,大模型“幻觉”已成为当前人工智能应用面临的重要挑战。现有研究表明,幻觉难以从根本上彻底消除,但可通过数据治理、模型优化和推理增强等手段持续降低发生概率。


中国信息通信研究院人工智能研究所安全治理部主任石霖。摄影:南都记者莫倩如

从“编造事实”到法律风险,AI幻觉影响正在外溢

据石霖介绍,“幻觉”原本是心理学概念,指在没有客观刺激的情况下产生的知觉体验。延伸到人工智能领域,大模型幻觉主要表现为模型生成的内容不符合用户输入要求,或者与客观事实不一致。目前,业内通常将其划分为“忠实性幻觉”和“事实性幻觉”两类。

其中,忠实性幻觉是指模型未能严格遵循用户指令完成任务。例如,用户要求将中文翻译成英文,但模型输出了其他语言内容;事实性幻觉则是指模型生成与现实情况不符的信息,例如对图片内容进行错误描述等。

石霖指出,从当前行业研究和实践情况来看,忠实性幻觉已成为影响大模型应用的重要问题之一。

随着大模型广泛应用于办公、搜索、教育和咨询等场景,幻觉带来的风险日益凸显。石霖表示,错误信息可能导致用户形成认知偏差,在医疗健康等专业场景甚至可能产生误导性建议。同时,大模型“编造”内容还可能引发名誉侵权、虚假信息传播等法律风险。

石霖还分享了工作中的案例,提醒大模型生成内容需进行必要核验,不能完全替代人工判断。

幻觉无法彻底消除,但可以被缓解和控制

AI幻觉从何而来?在石霖看来,这并非单一因素导致,而是贯穿于数据准备、模型训练和推理生成全过程。

在数据层面,训练数据中的错误信息、偏见内容以及知识覆盖不足等问题,都会影响模型输出质量。特别是在长尾知识、新知识以及部分受法律法规限制的信息领域,模型可能存在知识缺失或知识边界问题,从而增加幻觉发生概率。

在训练阶段,由于大模型本质上基于概率预测机制生成内容,更关注语言模式和上下文关联,而非事实验证,因此容易产生偏差。同时,在模型对齐过程中,模型往往倾向于生成更符合人类偏好的答案,而不一定是最准确的答案,这也可能带来一定程度的幻觉风险。

在推理阶段,模型可能表现出过度自信倾向。当面对语义相近或复杂问题时,容易在细节上出现错误。此外,长链条推理过程中出现的信息累积偏差,以及模型蒸馏、量化压缩等技术处理,也可能进一步放大幻觉问题。

针对幻觉问题,目前学术界和产业界已经开展了大量检测和治理研究。例如,通过构建事实核查机制、引入外部知识库、建立专门评测数据集等方式识别和评估模型幻觉风险;通过数据清洗、检索增强生成(RAG)、模型架构优化和推理增强等技术手段降低幻觉发生概率。

不过,石霖强调,从现有研究结论来看,大模型幻觉难以从根本上被彻底消除。由于大语言模型基于概率生成的技术原理,其本身存在一定的固有局限性,因此当前行业更多是通过技术手段对幻觉进行缓解和控制,而非完全消灭幻觉。

他同时提醒,用户在使用大模型时,也应充分认识其能力边界和不确定性。尽管思维链等推理机制能够在一定程度上降低幻觉率,但目前并没有充分证据表明推理过程越长、越复杂,幻觉就一定越少。

值得关注的是,石霖提到,围绕幻觉是否完全有害,学术界和产业界也存在一些讨论。他表示,幻觉本质上是一种偏离事实或既有认知的表达,但在部分观点看来,这种非线性的生成方式也可能与创造性、创新性存在一定关联。因此,对于幻觉现象的认识仍存在不同视角。

石霖还披露了中国信通院在大模型幻觉领域的最新研究成果。据介绍,中国信通院自去年开始构建包含5000余条样本的幻觉测试集,从忠实性和事实性两个维度开展专项评测。研究发现,当前主流模型的事实性幻觉总体低于忠实性幻觉,后者已成为影响模型可靠性的重要问题。

测试结果还显示,在同类型模型中,参数规模越大,整体幻觉率越低。与此同时,推理模型相较于传统通用模型表现出更好的幻觉控制能力,在一定程度上有助于缓解幻觉问题,但并不能完全消除幻觉;而经过蒸馏压缩的模型,则可能出现忠实性幻觉增加的问题。

石霖表示,未来需要通过技术创新、安全治理和标准建设等多方面协同推进,不断提升人工智能系统的真实性、可靠性和可信度,推动人工智能产业健康有序发展。

采写:南都N视频记者 黄莉玲 发自北京

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
维尼修斯破门 巴西战平海地

维尼修斯破门 巴西战平海地

体坛周报
2026-06-19 18:56:12
双胞胎“同母异父”,亲子鉴定结果让丈夫崩溃,妻子被迫说出真相

双胞胎“同母异父”,亲子鉴定结果让丈夫崩溃,妻子被迫说出真相

大果小果妈妈
2026-05-24 08:20:07
FIFA拒绝向奥乔亚授予世界杯传奇徽章,墨西哥足协考虑上诉

FIFA拒绝向奥乔亚授予世界杯传奇徽章,墨西哥足协考虑上诉

懂球帝
2026-06-20 06:20:05
甘肃通渭李女士事件大反转!聊天记录曝光:从被动接受到主动迎合

甘肃通渭李女士事件大反转!聊天记录曝光:从被动接受到主动迎合

火山詩话
2026-06-19 08:19:30
北航这次脸都被扇肿了!3炮连响堪称灾难,网友:杨博导这招真高

北航这次脸都被扇肿了!3炮连响堪称灾难,网友:杨博导这招真高

火山詩话
2026-06-20 05:14:13
焦点战!巴西VS海地首发:1.5亿欧熊皇+胖虎领衔 24岁锋霸沦为替补

焦点战!巴西VS海地首发:1.5亿欧熊皇+胖虎领衔 24岁锋霸沦为替补

风过乡
2026-06-20 07:14:47
是谁在有计划、有系统、有组织的摧毁我们的义务教育?

是谁在有计划、有系统、有组织的摧毁我们的义务教育?

李老师讲最真教育
2026-06-19 19:17:32
欠了快400亿,骂了整十年,华西村硬是靠一笔意外投资活过来了

欠了快400亿,骂了整十年,华西村硬是靠一笔意外投资活过来了

那些不堪年华追忆流
2026-06-20 03:26:32
3天吸金20亿:明星开演唱会,终于惹急普通人

3天吸金20亿:明星开演唱会,终于惹急普通人

金错刀
2026-06-19 17:35:19
河南26岁帅哥时颖去世,结婚仅半年,妻子颜值高,悲痛透露原因

河南26岁帅哥时颖去世,结婚仅半年,妻子颜值高,悲痛透露原因

180视角
2026-06-19 12:33:45
今生润中国,来世达利特?为何中国一篇推文会让印度人破了大防?

今生润中国,来世达利特?为何中国一篇推文会让印度人破了大防?

静夜史君
2026-06-20 01:46:06
里子面子都丢了!管不住下半身的那英,还是为自己的狂妄付出代价

里子面子都丢了!管不住下半身的那英,还是为自己的狂妄付出代价

潘殤旅行浪子
2026-06-18 19:03:20
80度电池包!史上“最野蛮增程车”登场:真有这个必要吗?

80度电池包!史上“最野蛮增程车”登场:真有这个必要吗?

少数派报告Report
2026-06-19 10:28:16
英国博主:西方国家系统性的集体讨厌中国,压根不是偏见

英国博主:西方国家系统性的集体讨厌中国,压根不是偏见

怪味历史连连看
2026-06-17 14:59:56
美伊会谈取消,此前表达强烈不满的以色列被万斯喊话“只有总统特朗普还同情你们”

美伊会谈取消,此前表达强烈不满的以色列被万斯喊话“只有总统特朗普还同情你们”

新民周刊
2026-06-19 22:45:36
世界杯:拜仁新援闪击比肩萨拉赫 摩洛哥1-0苏格兰 独享非洲第一

世界杯:拜仁新援闪击比肩萨拉赫 摩洛哥1-0苏格兰 独享非洲第一

钉钉陌上花开
2026-06-20 08:00:07
宝妈避雨被赶后续:大批顾客退单,道歉也难平众怒,门店口碑崩了

宝妈避雨被赶后续:大批顾客退单,道歉也难平众怒,门店口碑崩了

北纬的咖啡豆
2026-06-18 21:59:34
特朗普:伊朗走投无路了,彻底完蛋了!我们就把这60天耗完,他们拿不到钱,一分钱都没有

特朗普:伊朗走投无路了,彻底完蛋了!我们就把这60天耗完,他们拿不到钱,一分钱都没有

极目新闻
2026-06-19 21:53:27
彻底炸锅!世界杯被要求禁止凯恩式点球,英格兰骗门将太耍赖

彻底炸锅!世界杯被要求禁止凯恩式点球,英格兰骗门将太耍赖

一隅非生
2026-06-19 08:05:13
制裁落地第七天:菲防长家族生意开始崩了,12万吨香蕉烂在港口。

制裁落地第七天:菲防长家族生意开始崩了,12万吨香蕉烂在港口。

阿振观点
2026-06-19 06:50:54
2026-06-20 08:11:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
617681文章数 3589174关注度
往期回顾 全部

科技要闻

Anthropic被禁,智谱却涨疯了

头条要闻

上海一男子为护孕妻两次劝烟遭掐脖殴打 提起民事诉讼

头条要闻

上海一男子为护孕妻两次劝烟遭掐脖殴打 提起民事诉讼

体育要闻

世界杯最不知名球员,没上场先涨粉600万

娱乐要闻

孙艺珍晒母子合照!4岁小甜豆暴风成长

财经要闻

Token低价陷阱

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

家居
房产
游戏
教育
公开课

家居要闻

绿意盎然 自然之境

房产要闻

商业清零式退潮,大量住宅登场!三亚又要大规模调规!

《GTA6》封面或暗藏重大伏笔!反派角色已经出现?

教育要闻

今年重点大学都在扩招,高考志愿该怎么填才能抓住机会?攻略来了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版