网易首页 > 网易号 > 正文 申请入驻

为什么大模型要骗你?

0
分享至

文|象先志

本文开始前,「象先志」先问大家三个问题,大家可以一起思考下

1. AI为什么要骗你?

2. 幻觉是大语言模型的bug还是feature?

3. 为什么AI总是一本正经地胡说八道?

OpenAI前段时间发了篇论文,题目叫 《Why language models hallucinate》,解释为什么大语言模型会产生幻觉。「象先志」会先介绍下论文内容,然后「象先志」再聊聊对这个问题一些不一样的看法。


稍微有点硬核,希望大家耐心看到最后。这篇论文的基本结论,是大模型产生幻觉,原因是开发人员在训练它的时候鼓励它这么做。就是说大模型天性是好的,是跟错了人,后面路才走歪的。

为什么这么说呢?在训练大模型的时候,厂商内部会跑很多的测试,来评价和校准大模型的好坏。这些测试只看准确率,不看错误率,所以哪怕模型不知道答案是什么,它还是会倾向猜一个答案。就跟我们考试的时候,哪怕不会做,答题卡上也要涂满是一个道理。

要解决这个问题,那就对症下药嘛,论文作者呼吁大家要改变评测基准,不要再搞那套基于准确率的评估方法了,要鼓励大模型承认自己的无知,而不是一本正经的瞎咧咧。

论文主要说的就是这事,「象先志」想逻辑大家应该很容易理解。坦白讲,虽然说论文是OpenAI发的,但「象先志」觉得没有什么新东西。当然OpenAI出来发有个好处,人家行业地位摆着这,出来吼两嗓子,有助于从业者更快地认识到问题,然后去针对性地解决。

聊完论文,「象先志」再聊下对模型幻觉问题的理解。「象先志」认为语言模型本质上没有幻觉不幻觉的概念,它们只是基于已有的信息,去预测下一个token。你训练数据里是什么样的概率分布,它就会尽量去拟合这个分布,仅此而已。不管你怎样去调整模型评估的方式方法,它其实仍然是在迎合新的评价指标。

比如说,原来答错不扣分,现在答错要扣分,那模型肯定更谨慎,不确定的事实,不知道的答案,它就更多承认自己不确定或者不知道。

但这样还是存在两个问题。

第一,模型仍然是没有事实和非事实的概念区分,它不是因为这个东西是幻觉,它才不输出;它是因为这个输出会扣分,它才不输出。

这就引出了第二个问题。按照这个理解角度,要减少模型的幻觉,就是要合理设置模型的评估模式,去尽可能引导模型的输出跟人类认知上的事实陈述重合。

这显然是一种治标不治本的方式,因为模型的输出结果跟人类认为的事实是两个语言集合,我们现在等于没办法,直接瞄准后面这个集合做优化,所以只能退而求其次,对前一个集合做间接的限制。

但这样搞有多大效果?上限在哪里?都是不知道的。

打个比方吧。人发烧是因为身体内的免疫系统在剧烈反应,这个反应是有一个根本的诱发因素的,比如说病毒感染。那现在要解决发烧的问题,一种办法是直接对病毒做处理,上一些抗病毒的药物,病毒解决了,身体自然就不发烧了。

还有一种办法是什么呢?就是把体温当做优化指标,用药物把免疫反应按下去,或者在头上敷冰块,反正要达到降体温的目的。

现在OpenAI提的解决方案就类似于后者。这个方法有没有用?当然有用,就像人如果一直发烧发高烧,脑子就烧坏掉了,先把体温降下来、缓解症状,是治疗步骤中必要的环节。

OpenAI新的GPT-5的确也比之前模型要好很多,幻觉症状有明显的缓解。但这能不能解决根本问题呢?我觉得很难,你最后还是需要找到发烧的原因才行。

只不过跟生病不一样,人发烧是有客观原因的,可能受限于医学发展程度医生找不到,但我们知道这个原因是客观存在的。而语言模型的幻觉问题有可能是与生俱来的,发烧就是它身体正常新陈代谢的一部分,你解决不了。没那个能力,知道吧?

顺便说一句 ,刚才「象先志」又被AI给骗了。「象先志」询问柯洁获得过几个世界冠军时,ChatGPT非常笃定地回答,"截止2025年9月,柯洁共获得9个世界冠军,还列出了是哪几次以及哪一年。"


本来以为是GPT语料被污染了,因为年初LG杯决赛时柯洁因不服裁判弃赛,随后把微博签名改为"九冠王"。但「象先志」定睛一看,发现情况并没有那么复杂,因为ChatGPT回答里并没有列出2025年的LG杯。

九冠的柯洁,只是它单纯的幻觉。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
将中方送上专车后,特朗普确定了一件事:5年内中国会赶上美国?

将中方送上专车后,特朗普确定了一件事:5年内中国会赶上美国?

君君文谈
2025-11-02 02:40:03
小米前高管王腾公布新去向:和手机行业说再见,正是闯的年纪

小米前高管王腾公布新去向:和手机行业说再见,正是闯的年纪

南方都市报
2025-11-01 23:10:18
光伏自动气象站:驱动清洁能源高效发展的“数据引擎”

光伏自动气象站:驱动清洁能源高效发展的“数据引擎”

山东鸣乔电子科技有限公司
2025-10-04 09:48:07
中方刚复购大豆,美国又变脸,美贸易代表通告全球,继续调查中国

中方刚复购大豆,美国又变脸,美贸易代表通告全球,继续调查中国

叮当当科技
2025-11-02 00:09:19
与去年排名相同,北京国安与山东泰山分别锁定中超第四第五

与去年排名相同,北京国安与山东泰山分别锁定中超第四第五

懂球帝
2025-11-01 18:10:40
欧洲直接迁怒中国!德法选择支持荷兰,要求谈判,中国提一个条件

欧洲直接迁怒中国!德法选择支持荷兰,要求谈判,中国提一个条件

林子说事
2025-10-31 09:15:10
还有五天,一场决定全球经济走向的豪赌即将揭晓!

还有五天,一场决定全球经济走向的豪赌即将揭晓!

奇思妙想生活家
2025-11-01 14:42:24
冉莹颖做梦也没想到,11岁身高才1米36的儿子,如今竟迎来逆袭

冉莹颖做梦也没想到,11岁身高才1米36的儿子,如今竟迎来逆袭

八斗小先生
2025-10-31 12:19:07
《依依向北风》结局最惨的不是乔正君,也不是王潇,而是他们两个

《依依向北风》结局最惨的不是乔正君,也不是王潇,而是他们两个

80后房车生活
2025-10-31 16:31:28
WTT冠军赛:男单四强已出其二!日本18岁小将获胜,张本智和羡慕

WTT冠军赛:男单四强已出其二!日本18岁小将获胜,张本智和羡慕

郝小小看体育
2025-11-02 00:40:03
市面上常添加硼砂的4种食物,商家从来不吃!很多人都没发现

市面上常添加硼砂的4种食物,商家从来不吃!很多人都没发现

39健康网
2025-11-01 18:55:52
郑州中牟“发小灭门案”:“娘仨面目全非到只认出儿子半张脸!”

郑州中牟“发小灭门案”:“娘仨面目全非到只认出儿子半张脸!”

奇思妙想草叶君
2025-11-02 03:19:38
不止秀肌肉!中国军号突然公布59秒震撼视频,背后用意很深

不止秀肌肉!中国军号突然公布59秒震撼视频,背后用意很深

忠诚TALK
2025-11-01 20:36:04
暴雷!狂骗244亿,超10万老年人上当,康养第一大忽悠终于倒了

暴雷!狂骗244亿,超10万老年人上当,康养第一大忽悠终于倒了

毒sir财经
2025-08-03 23:08:18
后续!新生儿在医院坠床摔成重伤,护工已被停职,孩子状况已好转

后续!新生儿在医院坠床摔成重伤,护工已被停职,孩子状况已好转

温读史
2025-11-01 20:23:24
目瞪口呆,德国又炸发电厂!核电煤电统统炸掉,准备靠中国发电?

目瞪口呆,德国又炸发电厂!核电煤电统统炸掉,准备靠中国发电?

桑启红原
2025-11-01 17:55:37
有点意思!吴宗宪复播,先表态自己是中国人,后又隔空称赞大小S

有点意思!吴宗宪复播,先表态自己是中国人,后又隔空称赞大小S

小咪侃娱圈
2025-11-01 13:17:47
双标?小米直播间造谣者被刑拘,网友对比雷军“200公里刹停”

双标?小米直播间造谣者被刑拘,网友对比雷军“200公里刹停”

热点菌本君
2025-11-01 23:12:54
山形山神官方:因投资方承诺资金未到位,新球场建设将推迟

山形山神官方:因投资方承诺资金未到位,新球场建设将推迟

雷速体育
2025-11-01 20:09:06
会晤结束,发生三大变化,德国醒悟,荷兰后悔,加拿大向中方示好

会晤结束,发生三大变化,德国醒悟,荷兰后悔,加拿大向中方示好

科普100克克
2025-11-01 17:31:01
2025-11-02 04:04:49
蓝鲸新闻 incentive-icons
蓝鲸新闻
财经信息服务平台
122137文章数 193390关注度
往期回顾 全部

科技要闻

事关安世半导体,商务部最新发声!

头条要闻

美国防长国务卿受威胁 躲进军事基地

头条要闻

美国防长国务卿受威胁 躲进军事基地

体育要闻

NBA球员,必须吃夜宵

娱乐要闻

王家卫这波录音,撕烂了遮羞布

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

换新一口价11.98万 第三代蓝电E5 PLUS开启预售

态度原创

时尚
本地
家居
健康
手机

伊姐周六热推:电视剧《树影迷宫》;电视剧《锦月令》......

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

家居要闻

吸睛艺术 富有传奇色彩

核磁VS肌骨超声,谁更胜一筹?

手机要闻

疑似OPPO Find X10被曝光:2亿潜望镜确认加持,其他厂商怎么玩?

无障碍浏览 进入关怀版