网易首页 > 网易号 > 正文 申请入驻

别被AI坑了钱包!AI造谣真相曝光,只需一个指令让它不再瞎编

0
分享至

你有没有过这种经历?问AI“XX名人的代表作”,它列得头头是道,结果一半是编的;让它写份专业报告,引用的“权威数据”根本查无此据。

这就是AI的“幻觉”,明明在胡说,却自信得像个专家,直到OpenAI那篇《语言模型为什么会产生幻觉》的论文出来,我才恍然大悟:这事儿,远比我们想的复杂。

咱先掰扯清楚:AI为啥会“睁眼说瞎话”?答案特扎心,这是它的“出厂设置”,生成式AI的本质,就是“猜下一个词”:根据上下文,算哪个词出现的概率高,就接哪个。

它判断一句话对不对,不靠逻辑,靠“眼熟”,只要句子符合它从海量数据里学来的统计规律,就觉得是对的。

就拿“万里无云的天空飘着朵朵白云”来说,人类一听就知道矛盾,AI却只懂算概率:“万里无云”和“飘着白云”放一起的概率太低,所以不对,它根本不懂“逻辑”,只认“概率”。

可概率这东西,从来不是100%靠谱啊,数据太少它得瞎猜,概念太复杂它理解不了,训练数据本身就有错,这些都会让它判断失误。

而一旦判断错了,生成内容自然就成了“幻觉” ,OpenAI说得明明白白:幻觉不是意外,是概率天性里的必然!

按理说,知道AI会错,咱该教它“不确定就别说”吧?可事实恰恰相反,是我们在逼它“胡说”。

现在衡量AI能力的考试,全是“答对得分,答错不扣分”,这不就和咱们考试蒙答案一个理儿吗?反正蒙对了赚,蒙错了不亏,为啥不试试?

OpenAI给的例子太真实了:O4-mini准确率24%,错误率却高达75%,弃权率才1%,而GPT-5-thinking-mini准确率22%,错误率只有26%,弃权率却有52%。

说白了,O4-mini就是敢蒙,才显得“正确率高”,可幻觉也多啊。

还有Deepseek-R1,训练时要求必须写推理过程,答对才加分,答错不扣分,结果它的幻觉率一直居高不下,原来是我们的奖励机制,在变相鼓励AI“与其闭嘴,不如蒙一把”。

既然幻觉躲不开,又被我们“鼓励”得更泛滥,就没招了吗?有但不是求“零幻觉”,而是让AI“该说才说”。

OpenAI给的方向特实在:改奖励机制,别再搞“答对得1分,答错得0分”了,得改成“答对加分,答错扣分,弃权不扣分”。

这样一来,AI碰到没把握的题,就不敢随便蒙了,只会乖乖说“我不知道”。

这就像给AI戴了个“概率口罩”:有十足把握时,它能侃侃而谈,没把握时,就闭上嘴不误导人,比起追求永远正确的“神话”,让AI学会“知之为知之,不知为不知”,才是真的有用!

看完这篇论文,我总算不怪AI“骗人”了,它本就不懂“真”与“假”,只懂“概率”与“得分”,幻觉不是AI的错,是我们没教它“诚实”的重要性。

以后再被AI忽悠,咱也别光生气:想想它是不是又在“蒙答案”了?而那些让AI“说不知道”的产品,才是真的懂行。

说不定用不了多久,AI就能既聪明又靠谱,再也不是那个“一本正经胡说八道”的家伙了,咱等着瞧。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
甘肃玉门一化工企业发生火灾,已致3人死亡

甘肃玉门一化工企业发生火灾,已致3人死亡

界面新闻
2026-04-07 12:06:37
中国国民党主席郑丽文率团抵达大陆

中国国民党主席郑丽文率团抵达大陆

财闻
2026-04-07 13:16:14
郑丽文来访时间安排有巧思,她要去江苏可以谒陵,她已经56岁了

郑丽文来访时间安排有巧思,她要去江苏可以谒陵,她已经56岁了

领悟看世界
2026-04-01 00:23:25
郭艾伦辟谣:我没有被骗

郭艾伦辟谣:我没有被骗

大象新闻
2026-04-07 14:09:34
轰动!湖人消息震动NBA,詹姆斯急眼了,联盟格局或大变

轰动!湖人消息震动NBA,詹姆斯急眼了,联盟格局或大变

兰亭墨未干
2026-04-07 07:49:33
浙大名嘴揭开残酷真相:当年恒大倒台,压根不是因为2万亿负债!

浙大名嘴揭开残酷真相:当年恒大倒台,压根不是因为2万亿负债!

阿器谈史
2026-04-02 13:31:44
这个男士是郭延军,他的鼻子的宽度、面积、体积为普通人2倍以上

这个男士是郭延军,他的鼻子的宽度、面积、体积为普通人2倍以上

岁月有情1314
2026-04-01 11:25:58
全红婵回乡祭祖一个动作火遍全网!褪去冠军光环的她,圈粉无数

全红婵回乡祭祖一个动作火遍全网!褪去冠军光环的她,圈粉无数

社会日日鲜
2026-04-06 17:26:19
伊朗宣布决定,霍尔木兹海峡通航,高人指点,打起石油持久战

伊朗宣布决定,霍尔木兹海峡通航,高人指点,打起石油持久战

闻识
2026-04-07 13:06:26
王楚钦冠军仅1天,奥委会就这样评价他,16字一针见血,字字戳心

王楚钦冠军仅1天,奥委会就这样评价他,16字一针见血,字字戳心

温读史
2026-04-07 10:10:52
郑丽文今率团访陆,两岸和平出现曙光,谢寒冰:宣扬“武统”多是绿营的人

郑丽文今率团访陆,两岸和平出现曙光,谢寒冰:宣扬“武统”多是绿营的人

海峡导报社
2026-04-07 09:09:13
约基奇35+14+13,赛后第一时间找杨瀚森,开拓者新老板说出大实话!

约基奇35+14+13,赛后第一时间找杨瀚森,开拓者新老板说出大实话!

野渡舟山人
2026-04-07 13:49:07
1990年丁盛到北京后,给聂帅写了封信请求:把我的关系转到广州吧

1990年丁盛到北京后,给聂帅写了封信请求:把我的关系转到广州吧

明月清风阁
2026-04-07 13:30:06
烧光350亿后破产,威马创始人沈晖逃亡海外行踪成谜

烧光350亿后破产,威马创始人沈晖逃亡海外行踪成谜

一号位故事
2026-04-04 20:02:32
掘金逆转战况,火箭成最大赢家获首轮优势

掘金逆转战况,火箭成最大赢家获首轮优势

徐扙老表哥
2026-04-07 13:46:02
中国正式向全世界宣告,,解放军打日本不用获得任何人的同意授权

中国正式向全世界宣告,,解放军打日本不用获得任何人的同意授权

世界军事格局
2026-04-06 22:10:13
这张照片的含金量有多高,你看的懂吗

这张照片的含金量有多高,你看的懂吗

朗威谈星座
2026-04-04 16:51:24
沉默3天,北京迎来一位贵客,见面先握紧中方手,特朗普又赌输了

沉默3天,北京迎来一位贵客,见面先握紧中方手,特朗普又赌输了

南宗历史
2026-04-06 04:41:56
142-126!骑士逆转灰熊,莫布里22+6,灰熊29个三分平历史纪录

142-126!骑士逆转灰熊,莫布里22+6,灰熊29个三分平历史纪录

星Xin辰大海
2026-04-07 13:23:10
61岁陈瑾和巫刚昆明被偶遇,曝已在这里定居,在一起逾20年仍未婚

61岁陈瑾和巫刚昆明被偶遇,曝已在这里定居,在一起逾20年仍未婚

观察鉴娱
2026-04-04 17:24:45
2026-04-07 14:39:00
阿晪美食
阿晪美食
喜欢做菜,享受做菜的过程
2002文章数 149关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

美被困飞行员靠定位器求救 回答其父私密问题验明身份

头条要闻

美被困飞行员靠定位器求救 回答其父私密问题验明身份

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

张艺上浪姐惹争议 黄景瑜前妻发文内涵

财经要闻

2026年,全国租房市场还有波降价潮

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

健康
亲子
旅游
艺术
军事航空

干细胞抗衰4大误区,90%的人都中招

亲子要闻

在这平凡的一天,我们成为爸爸妈妈啦!

旅游要闻

Color Walk、赏味游……这个假期你更爱哪种?

艺术要闻

美丽风光看不尽

军事要闻

美军营救飞行员出动155架飞机

无障碍浏览 进入关怀版