网易首页 > 网易号 > 正文 申请入驻

为啥AI宁可瞎编,也不直接说“我不会,不知道”呢?它到底咋想的

0
分享至

你有没有这种体验,问个AI问题,它在那儿口若悬河、头头是道地给你讲一大篇,结果你一查,好家伙,里头好些内容都是它自己“编”出来的!明明不知道,为啥不直接说句“我不会”呢?它到底咋想的呢?



你可能觉着AI就是个超级计算机,啥都知道。实际上现在的AI,特别是咱常聊天的那种大语言模型,它压根没有“知道”或“不知道”这概念,它更像一个顶尖的“语言模仿大师”。

它学的不是一本本百科全书,而是海量的文字资料——网页、书籍、文章,啥都有。它的核心任务,是看你输入的文字后,根据学到的概率和模式,“接”出最可能、最连贯、最符合人类习惯的下文。

你可以把它想象成一个超级版的“词语接龙”玩家,目标就是把句子顺下去,让人听着顺耳、看着合理。



当你问它一个具体事实,比如“珠穆朗玛峰的具体经纬度是多少?”它脑子里(其实是参数里)如果恰好有相关的数字序列,并且训练时见过靠谱的答案,它就可能准确地“接”出来。

但如果它“学习资料”里这部分信息模糊、冲突,或者干脆没有,它的“接龙本能”依然会驱动它生成一个看起来像那么回事的答案——可能是它把别的山的坐标记混了,也可能是它根据描述山峰的文本模式“合成”了一组数字。



这时候,它不是在“说谎”或“逞能”,它只是在忠实地执行任务:生成一段符合语言模式的文字。它根本没有“事实核查”这个内置功能,也没有“我对此不确定”的自我意识。

它的设计目标就是“流畅”,而非“真实”。



那为啥不给它设个安全阀,让它学会说“我不知道”呢?工程师们当然想过,也在使劲儿做!这恰恰是当前AI研发的一个重点和难点,他们管这叫“提高模型的诚实性”或“减少幻觉”。

但这活儿不好干,让AI准确判断自己“知不知道”,本身就需要极高的认知能力。

它得先理解问题的精确边界,再快速扫描自己庞杂的参数记忆,评估信息的可靠性和完整性,这本身就是一个复杂的元认知问题,对现阶段的AI来说太难了。



从训练数据上看,人类文本里充斥着各种断言、推测和看似肯定的表达,直接说“不知道”的例子相对少。AI模仿这种数据,自然也更倾向于做出肯定性回应。

产品设计上,一个总回答“我不知道”的助手,用户体验会大打折扣,开发者得在“诚实”和“有用”之间走钢丝。

不过,情况正在变好。研究人员正通过多种方法给AI“上课”。比如,在训练时加入更多需要推理和承认知识边界的数据;用强化学习奖励那些诚实回答、对不确定问题表示谨慎的AI行为。

在系统层面给AI加上“护栏”,当它遇到高风险或无法验证的问题时,自动触发谨慎回应或建议用户查证。这些努力都是为了给AI装上“谨慎之心”,让它明白,有时候闭嘴比瞎说更有价值。



跟AI聊天,发现它说得有鼻子有眼却不太对劲时,这背后不是它耍小聪明,而是当前技术阶段的一种局限。它就像一个拥有惊人语言天赋、但缺乏现实经验和事实核查能力的天才少年,话匣子一打开就容易搂不住。

对我们使用者来说,AI是个强大的信息处理和语言工具,但它不是全知全能的神。面对重要信息,尤其是涉及事实、数据、健康、法律这些关键领域,咱得多留个心眼,把它的话当作一个高级参考,而不是最终答案。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
关于“七一勋章”提名建议人选的公示

关于“七一勋章”提名建议人选的公示

澎湃新闻
2026-06-01 08:43:30
炼出来一堆废铁:1958年全民大炼钢铁,究竟炼掉了什么?

炼出来一堆废铁:1958年全民大炼钢铁,究竟炼掉了什么?

浪子说
2026-05-28 00:05:03
夏天,这碱性菜再贵也要多吃,一降火、二解暑,三补钙补钾,好吃

夏天,这碱性菜再贵也要多吃,一降火、二解暑,三补钙补钾,好吃

阿龙美食记
2026-05-29 21:52:34
48岁关节外科主任医师猝死:连台手术后倒在家中,“眼下乌青”是同行最熟悉的遗言

48岁关节外科主任医师猝死:连台手术后倒在家中,“眼下乌青”是同行最熟悉的遗言

医客
2026-06-01 10:08:31
泰山四大重磅变动!韩鹏深造、外教上任、新援10号落地济南

泰山四大重磅变动!韩鹏深造、外教上任、新援10号落地济南

体坛小鹏
2026-06-01 10:10:38
长期跑步的人,会失去“肉欲”?网友:经常跑的人,那方面都不行

长期跑步的人,会失去“肉欲”?网友:经常跑的人,那方面都不行

马拉松跑步健身
2026-05-29 21:25:54
正大量上市,钾含量是苹果8倍,6月使劲吃,腿脚有劲,精神饱满

正大量上市,钾含量是苹果8倍,6月使劲吃,腿脚有劲,精神饱满

阿龙美食记
2026-05-28 16:48:12
小女生作用不大?说这话的人只是嘴硬而已!

小女生作用不大?说这话的人只是嘴硬而已!

飛娱日记
2026-05-14 07:35:52
摩根士丹利:AI引爆5万亿美元能源超级周期,未来十年最大的投资机会来了

摩根士丹利:AI引爆5万亿美元能源超级周期,未来十年最大的投资机会来了

新浪财经
2026-06-01 04:07:13
是不是太过了?神舟飞船落地,地面上居然安排有专门的开舱手岗位

是不是太过了?神舟飞船落地,地面上居然安排有专门的开舱手岗位

阿龙聊军事
2026-05-30 07:47:52
网约车最大的误会,是所有人都觉得对方赚了钱

网约车最大的误会,是所有人都觉得对方赚了钱

从前这些事
2026-05-30 15:26:42
徐州女幼师用热熔枪连烫两次孩子嘴唇!多名家长称早发现孩子有伤

徐州女幼师用热熔枪连烫两次孩子嘴唇!多名家长称早发现孩子有伤

听心堂
2026-05-29 21:22:08
51岁贝克汉姆身价暴涨海岛度假,52岁贝嫂又黑又老,14岁小七胖了

51岁贝克汉姆身价暴涨海岛度假,52岁贝嫂又黑又老,14岁小七胖了

照见古今
2026-05-31 21:02:40
央视披露:某国16名潜艇兵佩戴智能手表跑步时,无意中泄露潜艇巡逻计划;健身APP收集全球用户运动信息,情报人员推断出目标军事基地等

央视披露:某国16名潜艇兵佩戴智能手表跑步时,无意中泄露潜艇巡逻计划;健身APP收集全球用户运动信息,情报人员推断出目标军事基地等

扬子晚报
2026-05-31 09:33:35
凭什么一集20分钟,却让观众直呼“比40集的剧还下饭”?

凭什么一集20分钟,却让观众直呼“比40集的剧还下饭”?

阿废冷眼观察所
2026-05-31 21:38:11
孙科比继母宋庆龄大两岁,从不叫母亲,却守住了孙家最体面的分寸

孙科比继母宋庆龄大两岁,从不叫母亲,却守住了孙家最体面的分寸

芳芳历史烩
2026-05-31 13:51:50
技不如人?神二十一回家,我国航天员抬着出舱,美国的却活蹦乱跳

技不如人?神二十一回家,我国航天员抬着出舱,美国的却活蹦乱跳

小俎娱乐
2026-05-31 14:06:42
时代的起点!重建马刺第1次季后赛直通总决 波波维奇最伟大的作品

时代的起点!重建马刺第1次季后赛直通总决 波波维奇最伟大的作品

云隐南山
2026-05-31 13:20:08
中国人均商铺率仅有美国1/8!利润太微薄为房东打工,人口和消费又不景气

中国人均商铺率仅有美国1/8!利润太微薄为房东打工,人口和消费又不景气

风向观察
2026-05-31 11:49:14
成龙、李连杰、甄子丹、吴京!《1941》立项,港片真正的王要来了

成龙、李连杰、甄子丹、吴京!《1941》立项,港片真正的王要来了

得得电影
2026-05-31 13:49:16
2026-06-01 15:00:49
向航说 incentive-icons
向航说
坐下来,听我讲讲你不知道的科技奇闻故事
2933文章数 740关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

北大硕士在德国读博迷奸女子 曾是国家奖学金获得者

头条要闻

北大硕士在德国读博迷奸女子 曾是国家奖学金获得者

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

艺术
数码
亲子
房产
军事航空

艺术要闻

吴镇写竹,清清爽爽

数码要闻

英伟达发布DLSS 4.5光线重建:支持全部RTX显卡,8月推出

亲子要闻

解放军的冲锋枪

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

军事要闻

韩国最大军工企业爆炸 已造成5人死亡

无障碍浏览 进入关怀版