网易首页 > 网易号 > 正文 申请入驻

隐蔽的陷阱:为什么有的AI“一学就会,一用就废”

0
分享至

其中一个原因是“数据泄露”。也就是最后测试模型的时候,测试集中的样例是模型在训练时候见过的。就好比考试的卷子中,出现了你在练习过程中见过的完全一样的题目。你在这张卷子上的成绩很高,但是这个分数不能反映你真正理解内容的水平。还有另外一个导致模型在实际部署中性能变差的原因在于:预测式AI经常容易把相关性(Correlation)当作因果性(Causation)。

AI模型在训练的过程中,会从输入中寻找一切能够帮助其更好地预测输出的特征,但是到底这些特征和输出是否为因果关系,AI模型是无法分辨的。这导致的结果,就让AI模型在训练过程中表现出一种被称为“走捷径”的行为。这些“捷径”往往是基于非因果的虚假关联,而非我们所期望的、具有泛化能力的真实因果逻辑。一个典型的例子,和新冠肺炎(COVID-19)的影像学诊断有关。之前有大量研究声称能通过胸部X光片高精度区分新冠患者和普通肺炎患者。然而,一项针对400多篇相关论文的系统审查发现,这些研究因严重方法论缺陷几乎不具备临床应用价值。

其中一个致命缺陷和数据集有关。在多个研究的训练数据中,几乎所有新冠肺炎影像来自成人,而所有未患病影像来自儿童。AI精准捕捉到了这个统计规律:“成人→可能患新冠;儿童→可能只是普通感冒”。这个模式让AI在原数据集上取得极高准确率,但逻辑是错误的。模型并非识别磨玻璃影、白肺等真正的新冠影像特征,而是在判断图像是否来自成人。

但是值得我们注意的是,AI模型的设计者在部署之前,并不容易发现这个问题。我们来回顾一下AI模型的设计者在部署之前是如何测试自己的模型的:他们总是把采集到的数据集分成“训练集”和“测试集”,然后用测试集来测试模型的性能。由于“训练集”和“测试集”来自同一批数据,只是人为把这批数据分成了两个集,因此“测试集”中,上面的统计规律“如果病人是成人,那么他很可能患有新冠;如果病人是儿童,则他很可能只是普通感冒”仍然成立。所以模型在这个测试集上的表现仍然很好,但是到现实中就不行了。这就是因为把相关性当作因果性导致的预测错误。

值得注意的是,当前的许多AI模型本质上是“黑箱”,其决策依据并非以显式的逻辑规则呈现,而是隐含在数以万计的复杂参数中。这种固有的不透明性,导致我们通常无法直接审视模型做出具体判断的内在机理。因此,当模型依赖虚假关联而非真实的因果特征做出判断时,这类错误将变得极为隐蔽,难以在标准测试中被发现。如何打开AI的“黑箱”,实现模型的可解释性,已成为人工智能领域至关重要的前沿方向。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李亚鹏房东回应来了!大反转看傻全网!

李亚鹏房东回应来了!大反转看傻全网!

广告创意
2026-01-19 18:23:10
2025年出生人口仅792万比预计最低方案都还要低,10年出生人口减少1000万

2025年出生人口仅792万比预计最低方案都还要低,10年出生人口减少1000万

小星球探索
2026-01-19 12:04:51
厦门最大的国企,干亏损了

厦门最大的国企,干亏损了

拾遗地
2026-01-19 10:38:44
卢浮宫失窃案最新监控画面曝光 安保人员目睹作案过程

卢浮宫失窃案最新监控画面曝光 安保人员目睹作案过程

新京报
2026-01-19 08:00:02
李亚鹏翻红了!带货金额和打赏收入,全网第一

李亚鹏翻红了!带货金额和打赏收入,全网第一

金牌娱乐
2026-01-19 09:47:35
“回国祸害人了?”女留子毕业美图引群嘲,网友:看过牢a的都懂

“回国祸害人了?”女留子毕业美图引群嘲,网友:看过牢a的都懂

泽泽先生
2026-01-19 21:34:46
31岁舞蹈老师因罕见病去世 丈夫希望妻子被更多人记住

31岁舞蹈老师因罕见病去世 丈夫希望妻子被更多人记住

红星新闻
2026-01-19 12:30:39
昆山企业家回应“愿为嫣然天使儿童医院免费提供场地”:已到北京与院方商讨,建分院的可能性为零,正探讨其他合作

昆山企业家回应“愿为嫣然天使儿童医院免费提供场地”:已到北京与院方商讨,建分院的可能性为零,正探讨其他合作

极目新闻
2026-01-19 22:22:38
梁小龙去世早有预兆,关门弟子爆料3个“不良爱好”,都是催命符

梁小龙去世早有预兆,关门弟子爆料3个“不良爱好”,都是催命符

查尔菲的笔记
2026-01-19 12:35:23
嫣然天使儿童医院欠租千万:目前正常营业,已筹得900万元善款但不能用于交房租,是否搬迁仍是现实问题

嫣然天使儿童医院欠租千万:目前正常营业,已筹得900万元善款但不能用于交房租,是否搬迁仍是现实问题

重案组37号
2026-01-19 15:43:04
2025年出生人口减少162万人,劳动年龄人口减少662万人

2025年出生人口减少162万人,劳动年龄人口减少662万人

何亚福
2026-01-19 11:27:46
人民日报下场点评西贝事件,罗永浩有点危险了

人民日报下场点评西贝事件,罗永浩有点危险了

麦杰逊
2026-01-19 13:23:58
如果普京被暗杀就“让整个欧洲消失”,评论区令人叹气!

如果普京被暗杀就“让整个欧洲消失”,评论区令人叹气!

走读新生
2026-01-19 12:32:52
你管得了我闭嘴,你还管得了我上哪家馆子去消费?

你管得了我闭嘴,你还管得了我上哪家馆子去消费?

夜半挑灯看吴钩
2026-01-19 22:32:27
河南丈夫出轨、原配成“第一爽文女主”的瓜:她真正厉害在哪里?

河南丈夫出轨、原配成“第一爽文女主”的瓜:她真正厉害在哪里?

桌子的生活观
2026-01-19 12:32:42
陈光标喊话李亚鹏邀请王菲办演唱会,称愿全额承担出场费,演唱会收入将捐赠给嫣然医院

陈光标喊话李亚鹏邀请王菲办演唱会,称愿全额承担出场费,演唱会收入将捐赠给嫣然医院

都市快报橙柿互动
2026-01-19 20:53:21
幻方量化年收益率曝光,DeepSeek梁文锋发财了

幻方量化年收益率曝光,DeepSeek梁文锋发财了

新行情
2026-01-19 15:10:45
这一仗就是要打掉日本的优越感

这一仗就是要打掉日本的优越感

笑香风云淡
2026-01-19 17:22:19
吴晓波建议:把每年1.4万亿元烟草税收入直接“转移”为生育补贴,交税有利生育

吴晓波建议:把每年1.4万亿元烟草税收入直接“转移”为生育补贴,交税有利生育

六子吃凉粉
2026-01-19 17:17:23
792万新生儿再创历史新低!补贴到位了,年轻人为啥还是不愿生?

792万新生儿再创历史新低!补贴到位了,年轻人为啥还是不愿生?

今朝牛马
2026-01-19 15:13:43
2026-01-20 09:19:00
一头漂浮在北京的大妞 incentive-icons
一头漂浮在北京的大妞
爱好财经、文史
1425文章数 495关注度
往期回顾 全部

科技要闻

去年预亏60亿后再投百亿 两大车企紧抱华为

头条要闻

女子订3间双床房被告知是3张单人床 退订扣80%违约金

头条要闻

女子订3间双床房被告知是3张单人床 退订扣80%违约金

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

2026股市猜想

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

健康
数码
时尚
公开课
军事航空

血常规3项异常,是身体警报!

数码要闻

荣耀Magic8 RSR体验:7999元买个不强调影像的超大杯,反而对了?

码住抄作业!春节见人不翻车就靠这8样!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

古美关系高度紧张 古巴启动"战争状态"

无障碍浏览 进入关怀版