网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

号称严谨的AI论文，被3行代码掀了底裤

2026-04-13 09:16:56　来源: 灰度测试中

北京举报

0

分享至

做AI研究的都懂ablation study——砍掉某个模块看效果，像拆乐高看哪块是承重墙。但Towards AI团队发现，这堵墙可能是纸糊的。

他们复现了某顶会论文的实验，按作者描述的方法砍掉"关键模块"，结果模型表现纹丝不动。换种方式砍？性能暴跌。问题出在"怎么砍"上：作者用了特定初始化种子，让被砍的模块恰好处于"休眠态"——相当于拆掉一个本来就没通电的灯泡，然后宣布黑暗不是它造成的。

团队用3行代码验证了漏洞：固定随机种子后重复ablation，同一模块的"重要性"波动高达40%。「你的结论可能只是随机数的函数。」

更麻烦的是审稿机制。 reviewers平均花4小时审一篇论文，ablation细节往往藏在附录第17页。Towards AI统计了NeurIPS 2023的50篇论文，31篇的ablation设置存在模糊空间——不是造假，是"恰好"选择了最有利的数据呈现方式。

团队开源了检测工具AblationGuard，能自动扫描可疑的种子依赖和参数耦合。上线一周，Hugging Face上已有12篇论文被标注"ablation结果存疑"。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

1.8万美金干掉顶级专家！Anthropic开启AI自主进化：Claude竟能自我「开颅」

新智元 2026-04-15 12:36:39
0 跟贴 0
目标更重要？国内公司超越Generalist，进化到动作中心世界模型

机器之心Pro 2026-04-14 15:32:50
0 跟贴 0

斯坦福2026AI指数报告发布：5张图看懂AI正在发生什么

DeepTech深科技 2026-04-15 14:21:07
0 跟贴 0

实测参考生之王Vidu Q3:这已经不叫AI生成了,这叫AI驱动整个剧组

机器之心Pro 2026-04-15 14:16:19
0 跟贴 0
刚刚，李飞飞世界模型开源了个渲染神器

机器之心Pro 2026-04-15 14:22:46
0 跟贴 0

李飞飞世界模型“杀手锏”开源！网页3D大场景秒开，手机畅跑1亿点云

智东西 2026-04-15 13:50:28
0 跟贴 0

台湾机车博主酸张雪机车夺冠是钻了规则的漏洞，820比不了本田R9

一万根韭菜 2026-04-13 03:22:06
13 跟贴 13
嫌疑人当面删代码，挑衅警察不懂技术，警察自爆身份吓傻嫌疑人

一剪梅看点 2026-04-13 15:57:18
0 跟贴 0

美国阿波罗11号首次登月代码公开，内存竟只有3.75KB

快科技 2026-04-13 15:40:19
22 跟贴 22
上一个兄弟离职了，我接手了他的代码，我承认没憋住

环亚搞笑 2026-04-14 14:35:36
3 跟贴 3
40岁的单亲妈妈在广州工地“扛楼”年入十多万元：能背150斤水泥

环球网资讯 2026-04-15 09:03:29
20901 跟贴 20901
在一台1970年代的PDP-11上训练Transformer要多久？答案是5.5分钟

机器之心Pro 2026-04-14 10:18:12
0 跟贴 0
开奥迪加油逃单后续：车主“底裤”被扒，彻底社死，结局大快人心

雅儿姐游世界 2026-04-14 02:19:40
49 跟贴 49
小猫这是代码冲突了还是抽筋了，突然就卡了一下

重庆城市TV 2026-04-14 17:04:41
0 跟贴 0
堡垒之夜创作者商店：7个分区背后的流量密码

硅屿手记 2026-04-15 08:40:06
0 跟贴 0
Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

新智元 2026-04-15 08:44:44
0 跟贴 0
这是他们培育种子的过程

老八张 2026-04-11 09:07:58
1 跟贴 1
Steam要抢SteamDB饭碗？30天价格查询功能曝光

固件更新中 2026-04-15 12:44:46
0 跟贴 0
可用即脆弱？VENOM击穿纵向联邦学习

机器之心Pro 2026-04-15 12:27:44
0 跟贴 0
AReaL v1.0开源，智能体强化学习「一键接入」

机器之心Pro 2026-03-05 14:46:18
0 跟贴 0
大批“五一”航班突然取消涉及重庆

环球网资讯 2026-04-14 21:52:45
397 跟贴 397
龙虾军团有了最强「视力」！一眼看图直接写代码-1

机器之心Pro 2026-04-02 16:56:32
0 跟贴 0
巴萨无能狂怒，这个赛季的西蒙尼让他们参不透

澎湃新闻 2026-04-15 12:28:28
21 跟贴 21
男子去亲戚农场遭马犬扑咬成功躲过

荔枝新闻 2026-04-15 07:02:22
45 跟贴 45
跨越23个赛季的统治力：盘点勒布朗-詹姆斯19大传奇纪录

北青网-北京青年报 2026-04-14 19:56:05
112 跟贴 112
你所担心的，我们用实验告诉你，不可能发生！

成年人的生活 2026-04-14 08:58:39
0 跟贴 0
江苏省政府聘任马明龙为省政府参事

江苏新闻 2026-04-15 10:20:00
3 跟贴 3
120W是“型号”不是功率？误导消费者要付出代价

南方都市报 2026-04-13 00:36:10
3612 跟贴 3612
维修三块电路板，都是不通电，看如何轻松修好

朝锋家电维修 2026-04-11 20:32:31
11 跟贴 11
168初中数学常见题，求一个参数值，使分数表达式为整数

我服子佩 2026-04-14 16:40:10
1 跟贴 1
大学生崩溃日：5件事连环翻车实录

硅屿手记 2026-04-15 09:03:46
0 跟贴 0
8年沉默打破：汤姆·威茨为何选Massive Attack复出

固件更新中 2026-04-15 09:58:15
0 跟贴 0
英国医院强制"平等培训"：一场教育风波背后的制度实验

像素与芯片 2026-04-15 09:05:36
0 跟贴 0
女子称体重130多斤生气一脚把称踩爆

荔枝新闻 2026-04-15 07:02:11
32 跟贴 32
举债3.68亿、总投资超7亿，农业实训基地为何不见农业影子？

上观新闻 2026-04-14 21:54:17
1494 跟贴 1494
“辽*8888*”奔驰车陪葬，到底发生了什么？

中国新闻周刊 2026-04-15 07:27:18
1112 跟贴 1112
世界杯将至义务迎来“销量爆发式增长”

环球网资讯 2026-04-14 22:03:34
924 跟贴 924
暴瘦15斤,头发愁白!沪一业主新房噩梦:修了快4年

看看新闻Knews 2026-04-14 20:48:23
182 跟贴 182
NBA官方：东契奇再度加冕得分王约基奇荣获篮板&助攻王

北青网-北京青年报 2026-04-14 20:04:19
285 跟贴 285
库里：伤缺期间没能帮到格林很愧疚，我会调动一切打好附加赛

懂球帝 2026-04-15 11:20:12
7 跟贴 7

日本网友热议《永劫无间》女解说涂黑全脸：十分认同

日本网友热议《永劫无间》女解说涂黑全脸：十分认同

CNMO科技

2026-04-13 14:22:06

不怪国内那么多人想娶她，确实漂亮。

不怪国内那么多人想娶她，确实漂亮。

小椰的奶奶

2026-04-15 13:41:02

北京一奔驰女销售请客户吃饭，细节曝光之后，父母：老脸全丢光了

北京一奔驰女销售请客户吃饭，细节曝光之后，父母：老脸全丢光了

清茶浅谈

2025-03-30 14:32:30

回台后，岛内民调结果惊人，萧旭岑：国民党“郑丽文路线”已确立

回台后，岛内民调结果惊人，萧旭岑：国民党“郑丽文路线”已确立

生活魔术专家

2026-04-15 04:11:05

苹果紧急提醒：请立即更新

南方都市报

2026-04-15 11:51:56

同比增长34%！深圳二手房“银四”行情超预期兑现

同比增长34%！深圳二手房“银四”行情超预期兑现

乐居财经官方

2026-04-15 12:15:16

东南亚7个国家倒向中国！唯独四个与众不同，但结局“早已注定”

东南亚7个国家倒向中国！唯独四个与众不同，但结局“早已注定”

晓劗就是我

2026-04-15 10:51:05

马筱梅泪如雨下，汪小菲在厦门一声不吭，终究是张兰不忍劝了几句

马筱梅泪如雨下，汪小菲在厦门一声不吭，终究是张兰不忍劝了几句

小娱乐悠悠

2026-04-15 10:54:04

国防部话音刚落，东部战区就来真的了！台海方向，有些人该失眠了

国防部话音刚落，东部战区就来真的了！台海方向，有些人该失眠了

闫树军论评

2026-04-14 18:35:59

多地新能源车牌绿色变白色？有博主发布“车牌褪色”教程；交管部门：不合法

多地新能源车牌绿色变白色？有博主发布“车牌褪色”教程；交管部门：不合法

上观新闻

2026-04-14 11:34:06

现场开炮！波兰议员当众嘲讽以色列：看好了，你们国旗长这样才对

现场开炮！波兰议员当众嘲讽以色列：看好了，你们国旗长这样才对

健身狂人

2026-04-15 13:38:26

0-4出局斯洛特宣布今夏大清洗：2.4亿欧双星被摆上货架继续砸钱

0-4出局斯洛特宣布今夏大清洗：2.4亿欧双星被摆上货架继续砸钱

风过乡

2026-04-15 06:51:33

张凌赫参加逐玉庆功宴，低情商发言再引争议，严屹宽提醒全白费

张凌赫参加逐玉庆功宴，低情商发言再引争议，严屹宽提醒全白费

打小我就醜

2026-04-15 03:36:58

外交部宣布：查波将访华

中国网

2026-04-14 10:53:35

从282群的录屏看，就是陈某汐！网友：全红婵说活着就好，我悟了

从282群的录屏看，就是陈某汐！网友：全红婵说活着就好，我悟了

开成运动会

2026-04-14 18:32:59

知名国企集团，六个月没发工资了

知名国企集团，六个月没发工资了

新浪财经

2026-04-13 04:16:19

永鼎股份股价创新高

每日经济新闻

2026-04-15 13:18:04

刚从台湾回来，谈谈一些可能让人不太舒服的真话，有些现实太扎心

刚从台湾回来，谈谈一些可能让人不太舒服的真话，有些现实太扎心

复转这些年

2026-04-15 10:46:03

鲁尼：输球了居然是科纳特出来接受采访，球队的领袖在哪里？

鲁尼：输球了居然是科纳特出来接受采访，球队的领袖在哪里？

懂球帝

2026-04-15 07:59:07

坚决反对中国建造核动力航母？不打仗优点多多，一打仗全是缺点？

坚决反对中国建造核动力航母？不打仗优点多多，一打仗全是缺点？

小嵩

2026-04-14 23:37:17

灰度测试中

生活正在重构，目前还在灰度测试阶段，暂不全量发布。

1364文章数 15关注度

往期回顾全部

科技要闻

手机无死角上网？亚马逊砸百亿硬刚马斯克

头条要闻

浙江61岁男子持长矛杀邻居后自首被判死刑立即执行

头条要闻

浙江61岁男子持长矛杀邻居后自首被判死刑立即执行

体育要闻

三球准绝杀戴大金链：轰30+10自我救赎

娱乐要闻

曾志伟办73岁生日派对，逾百艺人到场

财经要闻

业绩失速的Lululemon:"健康"人设崩塌?

汽车要闻

海豹08内饰首秀大满配“海王”旗舰

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

艺术

时尚

旅游

游戏

教育

艺术要闻

这山水，荡涤胸中尘埃

坏事做尽的疯女人，集体翻红了

旅游要闻

河南一景区推出百元“虎景房”，住客老虎一窗之隔，官方：未发现安全隐患

卡普空《识质存在》开启预载 4月17日正式发售！

教育要闻

超实用！公共俄语四级解题思路,3层渗透法直接套用！

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版