网易首页 > 网易号 > 正文 申请入驻

AI幻觉论文混进高分评审,数千篇投稿或存学术瑕疵

0
分享至

距离 OpenReview 因代码漏洞导致审稿人身份大规模泄露的“开盒事件”仅仅过去不到两周,ICLR 又翻车了。

前两天,AI 内容检测机构 GPTZero 发布的最新调查报告显示,在随机抽取的 300 篇 ICLR 2026 投稿论文中,超过 50 篇论文被检测出存在明显的 AI 幻觉问题。这些问题涵盖了伪造参考文献、捏造不存在的作者以及编造实验数据,其中部分论文在同行评审阶段甚至获得了均分 8.0 的高分评价。


图 | 部分问题论文(来源:GPTZero)

然而,就在今年 8 月 27 日,ICLR 组委会曾正式发布针对 LLM 使用的严格规范,明确要求作者对论文中由 AI 生成的任何内容负责,并严厉禁止伪造数据或误导性陈述。这项政策本意是为当下过热的 AI 辅助研究设立一道防火墙。


(来源:X)

但现实表明,这道墙有些不堪一击了。

GPTZero 的创始人 Alex Cui 及其团队对 ICLR 2026 的投稿进行了小范围抽样核查。调查结果显示,在被抽检的 300 篇论文中,有 16% 的样本包含了无法在现实世界中验证的引文或数据。按照 ICLR 本届会议近 2 万篇的投稿总量推算,可能有数千篇包含严重学术瑕疵的论文正混迹于评审流程之中。更令人担忧的是,这些本应在初审阶段就被“直接拒稿”(Desk Reject)的问题论文,不仅未被系统拦截,反而顺利进入了同行评审环节,部分甚至获得了极高的评价。

在被曝光的具体案例中,一篇题为 TamperTok 的投稿论文引发了广泛关注。该论文在评审系统中获得了均分 8.0 的成绩。在 ICLR 的评分体系中,这一分数通常意味着论文具备冲击 Oral(口头报告)或 Spotlight(特别关注)资格的潜力,代表了投稿中前 1.8% 的顶尖水平。

然而,GPTZero 的检测工具发现,该论文在参考文献部分存在严重的幻觉现象。作者引用了一篇据称发表于 NeurIPS 2023(神经信息处理系统大会)的论文,虽然引用的论文标题与年份在现实中确实存在,但作者名单却被完全篡改。原本的真实作者团队被替换为一组完全不相关的人名。


图 | 原作者名单(来源:arXiv)


图 | 幻觉论文作者名单(来源:Openreview)

这是典型的 AI 幻觉特征: 模型在概率预测中拼凑出了看似合理但实则虚构的信息。令人遗憾的是,负责评审该论文的四位审稿人均未发现这一明显硬伤,一致给出了高分推荐。

类似的作者幻觉还出现在一篇名为 MixtureVitae 的均分 8.0 论文中。与直接篡改全部作者不同,这篇论文在引用时采用了“真假参半”的策略。它在引用列表中保留了被引论文的前三位真实作者,后面几位作者的名字要么是完全虚构,要么是只拼对了一半。这种混合了真实信息与虚构信息的手段具有极强的欺骗性,极易逃过审稿人的常规检查。


图 | 问题论文引用文献作者 (来源:OpenReview)


图 | 原论文作者(来源:arXiv)

除了上述试图通过“高仿真”手段蒙混过关的案例外,调查还发现了一些近乎荒诞的低级错误,例如一篇 6 分论文引用完全不存在的文献。


图 | GPTZero 检测出引用无效文献(来源:GPTZero)

此外,一篇名为《Safe-LLM》的投稿论文更是令人哭笑不得,明明正在参与 ICLR 2026 的评审,但其页眉位置赫然标注着“Published at ICLR 2025”。


(来源: OpenReview)

在另一篇名为 IMPQ 的论文中,障眼法则高明一些:该论文在引用时提供了一个真实存在的 arXiv ID。如果审稿人仅是机械地验证链接的有效性,会发现该 ID 确实指向一个有效的 arXiv 页面。


图 | IMPQ 参考文献引用(来源:OpenReview)


图 | 论文 arXiv 链接指向页面(来源:arXiv)

然而,一旦对比页面内容,就会发现该 ID 对应的真实论文标题、作者与投稿论文中引用的信息完全不符。这种“挂羊头卖狗肉”的手法利用了审稿人在高强度工作负荷下可能产生的倦怠,比纯粹的虚构更难被发现。

此次 GPTZero 披露的 50 篇问题论文,也是学术界评审目前面临的重要问题。

随着大语言模型降低了论文写作的门槛,各大顶级会议的投稿量呈现指数级增长。ICLR 2026 共收到了 19,490 篇研究论文投稿,产生了超过 75,000 条评审意见。但合格的审稿人资源是有限的,无法匹配如此庞大的审核需求。供需失衡导致了评审质量的稀释,甚至出现了“用 AI 对抗 AI”的恶性循环。

之前 OpenReview 的信息泄露就证明了这一点:不仅稿子存在 AI 痕迹,大量审稿意见本身也是 AI 生成的。有数据显示,约有 21% 的 ICLR 同行评审意见可能由人工智能生成,超过一半的评审带有使用 AI 辅助的痕迹。

这种现象如果得不到遏制,真正具备创新价值的人类研究成果就有可能被淹没在由模型生成的冗余信息中。

同时,ICLR 组委会在今年 8 月出台的新规中曾强调,作者必须对 LLM 的使用进行公开披露,并对论文内容的准确性承担最终责任,违规者将面临拒稿等处罚。

可从目前的实际情况来看,单纯依赖作者的道德自律和事后追责已经难以形成约束。GPTZero 的检测结果表明,现有的同行评审流程缺乏针对 AI 幻觉的有效技术拦截手段。哪怕是最基础的参考文献核查,在面对数以万计的投稿时也成为了巨大的人力负担,导致大量显而易见的错误被遗漏。

https://gptzero.me/news/iclr-2026/

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原来她早已离世!曾是朱军搭档,抗癌3年42岁病故,一生奉献事业

原来她早已离世!曾是朱军搭档,抗癌3年42岁病故,一生奉献事业

娱说瑜悦
2026-01-24 19:41:40
无戒大佬! NBA无冠球员总得分前20名

无戒大佬! NBA无冠球员总得分前20名

大眼瞄世界
2026-01-26 23:07:25
历史罕见!全球性的疯狂逼空

历史罕见!全球性的疯狂逼空

和讯网
2026-01-26 21:38:45
运价直逼5毛钱/公里,网约车司机发出灵魂拷问:这么低的价格究竟谁在跑?

运价直逼5毛钱/公里,网约车司机发出灵魂拷问:这么低的价格究竟谁在跑?

网约车观察室
2026-01-26 10:17:32
好兄弟,勇士格林证实波德齐姆斯基与克莱·汤普森之间尴尬互动

好兄弟,勇士格林证实波德齐姆斯基与克莱·汤普森之间尴尬互动

好火子
2026-01-27 07:02:53
再见,湖人!再见,NBA的詹姆斯们!

再见,湖人!再见,NBA的詹姆斯们!

体育新角度
2026-01-26 12:20:44
黄有龙做梦也没想到,自己花重金培养大的女儿,竟给赵薇做了嫁衣

黄有龙做梦也没想到,自己花重金培养大的女儿,竟给赵薇做了嫁衣

查尔菲的笔记
2025-12-16 15:14:06
梁小龙葬礼,陈惠敏陈光标等送别,骨灰葬内地,妻子儿女低调现身

梁小龙葬礼,陈惠敏陈光标等送别,骨灰葬内地,妻子儿女低调现身

有范又有料
2026-01-26 13:53:40
曹忠平任湖南省民政厅厅长

曹忠平任湖南省民政厅厅长

三湘都市报
2026-01-26 19:41:47
人类对闲鱼的开发不足1%,一群神人把我笑发财了

人类对闲鱼的开发不足1%,一群神人把我笑发财了

另子维爱读史
2026-01-11 21:09:06
李亚鹏曝光捐赠名单,向太发声:我捐了几百万,王菲默默支持了几千万,也是不够的……

李亚鹏曝光捐赠名单,向太发声:我捐了几百万,王菲默默支持了几千万,也是不够的……

都市快报橙柿互动
2026-01-24 19:48:42
蔡卓妍小10岁私教男友收入曝光,时薪2000月入10万,每日课时爆满

蔡卓妍小10岁私教男友收入曝光,时薪2000月入10万,每日课时爆满

洲洲影视娱评
2026-01-25 20:16:40
《我是刑警》原型:公安部九大悬案之一!追凶6年,万人行动!

《我是刑警》原型:公安部九大悬案之一!追凶6年,万人行动!

史记趣闻
2024-12-31 20:10:03
《太平年》摊牌了:“百家姓”是浙江人排的

《太平年》摊牌了:“百家姓”是浙江人排的

凹凹滴
2026-01-26 20:40:34
印度尼帕病毒爆发!上海压力不只是国际航班,还有48小时逗留服务

印度尼帕病毒爆发!上海压力不只是国际航班,还有48小时逗留服务

火山诗话
2026-01-26 10:25:50
徐文海、程用文、雷文洁,履新职

徐文海、程用文、雷文洁,履新职

越乔
2026-01-27 08:47:46
听劝!深圳地铁的“谨防袈裟”回来了!

听劝!深圳地铁的“谨防袈裟”回来了!

深圳晚报
2026-01-27 10:13:07
佐藤龙之介:罚点前李昊的喊话我没太听清,这种行为这很正常

佐藤龙之介:罚点前李昊的喊话我没太听清,这种行为这很正常

懂球帝
2026-01-26 18:55:07
马化腾:希望重现当年微信红包盛况

马化腾:希望重现当年微信红包盛况

第一财经资讯
2026-01-26 14:19:38
返乡跨省大单火了!5800公里赚 3.48 万,司机:订单结束手都在抖

返乡跨省大单火了!5800公里赚 3.48 万,司机:订单结束手都在抖

石辰搞笑日常
2026-01-26 13:38:42
2026-01-27 12:00:51
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16181文章数 514547关注度
往期回顾 全部

科技要闻

理想开始关店“过冬”,否认“百家”规模

头条要闻

斯塔默访华前:英国不必在美国和中国之间做选择

头条要闻

斯塔默访华前:英国不必在美国和中国之间做选择

体育要闻

带着母亲遗愿战斗12年,交易添头成了队魂

娱乐要闻

张雨绮被曝代孕,春晚被拒,代言跑路

财经要闻

金价狂飙 “牛市神话”未完待续

汽车要闻

宾利第四台Batur敞篷版发布 解锁四项定制创新

态度原创

艺术
健康
手机
家居
时尚

艺术要闻

日本东京国立博物馆中的100幅宋画

耳石脱落为何让人天旋地转+恶心?

手机要闻

7150mAh青海湖大电池 荣耀Magic V6定档MWC

家居要闻

现代古典 中性又显韵味

这些韩系穿搭最适合普通人!多穿深色、衣服基础,简洁耐看

无障碍浏览 进入关怀版