网易首页 > 网易号 > 正文 申请入驻

AI幻觉论文混进高分评审,数千篇投稿或存学术瑕疵

0
分享至

距离 OpenReview 因代码漏洞导致审稿人身份大规模泄露的“开盒事件”仅仅过去不到两周,ICLR 又翻车了。

前两天,AI 内容检测机构 GPTZero 发布的最新调查报告显示,在随机抽取的 300 篇 ICLR 2026 投稿论文中,超过 50 篇论文被检测出存在明显的 AI 幻觉问题。这些问题涵盖了伪造参考文献、捏造不存在的作者以及编造实验数据,其中部分论文在同行评审阶段甚至获得了均分 8.0 的高分评价。


图 | 部分问题论文(来源:GPTZero)

然而,就在今年 8 月 27 日,ICLR 组委会曾正式发布针对 LLM 使用的严格规范,明确要求作者对论文中由 AI 生成的任何内容负责,并严厉禁止伪造数据或误导性陈述。这项政策本意是为当下过热的 AI 辅助研究设立一道防火墙。


(来源:X)

但现实表明,这道墙有些不堪一击了。

GPTZero 的创始人 Alex Cui 及其团队对 ICLR 2026 的投稿进行了小范围抽样核查。调查结果显示,在被抽检的 300 篇论文中,有 16% 的样本包含了无法在现实世界中验证的引文或数据。按照 ICLR 本届会议近 2 万篇的投稿总量推算,可能有数千篇包含严重学术瑕疵的论文正混迹于评审流程之中。更令人担忧的是,这些本应在初审阶段就被“直接拒稿”(Desk Reject)的问题论文,不仅未被系统拦截,反而顺利进入了同行评审环节,部分甚至获得了极高的评价。

在被曝光的具体案例中,一篇题为 TamperTok 的投稿论文引发了广泛关注。该论文在评审系统中获得了均分 8.0 的成绩。在 ICLR 的评分体系中,这一分数通常意味着论文具备冲击 Oral(口头报告)或 Spotlight(特别关注)资格的潜力,代表了投稿中前 1.8% 的顶尖水平。

然而,GPTZero 的检测工具发现,该论文在参考文献部分存在严重的幻觉现象。作者引用了一篇据称发表于 NeurIPS 2023(神经信息处理系统大会)的论文,虽然引用的论文标题与年份在现实中确实存在,但作者名单却被完全篡改。原本的真实作者团队被替换为一组完全不相关的人名。


图 | 原作者名单(来源:arXiv)


图 | 幻觉论文作者名单(来源:Openreview)

这是典型的 AI 幻觉特征: 模型在概率预测中拼凑出了看似合理但实则虚构的信息。令人遗憾的是,负责评审该论文的四位审稿人均未发现这一明显硬伤,一致给出了高分推荐。

类似的作者幻觉还出现在一篇名为 MixtureVitae 的均分 8.0 论文中。与直接篡改全部作者不同,这篇论文在引用时采用了“真假参半”的策略。它在引用列表中保留了被引论文的前三位真实作者,后面几位作者的名字要么是完全虚构,要么是只拼对了一半。这种混合了真实信息与虚构信息的手段具有极强的欺骗性,极易逃过审稿人的常规检查。


图 | 问题论文引用文献作者 (来源:OpenReview)


图 | 原论文作者(来源:arXiv)

除了上述试图通过“高仿真”手段蒙混过关的案例外,调查还发现了一些近乎荒诞的低级错误,例如一篇 6 分论文引用完全不存在的文献。


图 | GPTZero 检测出引用无效文献(来源:GPTZero)

此外,一篇名为《Safe-LLM》的投稿论文更是令人哭笑不得,明明正在参与 ICLR 2026 的评审,但其页眉位置赫然标注着“Published at ICLR 2025”。


(来源: OpenReview)

在另一篇名为 IMPQ 的论文中,障眼法则高明一些:该论文在引用时提供了一个真实存在的 arXiv ID。如果审稿人仅是机械地验证链接的有效性,会发现该 ID 确实指向一个有效的 arXiv 页面。


图 | IMPQ 参考文献引用(来源:OpenReview)


图 | 论文 arXiv 链接指向页面(来源:arXiv)

然而,一旦对比页面内容,就会发现该 ID 对应的真实论文标题、作者与投稿论文中引用的信息完全不符。这种“挂羊头卖狗肉”的手法利用了审稿人在高强度工作负荷下可能产生的倦怠,比纯粹的虚构更难被发现。

此次 GPTZero 披露的 50 篇问题论文,也是学术界评审目前面临的重要问题。

随着大语言模型降低了论文写作的门槛,各大顶级会议的投稿量呈现指数级增长。ICLR 2026 共收到了 19,490 篇研究论文投稿,产生了超过 75,000 条评审意见。但合格的审稿人资源是有限的,无法匹配如此庞大的审核需求。供需失衡导致了评审质量的稀释,甚至出现了“用 AI 对抗 AI”的恶性循环。

之前 OpenReview 的信息泄露就证明了这一点:不仅稿子存在 AI 痕迹,大量审稿意见本身也是 AI 生成的。有数据显示,约有 21% 的 ICLR 同行评审意见可能由人工智能生成,超过一半的评审带有使用 AI 辅助的痕迹。

这种现象如果得不到遏制,真正具备创新价值的人类研究成果就有可能被淹没在由模型生成的冗余信息中。

同时,ICLR 组委会在今年 8 月出台的新规中曾强调,作者必须对 LLM 的使用进行公开披露,并对论文内容的准确性承担最终责任,违规者将面临拒稿等处罚。

可从目前的实际情况来看,单纯依赖作者的道德自律和事后追责已经难以形成约束。GPTZero 的检测结果表明,现有的同行评审流程缺乏针对 AI 幻觉的有效技术拦截手段。哪怕是最基础的参考文献核查,在面对数以万计的投稿时也成为了巨大的人力负担,导致大量显而易见的错误被遗漏。

https://gptzero.me/news/iclr-2026/

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网传苏州女司机撞到老人后被家属打死?记者核实:女司机耳部缝针治疗后已出院,后续仍需观察

网传苏州女司机撞到老人后被家属打死?记者核实:女司机耳部缝针治疗后已出院,后续仍需观察

扬子晚报
2026-03-25 20:25:53
俄罗斯人想不明白:为什么强大的中国,几千年都不要西伯利亚?

俄罗斯人想不明白:为什么强大的中国,几千年都不要西伯利亚?

贱议你读史
2026-03-26 00:07:41
姆巴佩:说我在皇马遭误诊是假的,也怪我留下了可解读的空间

姆巴佩:说我在皇马遭误诊是假的,也怪我留下了可解读的空间

懂球帝
2026-03-26 04:09:06
西甲希望之星杯:巴萨5-0上海海港,皇马4球大胜维达德

西甲希望之星杯:巴萨5-0上海海港,皇马4球大胜维达德

懂球帝
2026-03-26 14:33:09
伊朗愿意与“主和派”万斯谈!特朗普一边宣称胜利一边增兵中东:我和鲁比奥也要参与

伊朗愿意与“主和派”万斯谈!特朗普一边宣称胜利一边增兵中东:我和鲁比奥也要参与

红星新闻
2026-03-25 17:17:14
越南5年免签新政策4.1开始实施

越南5年免签新政策4.1开始实施

创作者_cLg1
2026-03-26 09:42:32
来消息了!日本船主协会会长突然爆出猛料!

来消息了!日本船主协会会长突然爆出猛料!

达文西看世界
2026-03-26 10:48:30
A股:刚刚,突传重大消息,两个信号,周四将迎来更大级别的变盘

A股:刚刚,突传重大消息,两个信号,周四将迎来更大级别的变盘

云鹏叙事
2026-03-26 00:00:06
看看伊朗东北方都是哪些国家,就知道伊朗为何如此淡定了

看看伊朗东北方都是哪些国家,就知道伊朗为何如此淡定了

孤云朗境
2026-03-06 20:43:36
辛纳在迈阿密比赛中险些误伤美国球星,赛后赶紧致歉

辛纳在迈阿密比赛中险些误伤美国球星,赛后赶紧致歉

网球之家
2026-03-26 13:25:54
大崩盘!骑士最多落后高达21分:全队三分15中3,哈登心不在焉

大崩盘!骑士最多落后高达21分:全队三分15中3,哈登心不在焉

体坛小李
2026-03-26 08:53:49
NBA西部:前10确定了,马刺有望争第1,快船抢7,湖人首轮遇火箭

NBA西部:前10确定了,马刺有望争第1,快船抢7,湖人首轮遇火箭

铁甲西奇
2026-03-26 16:43:09
泰国总理换新车支持国产!从劳斯莱斯到比亚迪,还向民众极力推荐

泰国总理换新车支持国产!从劳斯莱斯到比亚迪,还向民众极力推荐

削桐作琴
2026-03-26 18:14:58
你知道我在床上有多厉害吗?

你知道我在床上有多厉害吗?

果粉之家
2026-03-20 12:35:16
中东战场外的大赢家:俄罗斯拿下越南核电和液化天然气大单

中东战场外的大赢家:俄罗斯拿下越南核电和液化天然气大单

澎湃新闻
2026-03-25 19:52:29
剖腹自尽?日本陆自军官持刀冲入中国大使馆,想杀中国外交员!

剖腹自尽?日本陆自军官持刀冲入中国大使馆,想杀中国外交员!

军武次位面
2026-03-26 14:26:42
张雪峰直播连炫7根雪糕,三口一根猛灌凉水:他哪是爱吃冰

张雪峰直播连炫7根雪糕,三口一根猛灌凉水:他哪是爱吃冰

风起见你
2026-03-26 07:57:51
好莱坞的AI招魂术:死亡不再是劳动的终点

好莱坞的AI招魂术:死亡不再是劳动的终点

动察Beating
2026-03-26 11:06:56
周杰伦《太阳之子》炸裂数据:182万张、7000万、3800万播放!

周杰伦《太阳之子》炸裂数据:182万张、7000万、3800万播放!

可乐谈情感
2026-03-26 13:42:47
巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

懂球帝
2026-03-26 06:43:09
2026-03-26 19:12:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16491文章数 514797关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
时尚
艺术
健康
军事航空

亲子要闻

上海美华妇儿医院"康复中心"完成全面升级并正式焕新启幕

皮衣+裙,高级到炸

艺术要闻

哪一座桥不是风景?

转头就晕的耳石症,能开车上班吗?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版