![]()
编译丨王聪
编辑丨王多鱼
排版丨水成文
自 ChatGPT 诞生以来,我们不断被 AI 强大的生成所震撼,然而,在可能无人关注的角落,这些生成式 AI 正批量生产大量的“学术垃圾”,逐渐充斥着专业学术期刊。
2025 年 9 月 23 日,国际顶尖学术期刊Nature在其官网头条 报道了一则新闻—— Journals infiltrated with ‘copycat’ papers that can be written by AI.
一项新研究指出,一些学术期刊已充斥着由 AI 撰写的“洗稿论文”,例如 ChatGPT 等大语言模型能够生成几乎一样的论文,而这些论文能够冒充成新的研究成果,并绕过学术期刊的查重检测,进而成功发表。
![]()
2025 年 9 月 12 日,英国萨里大学的研究人员在预印本平台medRxiv上发布了一篇题为:Dramatic increases in redundant publications in the Generative AI era 的研究论文。
研究团队使用美国疾病控制和预防中心国家健康和营养检查调查(NHANES)数据集对 2021 年至 2025 年 7 月发表的论文进行了系统搜索,以确定那些重复发表的论文。
结果显示,在这几年里,有 112 本学术期刊发表了 411 篇重复论文,这些论文使用了 ChatGPT、Gemini 等生成式人工智能工具写作,生成了一篇篇“洗稿版”论文,然后冒充成新的研究成果并成功发表。例如,使用 NHANES 数据研究氧化平衡评分与慢性肾病之间关联的论文在一年内被发表了 6 次。这说明了生成式人工智能生成的医学研究论文,能够成功绕过当前的学术期刊的反抄袭检查。
该论文的作者警告称,个人和“论文工厂”可能会利用公开可用的健康数据库信息,并借助大语言模型(LLM)来批量生产缺乏科学价值的低质量洗稿论文。
如果任其发展,这种基于 AI 的方法可以应用于各种开放获取数据库,生成的论文数量将远超人们的想象。这可能会打开潘多拉魔盒,真正的学术文献可能会被大量 AI 生成论文所淹没。
为了进行调查,萨里大学的研究人员筛选了基于美国国家健康与营养检查调查(NHANES)数据的相关性研究——这些研究通过统计学方法将某一变量与健康结果联系起来。NHANES 是一个庞大的公开数据库,其中包含了数千人的健康、饮食和生活方式数据。他们将搜索重点放在他们定义为“重复”的研究上——这些研究测试的是与已有研究相同的变量与健康结果之间的关联,但分析的是实际数据中略有不同的子集——比如来自不同调查年份的结果,或者不同年龄或性别的参与者。
然后,研究人员在 PubMed 中进行检索,发现 2021 年至 2025 年 7 月期间,有 411 项重复论文发表。其中大多数是简单的“重复”案例,涉及几乎完全相同的两篇论文。
研究团队表示,这种情况本不该发生,这对科学文献的健康毫无益处。实际上,大多数学术期刊都设有论文查重机制以防止作者将同一研究成果提交给多家期刊,但该团队怀疑,有人正在利用 AI 工具来规避这些论文查重。
为了测试 AI 能否从同一数据集中生成多篇论文,研究团队使用了 OpenAI 的聊天机器人ChatGPT和谷歌的Gemini来重写他们分析中发现的三篇重复度最高的论文。研究团队提示这些大语言模型使用每篇论文中的信息以及 NHANES 数据来生成一篇能够避开查重的新论文。
研究团队发现,这两个大语言模型能够快速生成新的论文,虽然存在一些错误,但研究团队只需花费大约两小时就能修正这些错误。当他们使用学术期刊采用的查重工具对这些由大语言模型生成的论文进行分析时,成功骗过了查重工具。这表明大语言模型能够生成一些基于之前论文的洗稿论文,不包含任何新内容,却能通过查重检测。
这一情况也给学术期刊及其编辑带来了新的挑战,实际上,自 2022 年 ChatGPT 公开发布之后,基于 NHANES 的重复研究论文大幅增加。这也导致了一些学术出版社和期刊开始收紧基于 NHANES 等开放获取的健康数据库的论文发表。
该研究显示,这 411 篇重复论文中有 37% 发表在了 Spring Nature 旗下期刊,其中有 51 篇发表在了Scientific Reports期刊,该期刊编辑总监Richard White表示,期刊非常重视维护科学记录的有效性,这 51 篇论文都将接受调查,并在适当情况下采取行动。他还表示,自 2024 年初以来,Scientific Reports已拒绝了超过 4500 篇基于 NHANES 数据库的论文。
论文链接:
https://www.medrxiv.org/content/10.1101/2025.09.09.25335401v1
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.