最近学术圈新晋纪委「耿同学」重拳出击,凭一己之力扯开了多篇顶刊的遮羞布,与此同时,也掀起了一波「大家来找茬」的全民论文打假风波。
最近知名学术打假机构就挂了一篇 2026 年 4 月刚刚上线的论文,这篇论文由山东协和学院、上海交通大学以及哈萨克斯坦某校联合署名。论文内容看起来相当前沿:作者声称,他们建立了一个「机器学习指导的蛋白表达优化平台」,用于提高难表达蛋白在工程化大肠杆菌中的可溶性表达。
尽管这篇文章没有发表在顶级刊物上,依旧没有逃过网友们火眼金睛的追杀。
![]()
图源:5 gh.ac.cn
参考文献直接编?
热心网友们发现,这篇论文中整齐排列的参考文献透着一丝诡异:这些参考文献要不根本就存在,要不就是标题,作者,期刊完全驴唇不对马嘴。
![]()
![]()
图源: 5 gh.ac.cn
这种「编参考文献还编得煞有介事」的情况,想必大家已经很熟悉了,这简直是 AI 带给我们的生长痛 ——数不清有多少次被 AI 编的参考文献骗得捶胸顿足。
但是,自己用 AI 时被它编参考文献骗就算了,现在看个经过同行评审的,已经发表的论文还要被同样的东西再骗一次?
![]()
没错,这是一篇很明显用 AI 生成的论文。不过要确认这篇论文是 AI 生成的,倒也不必如此费心去核查参考文献,毕竟里面还有一张更诡异的 WB 胶图。这精确的赛博蛋白条带真是让人看力竭了。
![]()
图源:Plos one
古有 AI 画出「老鼠长出巨大睾丸」,今有纯 AI 手搓版蛋白胶图。截至目前,这篇文章被质疑后,还没有任何一方给出回应。
![]()
图源:Frontiers in Cell and Developmental Biology
几篇不存在的参考文献,让副院长离职走人
文章造假被查到后,大家最关心的问题莫过于「有什么后果?」——会被撤稿吗?对作者有什么影响?
虽然这篇 PLOS ONE 论文目前还没有调查结论,不过上一次因为几篇虚假参考文献,闹得院长都已经引咎辞职:
去年 11 月,港大发表了一篇题为「Forty years of fertility transition in Hong Kong」的论文,分析香港近 40 年的生育率。其作者为港大在读博士生白逸铭(音译 Yiming Bai)、通讯作者为港大社会科学院副院长叶兆辉(音译 Paul Yip)。
![]()
图源:香港大学
这篇论文上线仅一个月,同样遭到热心网友举报 ——该论文的参考文献中有超过 20 篇根本不存在的虚假文献。
事件爆发后,叶兆辉在采访中解释称,第一作者使用 AI 整理参考文献时没有检查清楚,才导致这一疏漏。作为通讯作者,他承认自己难辞其咎,但也强调论文通过过两次学术审查,内容本身并非捏造。
他还表示,其他作者只是提供数据和意见,「责任在于我同学生」。
按照他的说法,这位学生一直表现很好,这是她第一次使用 AI 协助写作。虽然他对学生感到失望,但仍愿意给她机会,并要求她修读一个关于如何更好使用 AI 的课程。
随后,港大发表声明称,已经对该生采取相应的纪律处分,而叶兆辉本人则引咎卸任副院长及研究事务相关职务。尽管事件初期,叶兆辉和期刊都曾表示这些虚假参考文献不影响论文核心结论,但目前这篇论文已经撤稿。
![]()
图源:China Population and Development Studies
学术污染
不过,这起事件只是揭开了 AI 引用虚假参考文献的冰山一角,2026 年 5 月 7 日,期刊The Lancet发表了一项题为「Fabricated citations: an audit across 2.5 million biomedical papers」的研究,研究团队检查了约 250 万篇生物医学论文,核验了 9710 万条参考文献,在其中找到了在 2810 篇论文中都存在着虚假引用参考文献的情况,这些 AI 生成的假参考文献高达 4046 条。
这些混杂着虚假参考文献的论文在 2025 年后开始指数级飙升,这与 AI 的普及程度完全吻合,据统计,2026 年前七周,PubMed 收录论文中大约每 277 篇就有 1 篇引用了不存在的文献。
![]()
图源:The Lancet
更值得注意的是,根据 Retraction Watch 的数据,几乎所有被发现包含虚假参考文献的文章(超过 98%)在今年 2 月份的审核时都未受到出版商的任何处理。
也就是说 AI 幻觉已经污染了学术论文的数据库,污染了知识产生的源头,这不再是可以被忽略的小问题。
怎么办?
为什么这些「污染」没有得到严格处理?一个重要的原因是,对于 AI 使用的规范,目前各家出版商的政策各不相同。
对于论文中出现虚假参考文献这件事,出版商 Taylor & Francis 的一位发言人表示,该出版社正在投资「技术、专业人员和流程,以识别有问题的」参考文献。同时表示「如果这些参考文献占比过高,或严重影响稿件的整体完整性,则通常会被拒稿。」
PLOS 出版伦理负责人则认为,不会自动将伪造的参考文献归类为学术不端行为,科学性的问题应该由审稿人来决定。
相比之下,美国医学会杂志JAMA的前主编华德 · 鲍赫纳对于这件事的态度更为坚决,他认为如果论文中出现虚构的参考文献,就应该撤稿。
![]()
图源:enago.com
各大出版商对于 AI 使用规范的政策
显然,这个新事物跑得太快,它带来了很多便利,也伴生了更多新问题,学术共同体应对其建立的规范还在后面追赶。但至少目前有一条底线的共识是——
一旦动摇了论文的真实性和科学性,那就应该撤稿。
AI 参与到学术写作中已经是不可抵挡的趋势。一项对超过 500 万篇论文的研究发现,约 70% 的期刊已经制定了某种 AI 政策。
![]()
AI 的出现,对于论文写作,确实是一种翻天覆地的变化,尤其对于非母语写作的科研人员来说,它确实是一根拐杖,但是拐杖不能替人走路,也不能替人负责。论文的真实性和可靠性,远比优美地道的表达更重要。正如早前Science发表的一篇社论所说:
ChatGPT is fun, but not an author.
![]()
图源:Science
参考资料:
1.http://www.5 gh.ac.cn/Report/2026/000008.R5.html
2.https://journals.plos.org/plosone/article?id = 10.1371/journal.pone.0347213
3.https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(26)00603-3/fulltext
4.https://retractionwatch.com/2026/05/07/one-in-277-pubmed-indexed-papers-in-2026-shows-fabricated-references-says-analysis/
5.https://retractionwatch.com/2026/01/28/medical-journal-publishes-a-paper-on-ai-with-a-fake-reference-to-itself/
6.https://link.springer.com/article/10.1007/s00134-024-07752-6
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.