近3000篇医学论文现AI伪造引用，学术信任危机浮现|科学|文献|柳叶刀

近3000篇医学论文现AI伪造引用，学术信任危机浮现

2026-05-08 21:16:13　来源: 灰度测试中

北京举报

分享至

医学文献正在遭遇一场静默的信任崩塌。哥伦比亚大学护理学院的一项AI辅助审计发现，近3000篇经同行评审的医学论文包含虚假引用——这些引用在科学数据库中根本不存在。这项发表于《柳叶刀》的研究，揭示了AI工具普及背景下学术出版领域的深层隐患。

研究团队开发了一套自动化验证系统，对2023年1月1日至2026年2月18日期间PubMed Central开放获取数据库中的250万篇论文进行扫描。在核验的9710万条参考文献中，他们识别出4046条虚假引用，分布于2810篇论文。更令学界警觉的是，这一造假速率自2023年以来增长超过12倍，最陡峭的攀升始于2024年中期——恰与AI写作工具的兴起时间吻合。

数据曲线清晰呈现了危机的演变轨迹。2023年全年，虚假引用率稳定在每万篇论文约4条的水平。但从2024年中期开始，该数字急剧上扬，至2026年初已达每万篇论文约57条。研究团队特别标注，最后一个数据点（2026年1月1日至2月18日）因观察期不完整以开放符号显示，但趋势已足够明确。

这项发现直接威胁临床决策的根基。"医学专业人员依据临床指南制定治疗方案，而他们无从知晓所依赖的证据并不存在，"研究负责人、哥伦比亚大学护理学院与数据科学研究所副教授Maxim Topaz博士指出。他列举了一个极端案例：某篇论文的30条参考文献中，竟有18条为伪造。更棘手的是，部分虚假引用已被其他论文援引，甚至出现在指导临床实践的系统性综述中。

学术引用的连锁反应正在放大风险。伪造引用一旦进入文献网络，便可能通过后续研究的引用获得"合法性"外衣，最终渗透进循证医学的核心基础设施。这种污染具有隐蔽性——临床医生、指南制定者、甚至后续研究者都难以察觉原始文献的虚假根基。

面对这一局面，研究作者在论文中向出版机构提出明确建议：应在投稿环节即对参考文献进行核验。这一流程性改进或可在源头拦截虚假引用，防止其进入同行评审链条。然而，技术层面的解决方案能否跟上AI造假的进化速度，仍是悬而未决的问题。当生成式工具能够以低成本批量生产看似规范的学术文本，学术出版的信任机制正面临前所未有的压力测试。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.