医学文献正在遭遇一场静默的信任崩塌。哥伦比亚大学护理学院的一项AI辅助审计发现,近3000篇经同行评审的医学论文包含虚假引用——这些引用在科学数据库中根本不存在。这项发表于《柳叶刀》的研究,揭示了AI工具普及背景下学术出版领域的深层隐患。
研究团队开发了一套自动化验证系统,对2023年1月1日至2026年2月18日期间PubMed Central开放获取数据库中的250万篇论文进行扫描。在核验的9710万条参考文献中,他们识别出4046条虚假引用,分布于2810篇论文。更令学界警觉的是,这一造假速率自2023年以来增长超过12倍,最陡峭的攀升始于2024年中期——恰与AI写作工具的兴起时间吻合。
![]()
数据曲线清晰呈现了危机的演变轨迹。2023年全年,虚假引用率稳定在每万篇论文约4条的水平。但从2024年中期开始,该数字急剧上扬,至2026年初已达每万篇论文约57条。研究团队特别标注,最后一个数据点(2026年1月1日至2月18日)因观察期不完整以开放符号显示,但趋势已足够明确。
这项发现直接威胁临床决策的根基。"医学专业人员依据临床指南制定治疗方案,而他们无从知晓所依赖的证据并不存在,"研究负责人、哥伦比亚大学护理学院与数据科学研究所副教授Maxim Topaz博士指出。他列举了一个极端案例:某篇论文的30条参考文献中,竟有18条为伪造。更棘手的是,部分虚假引用已被其他论文援引,甚至出现在指导临床实践的系统性综述中。
学术引用的连锁反应正在放大风险。伪造引用一旦进入文献网络,便可能通过后续研究的引用获得"合法性"外衣,最终渗透进循证医学的核心基础设施。这种污染具有隐蔽性——临床医生、指南制定者、甚至后续研究者都难以察觉原始文献的虚假根基。
面对这一局面,研究作者在论文中向出版机构提出明确建议:应在投稿环节即对参考文献进行核验。这一流程性改进或可在源头拦截虚假引用,防止其进入同行评审链条。然而,技术层面的解决方案能否跟上AI造假的进化速度,仍是悬而未决的问题。当生成式工具能够以低成本批量生产看似规范的学术文本,学术出版的信任机制正面临前所未有的压力测试。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.