题图|Science
撰文 | 宋文法
近日,Science在其新闻专栏Science Insider上报道了一篇题为"Low-quality papers are surging by exploiting public data sets and AI"的文章。
文章显示,2022年后,使用美国国家健康和营养检查调查(NHANES)数据库发表的低质量论文数量急剧增加,2021年后发表的论文中,92%的第一作者隶属于中国机构,而2021年之前,这一数据只有8%。
文章还指出,这些论文高度相似,可能是由“论文工厂”利用人工智能(AI)生成的文本制造的,表明大型公共卫生数据库很容易被滥用。
图:Science官网截图
去年,Scientific Reports期刊副主编(Matt Spick)注意到,大量NHANES数据集的论文涌入同行评审,这些论文高度相似,可能是由所谓的“论文工厂”利用AI生成的文本制造的。
Matt Spick表示,这些论文的形式极为相似,先选定一种健康状况以及与之可能相关的环境或生理因素,再确定特定人群,然后通过简单的变量替换来生成新的论文,类似于在“研究填空”的游戏中创造出新的“发现”。
此外,其他一系列主题中也发现了类似的爆炸式增长,包括遗传学研究、文献计量学、性别差异研究等。
Matt Spick团队在PubMed、Scopus中搜索了使用NHANES数据研究单一关联的研究,找到了341篇遵循上述“套路”的论文,它们发表在147种期刊上。
从发文时间上来看,在2014-2021年期间,平均每年发表4篇此类论文,但2022年以后,此类论文数量激增,截至2024年10月已发表190篇。
Matt Spick团队还发现,近期的NHANES论文大多由中国研究人员撰写,2021年后发表的论文中,92%的第一作者隶属于中国机构,而2021年之前,这一数据只有8%。
Matt Spick表示,中国科研人员面临的压力和激励机制,为“论文工厂”提供了机会,这也表明可能存在论文工厂的参与。
Springer Nature科研诚信主管表示,该出版商已经撤回了多篇NHANES论文,审查仍在进行中,并要求编辑们审查时保持警惕。
Matt Spick表示,低质量研究的“工业化”导致大量无用的研究成果充斥着文献,其他大型健康数据集也可能存在类似的情况。
https://www.science.org/content/article/low-quality-papers-are-surging-exploiting-public-data-sets-and-ai
助力医学研究高质量发展,推动医疗科技创新转化!
研究设计|课题申报|数据挖掘|统计分析
生信分析|选题指导|写作指导|评审指导
选刊投稿指导|研究项目指导|定制化培训
定制化研究设计|真实世界研究(RWS)实施
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.