网易首页 > 网易号 > 正文 申请入驻

一个数据集,一年产稿7876篇!AI强力加持,垃圾论文海量爆发

0
分享至

新智元报道

编辑:犀牛

【新智元导读】当学术研究沦为「填空游戏」,利用美国NHANES公共数据集,结合AI工具如ChatGPT,研究者通过套用模板、排列变量,批量生产看似精美却质量堪忧的论文。背后不仅是技术的滥用,更是科研评价体系扭曲的缩影。

假如你是一位科研期刊的编辑,每天打开邮箱,迎接的却是一堆似曾相识的论文。

它们主题各异,数据整齐,措辞流畅,但总有种让人不安的「模板感」。

这可不是一个瞎编的场景,而是2024年发生在《Scientific Reports》编辑Matt Spick身上的真实经历。

作为英国萨里大学的统计学家,他发现大量论文像流水线产品般涌来,全部基于美国国家健康与营养检查调查(NHANES)这一公共数据集。

「我收到的几乎一模一样的论文太多了,有时一天一篇,有时两天三篇,」Spick无奈地说,「这不太对劲」。

近日,Science网站的一篇文章详细详细描述了这个事实。

文章地址:https://www.science.org/content/article/low-quality-papers-are-surging-exploiting-public-data-sets-and-ai

Spick发现,他所在期刊遇到的问题只是冰山一角。

这些论文并非孤立现象,而是席卷全球学术界的一场「科研填空游戏」

上周,他与同事在《PLOS Biology》杂志上发表的研究指出,近年来,使用NHANES的低质量论文数量激增。

论文地址:https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3003152

NHANES的「魔力」与「陷阱」

NHANES是一个庞大的公共数据集,涵盖了超过13万人的健康检查、血液检测和饮食信息。

它的开放性让研究者可以轻松挖掘数据,探索健康与疾病的关系。

然而,这种便利也成了双刃剑。

Spick发现,这些NHANES论文遵循一个简单的「公式」:选择一种健康状况(比如抑郁症)、一个可能相关的环境或生理因素(比如维生素D水平),再限定一个人群(比如65岁以上男性)。通过排列组合,研究者能迅速生成「新发现」。

「感觉好像所有可能的组合都被人研究过了」Spick说。

西北大学的元科学家Reese Richardson将其形象地称之为「科研填空游戏」。

他提到,其他研究者在不少领域也发现了类似的「爆发式增长」,比如基因研究、文献计量分析,还有不同科学学科里的性别差异研究。

为了量化这一现象,Spick团队在PubMed和Scopus两大数据库中搜索基于NHANES的单变量关联研究。

他们在147种期刊中发现了341篇这样的论文,包括《Scientific Reports》、《BMC Public Health》及《BMJ Open》。

结果令人震惊:2014年至2021年,这类论文年均仅4篇,但2022年起数量激增,2024年截至10月已达190篇,远超其他大型健康数据集研究的增长速度。

更令人担忧的是,其中的许多论文选择性地分析数据,比如只用某些年份或年龄段的数据,缺乏明确理由。

这背后往往是「p值狩猎」——通过反复尝试找到统计上显著的结果,哪怕这些结果可能是虚假的。

以抑郁症相关研究为例,Spick团队分析了28篇NHANES论文,发现在对多重检验结果进行假发现率(FDR)校正后,仅有 13 项关联仍保持统计学显著性。

这意味着一半以上的「发现」可能是统计噪声,而非真相。

Spick和他的团队甚至认为,他们的分析可能还大大低估了问题的严重性。

他们的搜索只针对符合Spick模式的NHANES研究,更广泛的搜索发现,使用NHANES数据集的论文从2023年的4926篇激增到2024年的7876篇。

Spick还指出,其他大型健康数据集,比如全球疾病负担研究,同样可能存在类似漏洞。

AI与论文工厂的「共谋」

为什么NHANES论文会在2022年后井喷?

答案指向了一个时间点:AI工具如ChatGPT的广泛普及。

这些工具能根据简单指令生成流畅文本,甚至通过改写来逃避抄袭检测。

悉尼大学的分子生物学家Jennifer Byrne在审稿时指出,这种论文的「规模和时机」让人怀疑背后有协调运作,论文工厂(paper mills)可能是幕后推手。

论文工厂是专门出售论文署名权的商业机构。它们利用AI快速生成论文框架,再结合NHANES等公共数据集的便利性,生产出看似合法的论文。

Spick团队甚至编写了一段简单的Python代码,就能从NHANES中提取数据并「批量生成」疾病与健康变量的组合。

这种「工业化」生产模式让低质量论文如洪水般涌入学术期刊。

「老实说,这让我气得跳脚。」Spick表示。

哲学家Hannah Arendt曾提出「平庸之恶」的概念,形容那些在体制下机械执行恶行的行为。

今天的论文工厂何尝不是一种「平庸之恶」?它们未必有意破坏科学,但机械化的论文生产,悄然侵蚀了学术的根基。

扭曲之镜

这场「科研填空游戏」的根源不仅在于技术和数据,还在于学术生态的扭曲。

Richardson一针见血地指出:「所有被点名的期刊都收取了约1000美元的发表费用,来刊登这些垃圾论文。」

开放获取期刊(如《PLOS Biology》)通过作者付费实现免费阅读,但这也让一些期刊更看重数量而非质量。

更深层的问题是科研评价体系。

许多高校和机构以论文数量作为晋升和资助的主要标准,而非论文的质量或影响力。

在「发表即成功」的文化下,研究者只能制造出更多论文,哪怕这些论文毫无意义。

但当科研变成填空游戏,研究者很难从中找到意义。相反,他们被困在一个循环中:不断生产「成果」,即使这些成果可能只是学术垃圾。

当论文成为KPI,科学便从探索真理沦为数字游戏。

破局之道

这场危机并非无解。

Spick建议,期刊应加强对NHANES等公共数据集论文的审查,比如要求作者明确数据选择的理由,并进行更严格的统计校正。Byrne则呼吁开发更智能的检测工具,以识别AI生成的文本。

更根本的改变需要重塑学术激励机制。

Richardson警告:「除非我们彻底改革科研发表的激励模式,否则问题只会更糟」。

这场「科研填空游戏」更像是一面镜子,映照出技术进步与学术伦理的碰撞。

AI和公共数据集本应是科学的加速器,却在扭曲的激励下成了垃圾论文的温床。

参考资料:

https://www.science.org/content/article/low-quality-papers-are-surging-exploiting-public-data-sets-and-ai

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央媒调查稻城亚丁“道路设卡摆渡收费”:收的什么费?景区有权设卡吗?

央媒调查稻城亚丁“道路设卡摆渡收费”:收的什么费?景区有权设卡吗?

澎湃新闻
2026-05-31 07:54:04
现在的商K,质量都越来越高了…

现在的商K,质量都越来越高了…

微微热评
2026-05-31 21:43:30
"我的钱可以买你的命!",男子高铁怒怼乘警,网友:查一下来源

"我的钱可以买你的命!",男子高铁怒怼乘警,网友:查一下来源

鲸探所长
2026-05-31 09:57:29
两名9岁女孩被困电梯2小时,轮流按求助键超35次,保安无动于衷称“别再按电梯玩”,妈妈:被救时孩子头发全湿了;物业致歉:已辞退涉事人

两名9岁女孩被困电梯2小时,轮流按求助键超35次,保安无动于衷称“别再按电梯玩”,妈妈:被救时孩子头发全湿了;物业致歉:已辞退涉事人

扬子晚报
2026-05-31 09:50:55
乐坛天后自曝最棒床伴:这位已故男神让她终生难忘

乐坛天后自曝最棒床伴:这位已故男神让她终生难忘

时光慢旅人
2026-05-31 01:48:21
网红边牧被偷后续!对方慌了,拦车拉车门试图求和,狗主人被气哭

网红边牧被偷后续!对方慌了,拦车拉车门试图求和,狗主人被气哭

削桐作琴
2026-05-31 19:45:35
生育大局已定:不出意外的话,从2026年起中国人口将迎来3大变化

生育大局已定:不出意外的话,从2026年起中国人口将迎来3大变化

墨兰史书
2026-06-01 03:20:03
5月31日俄乌最新:辉煌的战果

5月31日俄乌最新:辉煌的战果

西楼饮月
2026-05-31 18:05:56
两度击倒山口茜夺第4冠!安洗莹亲吻奖杯 决胜局17连胜又创历史

两度击倒山口茜夺第4冠!安洗莹亲吻奖杯 决胜局17连胜又创历史

颜小白的篮球梦
2026-05-31 18:56:20
阿莫西林是消炎药?医生:不是!真正的消炎药只有这4种,别认错

阿莫西林是消炎药?医生:不是!真正的消炎药只有这4种,别认错

医者荣耀
2026-05-29 12:05:10
仅出战16分钟,正负值就达到+25!上海男篮想建立王朝必须留下他

仅出战16分钟,正负值就达到+25!上海男篮想建立王朝必须留下他

弄月公子
2026-05-31 23:48:39
撤销外语学院不是终点,真正该“撤”的是那套失败的体系

撤销外语学院不是终点,真正该“撤”的是那套失败的体系

迷世书童
2026-05-31 13:35:42
无缘第6冠!张雪机车遭遇两连败 德比斯再获第8拿8分 原因曝光

无缘第6冠!张雪机车遭遇两连败 德比斯再获第8拿8分 原因曝光

念洲
2026-05-31 20:34:31
74岁老人嫌杨絮碍事竟将其点燃,20辆新能源车被烧毁!已被采取刑事强制措施

74岁老人嫌杨絮碍事竟将其点燃,20辆新能源车被烧毁!已被采取刑事强制措施

环球网资讯
2026-05-31 18:13:21
异常热浪在法国造成7人死亡,中国留学生:当地普遍不装空调,这几天很崩溃,连续一周没怎么睡好觉

异常热浪在法国造成7人死亡,中国留学生:当地普遍不装空调,这几天很崩溃,连续一周没怎么睡好觉

极目新闻
2026-05-31 12:55:56
3死惨剧!脱把40秒追尾,22个雷达为何没“看”见死劫?

3死惨剧!脱把40秒追尾,22个雷达为何没“看”见死劫?

趣味萌宠的日常
2026-05-31 16:28:10
给钱我都不坐!多名特斯拉前员工坦言:马斯克吹的FSD根本不安全

给钱我都不坐!多名特斯拉前员工坦言:马斯克吹的FSD根本不安全

快科技
2026-05-31 14:09:06
赌王儿子何猷君法国大婚!晚宴曝光儿女当花童,奚梦瑶蓝裙很惊艳

赌王儿子何猷君法国大婚!晚宴曝光儿女当花童,奚梦瑶蓝裙很惊艳

娱乐圈圈圆
2026-06-01 00:20:26
高颜值美女晒出和邋遢男友旅游合照,网友们看完炸锅了

高颜值美女晒出和邋遢男友旅游合照,网友们看完炸锅了

微微热评
2026-05-31 14:27:06
一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

路医生健康科普
2026-05-31 20:15:03
2026-06-01 04:12:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15351文章数 66894关注度
往期回顾 全部

科技要闻

戴尔诺基亚又回来了!AI重估老牌科技公司

头条要闻

特朗普生日白宫办格斗赛 近距离观赛花超100万美元

头条要闻

特朗普生日白宫办格斗赛 近距离观赛花超100万美元

体育要闻

阿森纳用最悲壮的方式,成就了巴黎王朝

娱乐要闻

朱军退休,正义虽迟但到,女方受惩

财经要闻

医学首席转岗搞科技,A股科技股遭遇巨震

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

数码
艺术
教育
公开课
军事航空

数码要闻

苹果眼镜最新爆料:多款式设计,内部代号N50,延期2027年底发布

艺术要闻

耗资约24亿!新美术馆正式开放,深圳人沸腾!

教育要闻

(序号A49205)校园安全教育责任与担当主题班会PPT..

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

解放军代表质问日防卫大臣:日本何时道歉

无障碍浏览 进入关怀版