![]()
AI 可能会让科学研究变得越发高效,但同时也可能让科学探索变得愈发保守。
作者丨郑佳美
编辑丨岑峰
![]()
在当代科学研究中,人工智能正在改变的不只是研究效率,而是科研活动本身的结构。
随着 AI 工具在自然科学中的广泛应用,越来越多的研究可以在更短时间内完成,论文产出和引用回报也随之提高。在以发表数量、影响力和速度为核心指标的学术体系中,这种效率优势正在直接影响研究者的行为选择和研究方向布局。
然而,效率的提升并不必然意味着科学探索的拓展。当 AI 更擅长处理数据充足、问题明确、路径成熟的研究任务时,科研活动是否会整体性地向这些方向集中,从而改变科学知识的分布结构和演化方式,这是一个长期存在但缺乏系统证据的问题。个体层面的成功是否真的能够累积为集体层面的进步,在 AI 深度介入科研之后,反而变得更加值得重新审视。
在这一问题背景下,清华大学 FIB 实验室牵头开展了一项大规模实证研究,论文题为《Artificial Intelligence Tools Expand Scientists’ Impact but Contract Science’s Focus》并已被Nature正刊收录。
研究基于覆盖 1980–2025 年、超过四千万篇自然科学论文和五百多万名研究人员的长期数据,从个人科研回报与科学整体结构两个层面,系统分析了人工智能工具在自然科学中的扩散过程及其深层影响。
研究提出的核心发现具有明确的张力:人工智能显著放大了个体科学家的学术影响力,但与此同时,科学整体的研究范围和互动结构却可能正在收缩。
![]()
论文地址:https://www.nature.com/articles/s41586-025-09922-y
对于当下火热的 AI for Science (AI4S) 领域,这篇文章不仅是现状的描述,更是一份深刻的提醒:真正的科学突破往往发生在“数据贫瘠”或“非共识”的荒原。如果 AI4S 仅仅沦为“在已有大数据的领域刷榜”的工具,它将导致科学探索的内卷化。
01
AI 带来的并非只有增长,还有重构
这篇论文的实验结果通过一系列量化分析,系统地揭示了人工智能在自然科学研究中的真实影响。
研究首先证明,人工智能在自然科学中的采用已经成为一种规模巨大且不断加速的趋势。作者在 1980–2025 年的自然科学论文中共识别出 310,957 篇 AI-augmented papers,占全部样本的约 0.75%,而研究覆盖的总规模达到 41,298,433 篇论文和 5,377,346 名研究者。
进一步的时间序列分析显示,在传统机器学习、深度学习和生成式 AI 三个阶段中,论文和研究者采用 AI 的速度均持续加快。具体来看,1980 到 2025 年间,AI 论文占比在不同学科中上升了数十倍,例如地质学上升 10.70 倍,生物学上升 51.89 倍。
与此同时,采用 AI 的研究者占比增长得更快,在地质学中达到 135.46 倍,在物理学中高达 362.16 倍。这些结果首先表明,AI 在自然科学中的扩散是一种系统性变化,而非个别领域的偶发现象。
![]()
在个体科学家层面,实验结果显示 AI 的采用与科研回报之间存在显著关联。论文给出的核心结论是,使用 AI 的科学家,其论文发表数量平均是未使用者的 3.02 倍,获得的引用数量平均是未使用者的 4.84 倍,并且在职业发展上更早成为研究负责人,时间平均提前约 1.37 年。
这些结论基于大规模样本分析得出。在包含 5,377,346 名研究者的数据中,六个自然科学学科里采用 AI 的研究者,其年均发表量均显著高于未采用者,且统计检验结果达到 P < 0.001。同时,在 27,405,011 篇引用记录完整的论文样本中,AI 论文在发表后的多年里,其年均引用数比非 AI 论文高出 98.70%。这些数据共同说明,AI 在个体层面显著放大了科学家的科研产出和学术影响力。
![]()
然而,当研究视角从个人扩展到整体科学生态时,实验结果呈现出相反的趋势。研究人员通过将论文嵌入到 768 维的科学语义空间中,并测量论文集合覆盖范围,发现 AI 研究在整体上的知识广度明显小于非 AI 研究,在六个学科中位数平均收缩 4.63%,且在细分到 200 多个子领域后,这种收缩仍然在 70% 以上的子领域中存在。
![]()
同时,AI 研究的知识分布更加集中,研究注意力更容易聚焦在少数核心问题上。在学术互动方面,引用同一篇论文的后续研究之间,彼此互动的程度平均减少 22%,表明 AI 研究更容易围绕少数核心成果展开,而不是形成相互连接的新研究网络。
引用分布分析进一步显示,AI 研究中前 22.20% 的论文获得了 80% 的引用,前 54.14% 的论文获得了 95% 的引用,其引用不平等程度以 Gini 系数量化后为 0.754,明显高于非 AI 研究的 0.690。综合这些结果,论文用数据清楚地表明,AI 在显著提升个体科研回报的同时,也使科学研究在整体层面变得更加集中,学术互动减少,探索空间随之收缩。
![]()
02
从大规模文献数据中,构建研究样本
这项研究的实验设计可以理解为一条从识别、对照到结构测量的完整分析流程。
研究团队首先以 OpenAlex 数据库中的自然科学论文和研究人员网络作为总体样本,主分析规模为 41,298,433 篇论文和 5,377,346 名研究人员,时间跨度覆盖 1980–2025 年,并按照机器学习、深度学习和生成式 AI 三个阶段进行划分。
研究团队刻意将分析重点放在自然科学中把 AI 作为研究工具的成果,而不是计算机科学或数学中开发 AI 方法本身的研究,从而确保研究对象是 AI 对科学生产方式的外溢影响,而非 AI 学科内部的技术演化。
在区分 AI 与非 AI 研究时,研究团队没有采用关键词匹配的方法,而是对预训练的 BERT 语言模型进行两阶段微调,分别在论文标题和摘要上训练模型,并将两者集成为统一的识别器,以减少人为选择触发词所带来的偏差。
为验证这种识别方式的可靠性,研究人员组织具备相关背景的专家对随机抽样论文进行盲审标注,结果显示专家之间的一致性 Fleiss’ κ 达到 0.964,而模型在以专家标注为真值的评估中 F1 值达到 0.875。这一步为后续所有分析提供了关键前提,即 AI 与非 AI 研究成果的划分具有足够的准确性和稳定性。
![]()
在个人层面的分析中,研究团队主要使用研究人员的年度论文发表数量和年度引用数量来衡量科研产出与学术影响力,并结合职业阶段变化来刻画研究人员从 junior 阶段转变为 established 或 leader 的过程。基于这些指标,研究人员得出了使用 AI 的科学家发文数量增加 3.02 倍、引用数量增加 4.84 倍,并且更早成为研究负责人的结论,这些结果在不同学科中表现出一致的显著性。
![]()
在集体层面的分析中,研究团队通过两类指标来量化科学结构的变化。第一类是知识广度,研究人员使用 SPECTER 2.0 将研究成果映射到 768 维语义空间中,并将一组抽样成果在该空间中所覆盖的最大距离定义为知识广度,用以比较 AI 与非 AI 研究在主题覆盖范围上的差异。
![]()
第二类是后续互动,研究人员将引用同一项原始研究的后续成果视为一个整体,统计这些成果之间的相互引用密度,结果发现 AI 研究的后续互动减少约 22%。研究团队据此指出,AI 研究更容易围绕少数热门核心成果形成放射式结构,而不是像新兴研究领域那样形成相互连接、不断扩展的研究网络。
![]()
03
被效率机制挤出的探索空间
这项研究的意义不在于简单地得出人工智能好或不好的结论,而在于研究团队用系统的数据指出了一个更深层的问题:人工智能在明显提升个人科研收益的同时,可能正在改变科学整体前进的方式,而且这种改变未必是理想的。
研究人员发现,使用 AI 的科学家在个人层面获得了非常明确的好处,包括论文发表数量增加 3.02 倍、引用数量增加 4.84 倍,以及平均提前 1.37 年成为研究负责人。但与此同时,在整体层面,科学研究覆盖的知识范围却收缩了 4.63%,研究之间的互动也减少了 22%。这些数据共同表明,个人影响力的扩大,正在伴随着集体探索范围的缩小。
进一步来看,研究团队并不认为这种现象是因为研究人员变得不努力或缺乏创造力,而是指出了一种更现实的机制。当人工智能更容易在数据充足的研究方向上带来更高效率和更好表现时,研究人员在理性选择下,自然会把更多时间和资源投入这些方向。
结果是,科学研究不断在数据丰富的领域中被加速、优化和重复,而那些数据稀缺、但可能更基础、更具开创性的研究问题,则更容易被边缘化。研究人员还发现,一些直觉上可能重要的因素,例如研究主题本身是否热门、早期影响力大小或是否获得优先资助,与这种集中趋势的关系并不明显,相比之下,数据是否容易获得更可能是推动 AI 集中使用的关键原因。
基于这些发现,研究团队对科研政策和 AI for Science 的发展方向提出了提醒。如果学术评价体系和资源分配机制继续主要奖励更快产出和更高引用,那么人工智能带来的个人激励会被进一步放大,而科学整体层面的研究集中、互动减少和探索范围变窄,也可能随之加剧。
换句话说,人工智能可能会让科学研究变得越来越高效,但同时也可能让科学探索变得越来越保守,这正是研究团队希望通过这项研究引起关注的核心问题。
04
项目背后的科研力量
这篇论文的一作是郝千越,他目前是清华大学电子工程系的博士研究生,研究方向主要集中在人工智能领域,包括强化学习和大语言模型等方向。
本科阶段,郝千越同样就读于清华大学电子工程系,在博士阶段持续从事人工智能方法及其应用相关的研究工作。在科研成果方面,他在 NeurIPS、KDD 等国际顶级人工智能会议和期刊上发表过多篇论文,其中多项工作获得 Spotlight 等认可。
![]()
参考资料:https://haohaoqian.github.io/
这篇论文的通讯作者之一是徐丰力。徐丰力现任清华大学电子工程系助理教授、博士生导师,于 2023 年入职清华大学,在该系开展人工智能、数据科学、社会计算与复杂网络等方向的研究工作。他早期在清华大学获得工学博士学位,随后曾在香港科技大学和芝加哥大学从事博士后研究。
在研究方向上,徐丰力教授主要关注基于数据驱动和人工智能的方法来建模复杂信息系统和人类行为模式,尤其聚焦大语言模型、社会行为计算、城市科学等交叉领域。
目前,他已在 Nature Communications、Nature Human Behaviour、PNAS 等顶级综合性学术期刊,以及 NeurIPS、KDD、WWW 等国际会议上发表多篇高水平论文,并获得吴文俊人工智能优秀青年奖、CAAI 社会计算新星学者奖、微软学者奖研金等多项学术荣誉。
![]()
参考资料:https://fenglixu.github.io/
这篇论文的另外两位通讯作者分别是清华大学的李勇教授和芝加哥大学的 James Evans 教授。
其中,李勇是清华大学电子工程系的长聘教授、博士生导师,并担任城市科学与计算研究中心负责人,是教育部长江学者。他长期从事人工智能、数据科学、复杂系统与社会计算等交叉学科研究,主持了多个国家重点研发计划和国家自然科学基金重点项目。
在科研成果方面,李勇教授在人工智能和数据科学方向积累了丰富研究成果,在 Nature Computational Science、Nature Machine Intelligence、Nature Human Behaviour、Nature Cities 等综合性期刊,以及 ACM KDD、NeurIPS、ICLR、WWW 等国际会议上发表了大量高水平论文,累计引用超过三万多次,并拥有多项授权专利。
他曾入选全球高被引科学家、国家万人计划青年拔尖人才,获得教育部科技进步一等奖、IEEE ComSoc 亚太杰出青年学者奖、吴文俊人工智能优秀青年奖等多项荣誉,同时也担任多个国际会议筹委会成员和国际期刊编委。
![]()
参考资料:https://fi.ee.tsinghua.edu.cn/~liyong/
James Evans是芝加哥大学社会学系的 Max Palevsky 教授,同时担任该校 Knowledge Lab 的主任和计算社会科学项目的学术负责人,并在 Santa Fe Institute 等机构任客座或外部教授。他的研究重点是理解知识与集体思维系统的形成与演化机制,包括注意力分布、思想起源、共享思维模式、协同与争议过程,以及确定性与不确定性如何在群体中积累。
在研究方法上,James Evans 常使用大规模数据、机器学习和生成模型等工具来探讨人类理解与创新的集体机制。他的研究成果发表在 Nature、Science、PNAS 等顶级学术期刊,并经常受到 The New York Times、The Economist、BBC、CNN 等国际媒体的关注与报道。此外,James Evans 还长期在学术界从事编辑、评论和项目指导等工作。
![]()
参考资料:https://sociology.uchicago.edu/directory/james-evans
值得一提的是,研究团队并未止步于对问题的识别和诊断,而是尝试在实践层面回应这一结构性挑战。围绕人工智能在科研中可能加剧研究集中、压缩探索空间的风险,徐丰力、李勇教授团队进一步提出了一种面向未来科研范式的解决思路,推出了一个强调全流程协同与跨学科探索的科研智能体系统OmniScientist(访问网址:OmniScientist.ai)。
![]()
访问地址:OmniScientist.ai
与将 AI 仅作为单点工具嵌入科研流程不同,OmniScientist 试图将人工智能引入科研问题定义、文献理解、假设生成、方法设计和结果分析等多个关键环节,通过多智能体协作的方式,帮助研究者系统性地拓展研究视角,降低跨领域探索的门槛,从而缓解单一数据密集方向对科研路径的过度吸引。
某种意义上,OmniScientist 正是对论文所揭示问题的直接回应,即在承认 AI 显著提升科研效率的同时,尝试通过更具结构意识的设计,引导人工智能服务于更广泛、更具探索性的科学研究目标。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.