AI让科研人发3倍论文，但科学在收缩：什么才是科研人需要的AI？|学术|爱思|文献|柳叶刀

AI让科研人发3倍论文，但科学在收缩：什么才是科研人需要的AI？

2026-07-02 13:19:15　来源: DeepTech深科技

北京举报

分享至

2026 年 1 月，一项覆盖 4,130 万篇论文的大规模研究显示：使用 AI 工具的科学家发表论文数量是不使用者的 3.02 倍，获得的引用量达到 4.85 倍，晋升为课题负责人的时间平均提前了 1.4 年。但在集体层面，AI 的采用使科研主题的总覆盖面缩减了 4.63%，科学家之间的互动下降了 22%。

论文作者、芝加哥大学社会学教授 James Evans 将这种现象称为“孤独的人群”（lonely crowds）。大量研究者涌入相同的热门方向，产出高度重叠的成果，却越来越少地与彼此的工作对话。AI 没有拓宽科学的疆域，而是把科研人集中到了数据最丰富的已知领域。效率在提升，探索却在萎缩。

与此同时，另一场危机正在文献层面蔓延。

你引用的那篇论文，可能根本不存在

2026 年 5 月，哥伦比亚大学数据科学研究所在《柳叶刀》（The Lancet）上发表了一项审计。研究团队扫描了 PubMed Central 开放获取子集中的 250 万篇论文和 9,700 万条引用，发现 AI 生成的虚假引用数量在过去三年增长了超过 12 倍。

2023 年，每 2,828 篇论文中出现 1 篇含伪造引用；到 2025 年，这一比例变成每 458 篇 1 篇；2026 年前七周，缩短到每 277 篇 1 篇。拐点出现在 2024 年年中，恰好是 AI 写作工具大规模普及的时间窗口。

不只是论文。全球顶级 AI 学术会议 NeurIPS 2025 也被曝出类似问题。AI 检测公司 GPTZero 对大会接收的 4,841 篇论文进行全量扫描，在 53 篇已录用论文中发现编造的作者、不存在的期刊、伪造的 DOI 号等超过 100 条虚构引用。每一篇都经过至少三位审稿人评审，每一篇都在 24.52% 的录用率中击败了超过 1.5 万篇竞争稿件。

两组数据指向同一个问题：通用 AI 工具在提升科研效率的同时，正在动摇科研赖以运转的两个基础：文献的可信度和思维的多样性。

用得越多，信得越少

AI 影响科研的速度有多快？斯坦福大学《2026 AI 指数报告》的数据是：生成式 AI 在三年内达到 53% 的人口普及率，比个人电脑和互联网都快。科研领域也一样，爱思唯尔 2025 年全球学者调研中，84% 的研究者表示自己在工作中用过 AI 工具，58% 定期使用。

但使用者的信任还没跟上。同一份调研里，只有 22% 的研究者认为 AI 工具的输出完全可信，86% 担心 AI 会造成关键错误。59% 的研究者将“透明度和可验证的引用”列为信任的首要标志。

更麻烦的是，越“聪明”的模型可能越不可靠。Vectara 的最新幻觉基准测试显示，所有推理型模型幻觉率均超过 10%，其中 Grok-4-fast-reasoning 高达 20.2%。DeepSeek 的 R1 推理模型幻觉率 14.3%，是其基础模型 V3 的近 4 倍。研究者用来做深度分析的模型，恰恰是最容易编造事实的那一类。

“我们像群居动物一样涌向了同一座山峰”

Evans 团队给出了一个解释机制：热门问题催生大规模数据集，大规模数据集使 AI 工具的应用变得诱人，AI 工具取得的进展吸引更多研究者涌入同一问题。一个自我强化的循环就这样形成了。在 AI 研究中，仅 22% 的论文就获取了 80% 的引用。Evans 把这种状态叫作“方法论单一栽培”（methodological monoculture）。

这种变化早已不只停留在论文和数字里。

6 月 17 日，由中国教育工会上海市委员会主办，爱思唯尔和中国教育工会同济大学委员会承办，上海市教育评估协会协办的“走近科研人 AI Bootcamp”活动在同济大学举行，来自上海多所高校的 300 余名教师参加了关于科研 AI 实践的讨论。圆桌环节的交锋，和 Evans 描述的困境形成了直接呼应。

欧洲科学与艺术院院士、同济大学教授庄晓莹分享了一个直观的例子：她在欧盟评审科研项目时，九个申请中有七个选了几乎相同的题目。“AI 可能正在把趋同化从消费领域带进科研思维。”

同济大学教授庄晓莹（左）、同济大学长聘教授王昊（中）与爱思唯尔科研部高级市场经理（右）来源：DeepTech

她的另一个担忧更为具体。有教授把自己过去五年的论文全部喂给 AI，让学生照着写，90% 的内容不用改，“这种方式很高效，但学生在这个过程里得到了什么？大脑是肌肉，不用会退化。”

同济大学长聘教授王昊奋长期从事知识图谱和大模型研究。他对 AI 工具的态度是一句常被引用的话：“外行看 AI 像内行，内行看 AI 像外行。”AI 可以把人在不熟悉领域的水平拉到平均线，但在已经是专家的领域，盲目依赖反而会被带偏。

在实践中，他让学生用 AI 团队协作的方式做文献综述：300 个主题卡、自动取证、分批推进，把原来 6 到 8 周的工作压缩到一周。但他更在意的是分界线：“可委托的执行”和“不可委托的判断”必须分清楚。

科研 AI 需要什么样的底线

Evans 揭示的是 AI 正在缩窄科学的视野，《柳叶刀》揭示的是 AI 正在侵蚀文献的根基。

那有没有一种 AI 工具的设计方式，能在提供效率的同时守住可信度？今年 1 月正式上线、6 月 25 日刚刚发布新一轮功能扩展的爱思唯尔 LeapSpace，走的是另一条路。

图丨 LeapSpace（来源：Elsevier）

数据层面，LeapSpace 的底座是目前全球规模最大的可信学术内容集合之一：Scopus 索引的 1 亿多条摘要记录来自 7,000 多家出版商，加上爱思唯尔自身及 Emerald Publishing、IOP Publishing、NEJM Group、Sage 等 1,000 多家内容合作伙伴的超过 2,000 万篇全文论文和图书章节。

它遵循出版商中立原则，由一个独立的 AI 委员会监督算法，确保结果不偏向任何一家出版机构或特定题材。通用 AI 给你答案，LeapSpace 多做一步：告诉你这个答案站不站得住。

它的“信任卡片”（Trust Card）在每条输出旁展示引用理由和证据强度；“声明雷达”（Claim Radar）再往前走一步，扫描整个已发表文献库，标记有多少研究支持、中立或反对一个结论。一条声明有 31 篇文献支持、4 篇中立、1 篇反对，研究者一眼就能看到证据的分布，而不是收到一个看似确定的“答案”。

Evans 团队在论文中呼吁开发“为探索而设计”的 AI 系统，而非只为优化已知问题的效率工具。LeapSpace 的深度研究（Into Research）功能所做的事情正与此类似：将一个研究问题拆解为子问题，经过证据筛选、模式发现、矛盾分析、研究空白识别，生成结构化报告，刻意将矛盾和空白暴露出来，而不是把它们抹平。

爱思唯尔用户调研数据显示，97% 的 LeapSpace 用户报告了时间节约，超过半数节省了 50% 以上的研究时间。

庄晓莹教授在活动中试用后评价：“它的文献可信可溯源，观点提炼比通用 AI 工具更专业。回答问题的水平已经达到普通专家级别。”

目前，LeapSpace 已面向科研人开放免费试用（试用入口：点击底部原文链接）。

追求可信度和发现力

Evans 团队在论文结论中写道：要在 AI 时代保持科学探索的多样性，需要“重新设想能够拓展感知和实验能力的 AI 系统，激励科学家从过去无法触及的领域搜寻、选择和收集新型数据，而不仅仅是对已有数据做优化分析。”

这也许是科研级 AI 和通用 AI 最根本的区别。通用 AI 帮你在已知领域跑得更快，科研级 AI 试图帮你看到未知领域的入口。一个追求效率，一个追求可信度和发现力。

王昊奋说，他现在让学生一天读 100 篇论文，“当然，是靠人和 AI 协作。”技术上，这已经不难。难的是读完之后，还能提出一个不在那 100 篇论文里的问题。

它是帮你更快地到达答案，还是帮你更准确地找到问题？这或许是每个科研人在选择 AI 工具时，最值得想清楚的事。

参考资料：

1.https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(26)00603-3/fulltext

2.https://gptzero.me/news/neurips/

3.https://hai.stanford.edu/ai-index/2026-ai-index-report

4.https://www.prnewswire.com/news-releases/leapspace-goes-live-the-research-grade-ai-assisted-workspace-built-on-trusted-science-302665718.html

5.https://www.prnewswire.com/news-releases/elsevier-expands-leapspace-with-new-agentic-capabilities-for-tasks-across-the-complete-research-workflow-302809180.html

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.