![]()
2026 年 1 月,一项覆盖 4,130 万篇论文的大规模研究显示:使用 AI 工具的科学家发表论文数量是不使用者的 3.02 倍,获得的引用量达到 4.85 倍,晋升为课题负责人的时间平均提前了 1.4 年。但在集体层面,AI 的采用使科研主题的总覆盖面缩减了 4.63%,科学家之间的互动下降了 22%。
论文作者、芝加哥大学社会学教授 James Evans 将这种现象称为“孤独的人群”(lonely crowds)。大量研究者涌入相同的热门方向,产出高度重叠的成果,却越来越少地与彼此的工作对话。AI 没有拓宽科学的疆域,而是把科研人集中到了数据最丰富的已知领域。效率在提升,探索却在萎缩。
与此同时,另一场危机正在文献层面蔓延。
你引用的那篇论文,可能根本不存在
2026 年 5 月,哥伦比亚大学数据科学研究所在《柳叶刀》(The Lancet)上发表了一项审计。研究团队扫描了 PubMed Central 开放获取子集中的 250 万篇论文和 9,700 万条引用,发现 AI 生成的虚假引用数量在过去三年增长了超过 12 倍。
2023 年,每 2,828 篇论文中出现 1 篇含伪造引用;到 2025 年,这一比例变成每 458 篇 1 篇;2026 年前七周,缩短到每 277 篇 1 篇。拐点出现在 2024 年年中,恰好是 AI 写作工具大规模普及的时间窗口。
不只是论文。全球顶级 AI 学术会议 NeurIPS 2025 也被曝出类似问题。AI 检测公司 GPTZero 对大会接收的 4,841 篇论文进行全量扫描,在 53 篇已录用论文中发现编造的作者、不存在的期刊、伪造的 DOI 号等超过 100 条虚构引用。每一篇都经过至少三位审稿人评审,每一篇都在 24.52% 的录用率中击败了超过 1.5 万篇竞争稿件。
两组数据指向同一个问题:通用 AI 工具在提升科研效率的同时,正在动摇科研赖以运转的两个基础:文献的可信度和思维的多样性。
用得越多,信得越少
AI 影响科研的速度有多快?斯坦福大学《2026 AI 指数报告》的数据是:生成式 AI 在三年内达到 53% 的人口普及率,比个人电脑和互联网都快。科研领域也一样,爱思唯尔 2025 年全球学者调研中,84% 的研究者表示自己在工作中用过 AI 工具,58% 定期使用。
但使用者的信任还没跟上。同一份调研里,只有 22% 的研究者认为 AI 工具的输出完全可信,86% 担心 AI 会造成关键错误。59% 的研究者将“透明度和可验证的引用”列为信任的首要标志。
更麻烦的是,越“聪明”的模型可能越不可靠。Vectara 的最新幻觉基准测试显示,所有推理型模型幻觉率均超过 10%,其中 Grok-4-fast-reasoning 高达 20.2%。DeepSeek 的 R1 推理模型幻觉率 14.3%,是其基础模型 V3 的近 4 倍。研究者用来做深度分析的模型,恰恰是最容易编造事实的那一类。
“我们像群居动物一样涌向了同一座山峰”
Evans 团队给出了一个解释机制:热门问题催生大规模数据集,大规模数据集使 AI 工具的应用变得诱人,AI 工具取得的进展吸引更多研究者涌入同一问题。一个自我强化的循环就这样形成了。在 AI 研究中,仅 22% 的论文就获取了 80% 的引用。Evans 把这种状态叫作“方法论单一栽培”(methodological monoculture)。
这种变化早已不只停留在论文和数字里。
6 月 17 日,由中国教育工会上海市委员会主办,爱思唯尔和中国教育工会同济大学委员会承办,上海市教育评估协会协办的“走近科研人 AI Bootcamp”活动在同济大学举行,来自上海多所高校的 300 余名教师参加了关于科研 AI 实践的讨论。圆桌环节的交锋,和 Evans 描述的困境形成了直接呼应。
欧洲科学与艺术院院士、同济大学教授庄晓莹分享了一个直观的例子:她在欧盟评审科研项目时,九个申请中有七个选了几乎相同的题目。“AI 可能正在把趋同化从消费领域带进科研思维。”
![]()
同济大学教授庄晓莹(左)、同济大学长聘教授王昊(中)与爱思唯尔科研部高级市场经理(右)来源:DeepTech
她的另一个担忧更为具体。有教授把自己过去五年的论文全部喂给 AI,让学生照着写,90% 的内容不用改,“这种方式很高效,但学生在这个过程里得到了什么?大脑是肌肉,不用会退化。”
同济大学长聘教授王昊奋长期从事知识图谱和大模型研究。他对 AI 工具的态度是一句常被引用的话:“外行看 AI 像内行,内行看 AI 像外行。”AI 可以把人在不熟悉领域的水平拉到平均线,但在已经是专家的领域,盲目依赖反而会被带偏。
在实践中,他让学生用 AI 团队协作的方式做文献综述:300 个主题卡、自动取证、分批推进,把原来 6 到 8 周的工作压缩到一周。但他更在意的是分界线:“可委托的执行”和“不可委托的判断”必须分清楚。
科研 AI 需要什么样的底线
Evans 揭示的是 AI 正在缩窄科学的视野,《柳叶刀》揭示的是 AI 正在侵蚀文献的根基。
那有没有一种 AI 工具的设计方式,能在提供效率的同时守住可信度?今年 1 月正式上线、6 月 25 日刚刚发布新一轮功能扩展的爱思唯尔 LeapSpace,走的是另一条路。
![]()
图丨 LeapSpace(来源:Elsevier)
数据层面,LeapSpace 的底座是目前全球规模最大的可信学术内容集合之一:Scopus 索引的 1 亿多条摘要记录来自 7,000 多家出版商,加上爱思唯尔自身及 Emerald Publishing、IOP Publishing、NEJM Group、Sage 等 1,000 多家内容合作伙伴的超过 2,000 万篇全文论文和图书章节。
它遵循出版商中立原则,由一个独立的 AI 委员会监督算法,确保结果不偏向任何一家出版机构或特定题材。通用 AI 给你答案,LeapSpace 多做一步:告诉你这个答案站不站得住。
它的“信任卡片”(Trust Card)在每条输出旁展示引用理由和证据强度;“声明雷达”(Claim Radar)再往前走一步,扫描整个已发表文献库,标记有多少研究支持、中立或反对一个结论。一条声明有 31 篇文献支持、4 篇中立、1 篇反对,研究者一眼就能看到证据的分布,而不是收到一个看似确定的“答案”。
Evans 团队在论文中呼吁开发“为探索而设计”的 AI 系统,而非只为优化已知问题的效率工具。LeapSpace 的深度研究(Into Research)功能所做的事情正与此类似:将一个研究问题拆解为子问题,经过证据筛选、模式发现、矛盾分析、研究空白识别,生成结构化报告,刻意将矛盾和空白暴露出来,而不是把它们抹平。
爱思唯尔用户调研数据显示,97% 的 LeapSpace 用户报告了时间节约,超过半数节省了 50% 以上的研究时间。
庄晓莹教授在活动中试用后评价:“它的文献可信可溯源,观点提炼比通用 AI 工具更专业。回答问题的水平已经达到普通专家级别。”
目前,LeapSpace 已面向科研人开放免费试用(试用入口:点击底部原文链接)。
追求可信度和发现力
Evans 团队在论文结论中写道:要在 AI 时代保持科学探索的多样性,需要“重新设想能够拓展感知和实验能力的 AI 系统,激励科学家从过去无法触及的领域搜寻、选择和收集新型数据,而不仅仅是对已有数据做优化分析。”
这也许是科研级 AI 和通用 AI 最根本的区别。通用 AI 帮你在已知领域跑得更快,科研级 AI 试图帮你看到未知领域的入口。一个追求效率,一个追求可信度和发现力。
王昊奋说,他现在让学生一天读 100 篇论文,“当然,是靠人和 AI 协作。”技术上,这已经不难。难的是读完之后,还能提出一个不在那 100 篇论文里的问题。
它是帮你更快地到达答案,还是帮你更准确地找到问题?这或许是每个科研人在选择 AI 工具时,最值得想清楚的事。
![]()
参考资料:
1.https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(26)00603-3/fulltext
2.https://gptzero.me/news/neurips/
3.https://hai.stanford.edu/ai-index/2026-ai-index-report
4.https://www.prnewswire.com/news-releases/leapspace-goes-live-the-research-grade-ai-assisted-workspace-built-on-trusted-science-302665718.html
5.https://www.prnewswire.com/news-releases/elsevier-expands-leapspace-with-new-agentic-capabilities-for-tasks-across-the-complete-research-workflow-302809180.html
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.