网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Nature重磅：AI写的论文，在顶会同行评审击败55%人类，单篇15美元

2026-03-28 14:07:45　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：元宇

【新智元导读】刚刚，Nature盖章AI独立科研时代！全新Scaling Law显现，人类死守的学术铁王座，正发生不可逆的转移。

一篇长达数十页的学术论文，在人类设定研究主题和实验边界后，系统自动完成了从实验到写作的大部分流程。

从论文正文、实验代码、图表和投稿稿件，主要由系统端到端自动生成。

它被投递到顶尖机器学习会议ICLR 2025某workshop的同行评审流程中，三位匿名审稿人不知道具体哪几篇是AI生成稿件，他们对着这篇稿件分别打出了6、7、6的高分。

这个成绩，高于约55%的同场投稿。稿件在评审完成后按实验协议撤回，未进入正式发表阶段。

这并非科幻，这是刚刚被《Nature》报道的一项震撼研究。

该项研究是由Sakana AI联合牛津大学、UBC共同推出的全自动AI科学家「The AI Scientist」。

Sakana AI联合创始人兼 CEO David Ha在推文中表示，启动该项目，正是想探索大模型是否能够完成整个科研全流程：

我坚信，AI将永远改变科学发现和科研进步的方式。

全自动「AI科学家」

究竟做了什么？

这一次，不是AI在「帮」人干活，而是AI第一次把科研流程从头走到尾。

一直以来，AI在科研领域的定位都是「高级打工人」：比如帮化学家折叠蛋白质，或是帮程序员找bug。

定义问题和统筹全局的，始终是人类。

The AI Scientist的出现，则颠覆了这套「主仆叙事」，它完整覆盖了科研的四大核心阶段：Idea生成、实验迭代、论文写作、自动评审。

在全新升级的v2版本中，它甚至走向了「无模板」模式：彻底抛弃人类提供的初始代码脚手架，引入了强大的「智能体树搜索」（agentic tree search）机制。

这意味着它能在庞大的未知解空间里，同时开启多条主线并行探索。科研不再是单线程试错，而变成了一个可扩展的搜索过程。

它怎么保证自己不和别人撞车？

系统会调用Semantic Scholar API进行全网查重，确保每一个idea都具备足够的新颖性。

在最棘手的数据可视化环节，它甚至内置了一个视觉语言模型（VLM）作为反馈审阅者。

如果坐标轴反了、图例丢了、展示有歧义，VLM会像严苛的导师一样立刻打回重做，直到生成完美的学术图表。

过去图表只是论文包装，现在图表也成了AI科研的反馈信号。

而完成这堪比博士生几个月工作量的闭环，它的账单是：单篇论文15美元。

如此惊人的性价比意味着，科研自动化第一次从「局部辅助」跨进了「全链路主导」。

AI不再只是科学家的辅助工具，而是向更具自主性的科研代理系统演进。

AI Scientist工作流程的概念概述，包括提出研究想法、实施实验、执行实验、撰写论文以及审阅论文。

通过人类同行评审测试

AI写的论文，人类学术金字塔尖的学者到底认不认？

于是，Sakana AI决定玩一把大的：直接向顶会投稿。

在获得ICLR大会领导层、ICBINB workshop组织者以及IRB伦理委员会的特批后，团队进行了一场极其大胆的「潜伏行动」：将3篇纯AI生成的论文混入了人类投稿池。

审稿人只被告知「可能有AI生成论文」，但根本不知道具体是哪几篇。

结果其中一篇探索神经网络组合正则化（Compositional Regularization）负面结果的论文，斩获了平均6.33分（弱接收、接收、弱接收）的高分。

这个分数不仅稳稳越过了该workshop的平均录用线，更是超过了55%的真实人类学者。

连科学研究中最难写出彩的负向论证，AI也能写得有模有样、逻辑自洽。

据Sakana AI团队所称，这是全AI生成论文首次在真实学术评审环境中获得通过接收线的成绩。

这也标志着同行评审，真正迎来了「图灵测试」时刻。

AI审稿人比人类更靠谱？

如果AI一天能花几百美元写出几十篇论文，人类审稿系统瞬间就会崩溃。

想让AI科研实现指数级爆发，就必须有能够大规模评估质量的「自动化裁判」。

Sakana AI给出的答案是：直接让AI来当Area Chair（领域主席）。

他们构建了一个高度还原NeurIPS官方审稿流程的自动化系统：

5个独立的AI审稿人进行背靠背挑刺，最后由1个AI元审稿人进行共识汇总和最终裁决。

在与数千条真实OpenReview人类审稿决策的硬碰硬对比中，自动化审稿人交出了69%的平衡准确率。

令人震惊的是，在作者设定的评测框架下，自动审稿系统的部分指标优于所对照的人类一致性结果。

有人质疑：AI是不是偷偷背过题？

团队特意用知识截止日期（2025年）之后的全新论文进行了数据污染测试。

结果依然坚挺：平衡准确率保持在66%，达到可与人类顶级学者比肩的实战水准。

这表明，AI正在进入过去长期由人类主导的科研流程核心环节。

过去，人类同时垄断了「写论文的人」和「决定论文是否成立」这两个关键角色。

现在，这两个角色都在被AI切入。

一旦评审环节也被自动化，AI科研就不再是零星爆款，而具备了大规模、左右互搏式迭代的基础设施。

该自动审稿系统在顶级会议（ICLR）发表的AI论文上，其审稿判断与人类审稿人一致，包括在模型训练完成之后（即超出其「知识截止日期」）发表的论文。这些结果表明，该自动审稿系统在为新撰写的AI论文提供评审分数方面，可靠性与人类审稿人相当。

科研的Scaling Law

如果说「过审」证明了AI科研站得住，那真正决定未来天花板的是另一件事：

它是不是可持续变强？

Nature论文中最具颠覆性的一组数据，揭示了潜藏在AI科研背后的全新定律。

研究发现，底层大模型的能力与生成论文的质量之间，呈现出令人头皮发麻的极度显著正相关（P<0.00001）。

随着模型发布日期推进，AI产出的论文质量持续陡峭上升。

同时，算力正在暴力改写科研法则。

投入的测试时算力越多，智能体树搜索的深度就越深，实验质量就越扎实，最终的产出评级就越高。

当前最顶配的AI科学家，其平均产出已经逼近机器学习顶会workshop的边缘录用（borderline accept）水平。

这背后展示的是一条正在形成的「科研Scaling Law」。

过去的科技突破，依赖于虚无缥缈的灵光乍现，而未来的科学发现，将变成一条可精确计算的工业流水线。

随着模型能力呈指数级增长、推理算力成本呈指数级下降，这套系统会自动升级，这才是这项工作真正展现出恐怖势能。

根据自动评审员的评判，当使用更新、更智能的基础模型时，AI Scientist生成的论文质量会提高。

AI全面接管科研

我们准备好了吗？

当然，这篇Nature论文，同样也指出了The AI Scientist的目前的局限性：

它偶尔会想出幼稚的idea，写的代码会有bug，论文里会出现引用的幻觉，甚至在附录里重复粘贴同一张图表。

值得警惕的是，论文显示该系统具备自动调试、重试运行和在受限计算预算下持续迭代实验的能力。

这意味着，未来更强的科研代理一旦出现规避约束的倾向，可能带来新的安全治理问题。

如果这种系统被毫无节制地释放，海量生成的低门槛论文会瞬间压垮整个学术生态，学者的学术 credentials（资历证明）将被彻底稀释。

正因如此，Sakana AI采取了极其克制的立场：主动撤稿、通过IRB审批、呼吁添加生成水印，并急迫要求社区建立全自动AI科研规范。

这篇Nature论文不只是展示AI技术的里程碑，更是把AI所带来的伦理争议也摆上台面。

真正的问题早已不是「AI能不能做科研」，而是「当AI开始独立做科学，谁来定义什么算科学」。

正如团队所设想的终极愿景：AI科学家不会让人类科学家消失，但人类科学家的角色，必须被迫向着科研价值链的更上游迁徙：

去定义问题、设定边界、决定哪些发现值得被相信。

参考资料：

https://sakana.ai/ai-scientist-nature/%20

https://www.nature.com/articles/s41586-026-10265-5%20

https://x.com/SakanaAILabs/status/2036840833690071450%20

https://x.com/hardmaru/status/2036841736702767135

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

OpenAI把达里奥逼上绝路！Claude 5又续命7天

新智元 2026-07-13 09:54:39
0 跟贴 0
神秘Opus 5意外曝光！达里奥紧急开会

新智元 2026-07-12 15:13:37
0 跟贴 0

AI是怎样“想”出答案的？Anthropic找到了线索

DeepTech深科技 2026-07-11 21:28:58
5 跟贴 5

全球首例，人形机器人手术登上Nature

财联社 2026-07-11 02:47:37
1 跟贴 1
表格建模也能Scaling？树模型的时代要改变了

机器之心Pro 2026-04-17 11:12:25
0 跟贴 0

AI智能体不是越多越强：信息冗余构成了LLM Agent Scaling的瓶颈

机器之心Pro 2026-02-27 14:45:03
0 跟贴 0

做科研也能“点外卖”？AI超级科研工厂直播中：100个课题同时开跑

量子位 2026-07-10 15:08:57
0 跟贴 0
中国人民大学：扎根中国沃土求解时代课题

中国教育报 2026-07-11 11:33:00
0 跟贴 0

论文打假博主“耿同学”复出，曝浙江大学海归教授在美国就造假！

总在茶余后 2026-07-11 03:05:56
59 跟贴 59
人大博士生逐字翻译抄袭论文被撤稿，拟入职安徽大学公示后，被曝出曾网售发论文咨询服务，宣称“常发C刊，三四天出一篇论文”

双一流高校 2026-07-13 00:31:48
1 跟贴 1
SCI投稿全流程图解

会投稿的小钱编辑 2026-07-09 10:29:03
5 跟贴 5
秦庆武：武卫华、翁惠明二位主编印象

在时代的变迁中 2026-07-12 12:34:47
0 跟贴 0
超10万张床位，空了一半？

中国新闻周刊 2026-07-12 12:47:02
25127 跟贴 25127
快快评 | 高校拟录用学术不端者，开什么玩笑！

现代快报 2026-07-13 09:10:42
0 跟贴 0
印裔学者直言：印度游客扎堆来华，勿轻引移民

流云随风去远方 2026-07-11 04:37:35
0 跟贴 0
7k星标的开源skill，给你组一支AI科研团队

量子位 2026-05-16 19:58:50
0 跟贴 0
瑞士主帅不解恩博洛被红牌罚下：VAR介入让人无法理喻

红星新闻 2026-07-12 15:08:28
15420 跟贴 15420
年薪35万，月加班80小时：挤进长鑫的年轻人正在经历什么？

第一财经资讯 2026-07-12 12:48:23
3534 跟贴 3534
罗西尼《威廉·退尔》序曲俄罗斯国家学术交响乐团指挥达米安·伊奥里奥

音乐纵横 2026-07-12 09:14:32
3 跟贴 3
科学泰斗直言：黑人未完全进化，黄种人智商最高，被封杀晚年凄凉

战争黑匣子 2026-07-12 12:25:04
50 跟贴 50
最新研究：生育率下降未必带来经济增长放缓

参考消息 2026-07-12 11:04:17
18812 跟贴 18812
铁证如山菲方曾书面承认黄岩岛非其领土关键细节披露

澎湃新闻 2026-07-12 16:19:03
1956 跟贴 1956
地质灾害气象风险预警

中央气象台 2026-07-12 17:48:45
869 跟贴 869
遭遇争议判罚后出局瑞士队已经创造了史上最佳成绩

澎湃新闻 2026-07-12 15:52:28
5100 跟贴 5100
评职称，“经费需几百万至一两千万”

中国新闻周刊 2026-07-12 13:27:02
424 跟贴 424
安徽大学发布情况说明

凤凰网安徽 2026-07-13 09:39:50
0 跟贴 0
河南老君山月薪6万招人每天看云海，需在山顶住30天，每天至少发一条短视频，景区：咨询报名者众多，全国仅选一人

极目新闻 2026-07-08 14:01:25
7491 跟贴 7491
两年狂揽 8.2 亿！8 月新规落地，大批医学分会迎来大裁撤

医护健康科普 2026-07-13 09:21:52
1 跟贴 1
时隔24年英阿大战将再上演曾诞生"上帝之手"等名场面

红星新闻 2026-07-12 16:53:10
244 跟贴 244
Nature Cell Biology：张毅团队揭示PRC2在早期胚胎发生中不同阶段的功能

生物世界 2026-07-11 09:52:13
0 跟贴 0
华盛顿大学研究：孩子智商不是由基因决定，而是受家庭住址影响

菁妈育儿 2026-07-13 08:49:34
0 跟贴 0
西方营造“俄罗斯要输”的氛围乌军前总司令泼冷水

澎湃新闻 2026-07-12 20:03:27
2540 跟贴 2540
古老的远古老物件放到今天，照样让科学家挠头

皮皮流鼻涕 2026-07-12 01:20:32
1 跟贴 1
两年孵化26家AI企业，这所高校“师生共创”出成果

金台资讯 2026-07-13 09:58:31
0 跟贴 0
唯一盟友航母撤离！霍尔木兹只剩美国航母

看看新闻Knews 2026-07-12 11:12:17
3122 跟贴 3122
100万年后的人类多强大？科学家拟出草图，人类或不再惧怕死亡

壹知眠羊 2026-07-13 07:05:41
1 跟贴 1
民生调查局丨“扫开就近2块钱”，共享单车涨价到哪里是个头

中国网 2026-07-13 06:35:11
380 跟贴 380
南京农业大学副教授（高层次引进人才）以共同第一作者和通讯作者身份Nature旗下权威期刊发表研究成果

植物研究进展 2026-07-11 23:43:58
0 跟贴 0
利好！光谷这一国家重点项目全面封顶！

大楚生活圈 2026-07-12 20:23:09
0 跟贴 0
“00”后，当上北大博导！

新浪财经 2026-07-09 21:16:19
3 跟贴 3

笑趴了！甲鱼到了问咋处理，客服指着脖子说：亲这里！下秒被咬了

笑趴了！甲鱼到了问咋处理，客服指着脖子说：亲这里！下秒被咬了

另子维爱读史

2026-07-12 19:42:09

＂5大怪象＂正在国内迅速蔓延，我们要当心了，你注意到了吗？

＂5大怪象＂正在国内迅速蔓延，我们要当心了，你注意到了吗？

碧海孤航

2026-07-10 22:39:08

彻底破防后，日防长一语惊人，他想让中国明白：越南早就站日本了

彻底破防后，日防长一语惊人，他想让中国明白：越南早就站日本了

临云史策

2026-07-12 15:02:19

图灵奖得主"倒戈"：砸10亿美元证明「LLM是死路」，猫都比ChatGPT聪明

图灵奖得主"倒戈"：砸10亿美元证明「LLM是死路」，猫都比ChatGPT聪明

新浪财经

2026-07-12 02:56:02

伊朗发布最高领袖全新照片

观察者网

2026-07-12 17:24:26

文班亚马降薪5100万引地震 NBPA：薪资制度出问题了

文班亚马降薪5100万引地震 NBPA：薪资制度出问题了

热血体育社

2026-07-13 00:06:41

路线突变！台风携海量水汽北上，山东全省即将迎来持续性大雨

路线突变！台风携海量水汽北上，山东全省即将迎来持续性大雨

漫川舟船

2026-07-13 09:05:48

一家3代短命！蔡磊处境曝光，斥资续命收效甚微，儿子也成牺牲品

一家3代短命！蔡磊处境曝光，斥资续命收效甚微，儿子也成牺牲品

周哥一影视

2026-07-04 20:40:16

“1厘米小口子，随便弄一下要四千多”患者怒怼过度收费，然而做4小时手术到手9.75元，看病钱没进医生口袋

“1厘米小口子，随便弄一下要四千多”患者怒怼过度收费，然而做4小时手术到手9.75元，看病钱没进医生口袋

医脉圈

2026-07-12 20:10:26

警惕，超强厄尔尼诺事件要来了！预计2027年夏季长江流域降水偏多，极端洪涝灾害风险较高

警惕，超强厄尔尼诺事件要来了！预计2027年夏季长江流域降水偏多，极端洪涝灾害风险较高

每日经济新闻

2026-07-12 23:05:09

网传郭晶晶为广西洪灾捐8000万？查证官方公示后，真相让人破防

网传郭晶晶为广西洪灾捐8000万？查证官方公示后，真相让人破防

小椰的奶奶

2026-07-13 00:58:36

确认！杨瀚森受伤……

五星体育

2026-07-13 03:08:34

时隔四年！海信墨水屏手机A10官宣可拆卸磁吸LCD副屏 4nm芯片

时隔四年！海信墨水屏手机A10官宣可拆卸磁吸LCD副屏 4nm芯片

快科技

2026-07-12 13:34:13

刘思齐改嫁育四子，长子命名纪念毛岸英，抚恤金40年后才得

刘思齐改嫁育四子，长子命名纪念毛岸英，抚恤金40年后才得

阿坹武器装备科普

2026-07-11 15:06:11

19点48分！北京国安官宣京沪大战延期，补赛时间基本确定又遇难题

19点48分！北京国安官宣京沪大战延期，补赛时间基本确定又遇难题

王大发不懂球

2026-07-12 16:53:56

李晟一家游览黄果树瀑布，8岁儿子帅气出镜，品尝5元香肠

李晟一家游览黄果树瀑布，8岁儿子帅气出镜，品尝5元香肠

孤芳自赏的小李

2026-07-11 15:49:48

水利部对苏皖赣鲁四省启动洪水防御Ⅳ级应急响应

水利部对苏皖赣鲁四省启动洪水防御Ⅳ级应急响应

新华社

2026-07-12 12:32:18

“超级项目”被对方盯上，去哪投资已成为两难，韩国半导体业面临“美式招商”压力

“超级项目”被对方盯上，去哪投资已成为两难，韩国半导体业面临“美式招商”压力

环球网资讯

2026-07-13 06:52:10

保姆女儿考上清华，她讥讽我：你儿子给我女儿打工，我当场辞退

保姆女儿考上清华，她讥讽我：你儿子给我女儿打工，我当场辞退

晓艾故事汇

2026-07-08 10:29:08

褚时健：我2002年才明白，原来是得罪了惹不起的那个人

褚时健：我2002年才明白，原来是得罪了惹不起的那个人

掉了颗大白兔糖

2026-07-06 19:33:51

AI产业主平台领航智能+时代

15676文章数 66951关注度

往期回顾全部

科技要闻

苹果为了AI，连Mac芯片节奏都改了

头条要闻

浙江苍南一家三口躲过一劫：刚被成功劝离房子就塌了

头条要闻

浙江苍南一家三口躲过一劫：刚被成功劝离房子就塌了

体育要闻

被3个队友锁死，哈兰德以最憋屈的方式出局

娱乐要闻

台媒曝S妈许雅钧诱使具俊晔放弃遗产

财经要闻

扫开就近2元，共享单车涨价到哪里是个头

汽车要闻

纯电/增程双动力一汽悦意08正式上市售9.99万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

艺术

游戏

健康

公开课

房产要闻

重磅学校规划曝光！西海岸教育，正强得可怕！

艺术要闻

孙中山亲笔手稿曝光！

《GTA6》不上PC原因曝光！前R星制作人揭秘

肝病、肾病患者注意！吃粘食要谨慎

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版