网易首页 > 网易号 > 正文 申请入驻

清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归本质

0
分享至



在人工智能研究中,许多研究者将大量时间投入到为那 1% 的性能提升反复调参与实验迭代之中。

一个越来越值得重视的问题是:人类科学家最宝贵的直觉与创造力,是否正被困在无止境的「增量式优化」中?

SOTA(State-of-the-Art,当前最佳水平的 AI 模型)长期被视为衡量研究价值的「金标准」。

当一篇学术论文刷新 SOTA 时,人们看到的,往往只是结果的跃升。但在结果背后,真正支撑起一次次「当前最佳」的,往往不是某一个瞬间的灵感,而是此后持续数月甚至数年的高强度实验迭代、参数调整与工程优化。

以 Transformer 架构的发展为例。自 2017 年问世以来,全球科研人员围绕这一架构投入了大量人力与算力,不断提出新变体、设计新模块、优化训练策略,才最终将其在通用语言理解评测集 GLUE 上的性能从约 75% 提升到 90% 以上。



Transformer 架构在 GLUE 评测集上的性能爬升

问题在于,这些优化工作虽然重要,却并不总是最值得由人类科学家重点投入的那一部分。

如果最优秀的科研人才被长期绑定在重复性的性能优化中,那么那些更具原创性、更需要长期思考的问题,谁来持续投入?

AutoSOTA 让 AI 科研自动化走向端到端闭环

正是在这样的背景下,在近期召开的中关村论坛上,清华大学与北京中关村学院联合发布研究成果 ——AutoSOTA。

目前,AutoSOTA项目已发布预印本论文。



论文地址:https://arxiv.org/abs/2604.05550

AutoSOTA 面向端到端的 AI 科研自动化,致力于通过科研智能体加速高强度、重复性的实验迭代与优化过程,将研究者从持续的性能打磨中解放出来。



AutoSOTA 研究问题框架

不同于现有的代码优化框架,AutoSOTA 并不是对单一实验环节的局部加速。它将 AI 智能体的赋能边界进一步延伸到实验准备、实验执行等底层繁琐任务,以及研究思路生成等顶层构思环节,旨在实现从已有 SOTA 到新 SOTA、从现有代码仓库到新代码仓库的端到端 AI 科研自动化。



AutoSOTA 端到端 AI 科研自动化系统

AutoSOTA 采用多智能体协作框架,借鉴人类算法研究中的分工流程与协作逻辑,使不同科研智能体能够围绕同一目标开展协同设计、实验执行、结果分析与方案迭代。

与此同时,AutoSOTA 配备了完善的工具库(Toolkit)与技能集(Skill Set),不仅能够处理实验运行中的复杂状况,还能够完成文献调研、思路生成、方案设计等高层次任务,从而在顶层规划与底层执行之间形成闭环。

这意味着,AutoSOTA 所追求的并不只是「把实验跑得更快」,而是真正推动 AI 科研自动化从单点辅助走向系统化、持续化、智能化的科研协作过程。

一周时间,发现 105 个性能显著提升的 SOTA 模型

在为期一周的实验中,AutoSOTA 以前一年 AI 顶会论文中的优秀成果为基础,自动发现了 105 个性能显著提升的模型方案。其中,超过 60% 的模型具有新颖的结构设计,平均性能提升接近 10%。



基于AutoSOTA的大规模SOTA AI模型发现

项目地址:https://tsinghua-fib-lab.github.io/AutoSOTA/

这组结果的意义在于,AutoSOTA 并非只是沿着既有路径进行简单搜索,也不局限于参数组合层面的穷举式优化。它在优化性能的同时,展现出一定程度的结构创新能力,能够在已有研究基础上继续挖掘新的设计空间,发现兼具性能提升与结构新颖性的模型方案。

AutoSOTA 的意义,不止于「再提几分」


AutoSOTA 的意义,不仅在于获得了一批新的 SOTA 结果,更在于它启发人类科学家重新审视科研创新的本质:SOTA 性能的刷新,是否等同于重要的科学突破?

AutoSOTA 启示我们进一步思考:如何将人类科学家最宝贵的注意力,从重复性的实验迭代中重新释放出来,回归到更具原创性、也更需要长期判断与创造力的研究问题上?

一种可能的人智协作模式是:由科研智能体系统承担大量重复性、密集型、长周期的优化过程,由人类科学家聚焦于提出问题、定义方向、识别机会与构想机制。在这一意义上,AutoSOTA 更像是一种面向科研流程的「创造力放大器」。

它并不是要替代科学家的原创性,而是要把原创性从低效、重复的实验劳动中解放出来。



AutoSOTA启发的人智协同科研范式

真正重要的,不是让研究者永远停留在「把已有模型再推高一点」的循环里,而是让他们有更多机会去面对那些尚未被定义、尚未被解释、也尚未被系统探索的问题。

AutoSOTA 正在朝这一方向迈出关键一步。它不仅展示了科研智能体在 AI 研究自动化中的巨大潜力,也让我们看到,当「性能优化」这项沉重工作逐步被智能体接管之后,科学研究有机会真正回到它最珍贵的起点 ——提出大胆的问题,探索未知的方向,追求不可替代的原创性突破。

项目网站:https://tsinghua-fib-lab.github.io/AutoSOTA/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日媒炒作赏樱地有“中文喧哗声”,不料日本人自己…

日媒炒作赏樱地有“中文喧哗声”,不料日本人自己…

观察者网
2026-04-09 15:54:18
中国将来的最大敌人:并非特朗普,而是手握杀招重构科技规则的他

中国将来的最大敌人:并非特朗普,而是手握杀招重构科技规则的他

Thurman在昆明
2026-04-09 18:01:37
祝贺!35岁数学家王虹,获得最高荣誉

祝贺!35岁数学家王虹,获得最高荣誉

双一流高校
2026-04-06 00:09:39
别傻了!在澳门输1000万跑回内地,叠码仔的追债手段,比你想的阴

别傻了!在澳门输1000万跑回内地,叠码仔的追债手段,比你想的阴

贱议你读史
2026-04-08 22:29:33
签了停火也没用!美国85名议员联手逼宫,坚持罢免特朗普

签了停火也没用!美国85名议员联手逼宫,坚持罢免特朗普

肖兹探秘说
2026-04-09 18:06:47
1978年陈丽华丈夫迟重瑞罕见青春珍贵留影

1978年陈丽华丈夫迟重瑞罕见青春珍贵留影

荒野老五
2026-04-08 17:55:21
物业费会不会是压死失业人群的最后一根稻草?

物业费会不会是压死失业人群的最后一根稻草?

慧翔百科
2026-04-09 18:26:20
73岁大爷为43岁妻子做阴茎假体手术,网友破防了:这才是真爱

73岁大爷为43岁妻子做阴茎假体手术,网友破防了:这才是真爱

魔都姐姐杂谈
2026-04-02 18:52:46
涉嫌严重违纪违法,刘昌卫被查

涉嫌严重违纪违法,刘昌卫被查

吉刻新闻
2026-04-09 09:38:24
麻六记杨总直播辟谣!马筱梅不是不愿带孩子回北京,而是在办证件

麻六记杨总直播辟谣!马筱梅不是不愿带孩子回北京,而是在办证件

小徐讲八卦
2026-04-09 16:52:30
刘强东和章泽天成立新公司

刘强东和章泽天成立新公司

雷达财经
2026-04-09 14:50:10
揭秘:马丁内利对阿森纳离队的立场

揭秘:马丁内利对阿森纳离队的立场

绿茵情报局
2026-04-09 17:48:56
今晚霉运全清零,明天好运一路开挂!心善行正,好运自然来

今晚霉运全清零,明天好运一路开挂!心善行正,好运自然来

金沛的国学笔记
2026-04-09 14:24:07
NBA第一!约基奇赛季砍下34次三双,他能打破单季三双纪录吗?

NBA第一!约基奇赛季砍下34次三双,他能打破单季三双纪录吗?

林子说事
2026-04-09 18:14:40
纪委是如何发现贪腐的?看完这篇,你就明白了

纪委是如何发现贪腐的?看完这篇,你就明白了

细说职场
2026-04-09 09:20:30
上海地铁宣传海报里有人随地小便?地铁方:第一时间前往现场核查,画面较为模糊,无法判断

上海地铁宣传海报里有人随地小便?地铁方:第一时间前往现场核查,画面较为模糊,无法判断

洪观新闻
2026-04-09 16:17:08
西方媒体:就算中国全力以赴,也不可能按时建成这样庞大的工程

西方媒体:就算中国全力以赴,也不可能按时建成这样庞大的工程

黑翼天使
2026-04-09 16:26:10
国企干10年:审计是找麻烦,纪检是要你命!

国企干10年:审计是找麻烦,纪检是要你命!

一口娱乐
2026-04-09 16:41:48
张雪峰去世15天,原配李丽婧罕见发声,透露张姩菡近况,令人担忧

张雪峰去世15天,原配李丽婧罕见发声,透露张姩菡近况,令人担忧

秋姐居
2026-04-08 17:19:31
56岁鲁豫坐竹椅瘦脱相!手骨像枯枝,这病态美让人心疼又上头?

56岁鲁豫坐竹椅瘦脱相!手骨像枯枝,这病态美让人心疼又上头?

娱乐领航家
2026-02-12 23:00:04
2026-04-09 19:28:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12719文章数 142621关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

一群人闯进女子刚买的新房砸了两面墙 物业称出于好心

头条要闻

一群人闯进女子刚买的新房砸了两面墙 物业称出于好心

体育要闻

8万人面前心脏骤停 现在他还站在球场上

娱乐要闻

金莎官宣结婚 与老公孙丞潇相差18岁

财经要闻

停火首日,霍尔木兹仅有4艘船通过

汽车要闻

文飞的回归 给神行者带来什么?

态度原创

手机
房产
本地
健康
公开课

手机要闻

Find X9 Ultra影像实力揭晓 打造专业口袋哈苏

房产要闻

利润暴跌44%!那个春节被骂惨了的海峡股份 正在经历什么?

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

干细胞抗衰4大误区,90%的人都中招

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版