网易首页 > 网易号 > 正文 申请入驻

研究周期缩短至分钟级,开源系统解决AI研究工具关键局限

0
分享至



编辑丨coisini

面向科学发现的人工智能系统已展现出巨大潜力,但现有方法大多仍属私有技术,且以批处理模式运行,每个研究周期需要数小时,无法实现研究人员的实时引导。

最近,一篇题为《Rethinking the AI Scientist: Interactive Multi-Agent Workflows for Scientific Discovery》的研究论文提出了一个多智能体系统 ——Deep Research,能在以分钟计的时间内完成交互式科学研究。



论文地址:https://arxiv.org/abs/2601.12542

Deep Research 包含用于规划、数据分析、文献检索和新颖性检测的专用智能体,并通过一个持久的全局状态统一协调,以在迭代的研究周期中保持上下文连贯。

该系统支持两种操作模式以适应不同工作流程:半自主模式包含选择性人工检查点;全自主模式用于扩展性研究。

Deep Research

Deep Research 通过构建基于智能体的交互式环境,将研究周期从小时级缩短至分钟级,从而实现对研究过程的实时主动引导,无需等待可能需要完全重做才能探索新方向的批量结果,有效解决了现有 AI 驱动研究工具的关键局限。

该系统包含四个专门化智能体:

  • 协调智能体(orchestrator agent),负责在研究周期中维护持久的世界状态(world state);
  • 数据分析智能体,通过迭代式代码生成与知识库构建来分解复杂分析任务;
  • 文献检索智能体,综合来自异构学术数据库的证据;
  • 新颖性检测智能体,依据现有文献,对所提假设进行新颖性评估。



该系统支持两种运行模式。半自主模式引入人机协同交互,打造真正的「科学家协作者」体验:研究人员可在单次工作会话中迭代式指导并优化 AI 研究过程,根据实时涌现的洞察及时调整研究方向,而无需等待数小时的批处理结果 —— 传统方式往往需要完全重新执行才能探索替代假设。全自主模式则可在无人工干预检查点的情况下执行扩展研究周期,适用于对目标明确的研究任务进行系统性探索。

研究团队现已开源协调智能体 ——BioAgents 框架,但生物数据分析和生物文献检索组件尚未发布。未来的开发将侧重于扩展数据库覆盖范围,通过改进语义表征来优化新颖性检测,并将基准验证延伸至更多科学领域。



BioAgents 开源地址:https://github.com/bio-xyz/BioAgents



实验评估

Deep Research 在 BixBench 计算生物学基准测试上取得了 SOTA 性能,同时提供了交互式、人机协同的工作流,这与现有系统普遍采用的批处理方法形成鲜明对比。



数据分析智能体在开放式问题上的准确率达到 48.8%:



在含「Refusal」选项的多选题上准确率为 55.2%:



在不含该选项的多选题上准确率为 64.5%:



这些结果超越了 Edison Analysis、K-Dense Analyst、Kepler 和 GPT-5 等现有基线。

详细的案例研究证实,Deep Research 的性能优势源于正确的数据结构化与统计执行,而非依赖于对答案选项的先验知识。



感兴趣的读者可以阅读论文原文,了解更多研究内容。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原来马斯克没说错,全球抢的不是芯片,而是中国20万一台的变压器

原来马斯克没说错,全球抢的不是芯片,而是中国20万一台的变压器

云上乌托邦
2026-01-22 13:10:38
苹果正式推送 iOS 26.2.1 等大量新系统版本!

苹果正式推送 iOS 26.2.1 等大量新系统版本!

XCiOS俱乐部
2026-01-27 04:27:57
女子买的新冰箱碎掉了!厂家:换一台!商家:换不了!结局亮了

女子买的新冰箱碎掉了!厂家:换一台!商家:换不了!结局亮了

小柱解说游戏
2026-01-26 13:43:12
丁威迪:我想为火箭效力,我的好友DFS在那,火箭能争夺冠军

丁威迪:我想为火箭效力,我的好友DFS在那,火箭能争夺冠军

懂球帝
2026-01-27 10:09:06
重磅!总投资9600亿元,海南2026年重大项目清单曝光!

重磅!总投资9600亿元,海南2026年重大项目清单曝光!

网易海南房产
2026-01-27 10:14:35
李宗仁归国之后,希望能出任人大副委员长一职,毛主席却给出了三条关键理由,直言此事并不合适

李宗仁归国之后,希望能出任人大副委员长一职,毛主席却给出了三条关键理由,直言此事并不合适

史海孤雁
2025-12-25 16:48:16
“高市下台!”高市早苗选举拉票演讲第一站,遭日本民众抗议

“高市下台!”高市早苗选举拉票演讲第一站,遭日本民众抗议

环球网资讯
2026-01-27 15:17:19
“流氓有文化更可怕”,退休老干部频繁联系女幼师,聊天记录曝光

“流氓有文化更可怕”,退休老干部频繁联系女幼师,聊天记录曝光

妍妍教育日记
2026-01-27 19:58:28
事实证明,“销声匿迹”的宋祖英,早就已经走上了另一条康庄大道

事实证明,“销声匿迹”的宋祖英,早就已经走上了另一条康庄大道

不写散文诗
2026-01-06 18:22:37
哈里王子全家福曝光:阿奇帅气不输乔治路易,莉莉贝特神似夏洛特

哈里王子全家福曝光:阿奇帅气不输乔治路易,莉莉贝特神似夏洛特

笑傲春秋
2026-01-27 13:56:58
强得可怕!夺冠热门踢疯了,狂揽11连胜+赛季不败,高居榜首

强得可怕!夺冠热门踢疯了,狂揽11连胜+赛季不败,高居榜首

乌龙球OwnGoal
2026-01-27 13:35:38
不反华了?芬兰首脑抵京,中国用最高规格接待,现场备好一辆专车

不反华了?芬兰首脑抵京,中国用最高规格接待,现场备好一辆专车

万国明信片
2026-01-27 09:28:37
"穷但人品好"的男人能嫁吗?网友的分享一针见血,评论区吵翻天了

"穷但人品好"的男人能嫁吗?网友的分享一针见血,评论区吵翻天了

夜深爱杂谈
2026-01-27 21:32:47
原来她已离世26年!23岁登春晚一夜成名,却因一个巴掌付出生命

原来她已离世26年!23岁登春晚一夜成名,却因一个巴掌付出生命

法老不说教
2025-12-24 12:22:51
特朗普态度,180度大转弯!

特朗普态度,180度大转弯!

环球时报国际
2026-01-27 21:14:01
76岁上海知青回江西访友,竟发现当年的女友终生未嫁:我对不住你

76岁上海知青回江西访友,竟发现当年的女友终生未嫁:我对不住你

五元讲堂
2026-01-19 11:13:16
1968年,林彪想换北京军区司令,毛主席只问了一句话,林彪彻底哑火

1968年,林彪想换北京军区司令,毛主席只问了一句话,林彪彻底哑火

老杉说历史
2026-01-09 22:00:17
邱清泉唯一留在大陆的儿子,主动放弃前往台湾,后来的结局如何?

邱清泉唯一留在大陆的儿子,主动放弃前往台湾,后来的结局如何?

史之铭
2026-01-27 16:48:34
连遭美国“极限施压”,加拿大总理卡尼为与中国经贸共识辩护

连遭美国“极限施压”,加拿大总理卡尼为与中国经贸共识辩护

环球网资讯
2026-01-27 06:46:06
蹉跎半生的樊振东父母没想到,儿子一则动态,让他们迎来无上荣光

蹉跎半生的樊振东父母没想到,儿子一则动态,让他们迎来无上荣光

以茶带书
2026-01-27 17:20:57
2026-01-27 22:12:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1219文章数 223关注度
往期回顾 全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

国科大星际航行学院正式成立 官网发文诚聘海外英才

头条要闻

国科大星际航行学院正式成立 官网发文诚聘海外英才

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮被曝代孕,春晚被拒,代言跑路

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

家居
房产
艺术
数码
游戏

家居要闻

现代古典 中性又显韵味

房产要闻

实景兑现在即!绿城,在海棠湾重新定义终极旅居想象!

艺术要闻

日本东京国立博物馆中的100幅宋画

数码要闻

SKN推出青龙·惊碳机械键盘:碳纤维纹理,95%配列,399元

玩家热议《GTA6》别再加入“马克兔”!会毁了游戏

无障碍浏览 进入关怀版