网易首页 > 网易号 > 正文 申请入驻

将科研脏活累活真·丢给AI!上海AI Lab推出科研智能体FlowSearch

0
分享至

将复杂科研过程自动化落地,上海人工智能实验室推出FlowSearch!

在GAIA、HLE、GPQA以及TRQA等科研基准上,FlowSearch不仅实现了性能全面领先,还展示了AI在复杂科研任务中的动态协作与深度推理能力。



展开来说,当AI在问答基准和标准化测试中表现卓越之时,其进行科学研究的能力也在被更多关注。

科学研究不同于解题或信息检索,它是一个开放性、长期且复杂的认知过程——研究者需要提出原创问题、设计实验方案、收集并整合多源证据,并在不断迭代中形成系统结论。

这样的过程远超计算能力本身,它要求的是创新思维、动态推理能力以及对复杂知识关系的精准掌控。

FlowSearch,正是一个由动态结构化知识流驱动的深度科研智能体

它通过动态结构化知识流构建科研任务的多层依赖图,并在多智能体框架下实现任务的并行探索、知识的递归整合和流程的自适应优化。

与传统“输入—计算—输出”的封闭式AI不同,FlowSearch更像一个理解你研究思路的伙伴——当发现新信息,它会主动调整计划;当证据链不完整,它会引导进一步探索;当推理偏离目标,它会进行自我修正。

研究团队表示,它标志着科研智能体从“被动工具”迈向主动探索伙伴的新阶段,让科学发现不再只是等待AI输出结果,而是与AI一起探索、不断前进。

FlowSearch:让AI成为你的科研探索伙伴

FlowSearch由三大核心模块组成,每个模块都像科研团队中的“关键成员”,协同完成复杂任务:

1、Knowledge Flow Planner:规划研究路线,像科学家一样拆解问题、逐层细化制定任务;

2、Knowledge Collector:执行任务、收集信息,就像勤奋的实验助理一样整理数据;

3、Knowledge Flow Refiner:反思和优化整个研究流程,确保科研思路清晰、连贯、可持续。

当你提出研究问题时,FlowSearch先由Planner构建初步的知识流——每个节点代表一个子问题或关键概念,节点之间的连接描绘了知识依赖关系。

随后,多名“智能体”同时开始执行任务,Collector不断填充节点内容,而Refiner会根据中间结果动态调整流程——增删任务、优化依赖,让科研路径像有生命一样逐步演化。



动态结构化知识流:科研的逻辑网络

FlowSearch使用有向无环图把科研任务和知识关系可视化。每个节点都携带任务类型(检索、求解、回答)、描述和知识上下文,而节点间的边定义了信息流向。

这种设计让科研推理不再依赖线性顺序,而能同时展开多条探索路径,每一步都可追踪和验证。

换句话说,它不仅让 AI 能“想清楚每一步”,也让你能随时理解科研过程的脉络。

递归式知识流规划:逐层拆解科研问题

高质量的科研规划源于逐层细化的专家式思维。Planner模块采用递归扩展策略——从总问题出发,识别每一层需要细化的子任务,生成新的节点和依赖关系。

这一过程持续进行,直到形成完整的初始知识流。FlowSearch中的InternPlanner模型经过结构化科研任务数据微调,能够学习专家的拆解方式,让AI的规划既逻辑清晰,又稳健可靠。

知识采集与动态反思:让科研像“活”起来

Knowledge Collector执行任务、收集信息,并把结果整理成节点知识,为后续推理提供输入。

任务执行完成后,Knowledge Flow Refiner会启动反思机制:它能根据新信息调整节点和依赖关系,优化任务顺序,确保知识流持续进化。

这意味着FlowSearch不只是一个执行工具,它具备自组织、自纠错、自优化能力,可以在复杂科研任务中保持全局一致性,同时灵活应对局部变化。

以上设计让FlowSearch同时具备:

  • 层次化分解能力:仿佛每个科研问题都能被拆解到最合适的颗粒度;
  • 多路并行探索能力:智能体可以同时处理多个任务,提高效率;
  • 全局收敛能力:动态调整确保最终知识流完整、逻辑自洽。

无论是复杂跨学科研究,还是大规模数据分析,FlowSearch都能让科研不再只是“等待AI输出”,而是真正的与AI共同探索。

实验结果与分析

1、综合性能突破

FlowSearch在三大权威基准GAIA、GPQA-diamond、HLE上,全面超越现有方法。



在生物领域的专业基准TRQA上,FlowSearch依托通用工具链超越了多个领域专用模型,显示出强大的专业问题解决能力。



2、模块有效性验证

去除动态知识流建模或反思模块均导致显著性能下降,验证了结构化规划与动态调整机制在提升推理深度与系统稳定性方面的关键价值。



3、Internplanner模型训练效果

经过微调的Internplanner-32B相比基础模型Qwen-3-32B在GAIA上提升约6个百分点,表明结构化知识训练能够显著增强模型的规划能力与任务一致性。



4、案例分析

通过FlowSearch与OWL的对比案例可以看出,FlowSearch通过显式依赖建模与中间结果整合,有效避免了证据丢失与逻辑链断裂,展现出更高的推理透明度与可解释性。



同时,FlowSearch不仅能够高质量地完成科研问答任务,还能直接适配于科学调研与报告生成任务,产出完整、全面且逻辑清晰的科学调研成果。

应用前景与科研影响

团队表示,FlowSearch的提出标志着科研智能体从“任务执行”向“知识驱动推理”的关键转变。

  • 对于科研新人,它能够构建完整的知识探索路径,降低进入新领域的学习门槛;
  • 对跨学科研究者,它提供了知识流整合与多模态信息融合能力;
  • 对资深学者,它可作为智能研究助手,在假设生成、证据聚合和报告撰写阶段显著提升效率。

更重要的是,FlowSearch的动态结构化框架为未来可解释科研智能体自演化科学发现系统奠定了通用基础——使智能体具备类研究者的思考、探索与自我反思能力,推动人工智能从工具向真正的科研伙伴演进。

论文链接:https://arxiv.org/abs/2510.08521
GitHub仓库:https://github.com/Alpha-Innovator/InternAgent

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一张机票暴露一切:全美数据与ICE共享,女子在机场被直接遣返

一张机票暴露一切:全美数据与ICE共享,女子在机场被直接遣返

华人生活网
2026-03-26 02:26:21
河南街头用头撞车事件,警方回应后续来了!评论区彻底炸锅

河南街头用头撞车事件,警方回应后续来了!评论区彻底炸锅

奇思妙想草叶君
2026-03-25 13:12:39
吴国桢回忆宋氏姐妹:宋霭龄动下小指头,就能将宋美龄弄得团团转

吴国桢回忆宋氏姐妹:宋霭龄动下小指头,就能将宋美龄弄得团团转

浩渺青史
2026-03-26 19:37:41
顶级负心汉!成名后与救命恩人离婚娶小三,如今前妻红了他糊了

顶级负心汉!成名后与救命恩人离婚娶小三,如今前妻红了他糊了

蔡蔡说史
2026-03-25 17:33:04
血债血偿,中方支援巴基斯坦,重装合成营教俾路支解放军做人

血债血偿,中方支援巴基斯坦,重装合成营教俾路支解放军做人

狮拓一叶知秋
2025-04-18 22:06:20
俄教授给自己注射350万年前细菌,寻求长生,10多年后怎样了?

俄教授给自己注射350万年前细菌,寻求长生,10多年后怎样了?

火星一号
2026-03-23 00:49:24
五十岁才彻底明白_为何许多男性对五十开外的女性都保持距离

五十岁才彻底明白_为何许多男性对五十开外的女性都保持距离

车窗起雾q
2026-03-20 14:31:16
柯文哲案今天下午一审宣判,若判十年以上有期徒刑将失“大选”资格

柯文哲案今天下午一审宣判,若判十年以上有期徒刑将失“大选”资格

海峡导报社
2026-03-26 07:09:02
你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

带你感受人间冷暖
2025-11-26 00:10:06
大快人心!国家出手擒下3名华人首富,他们干的事,根本不能饶恕

大快人心!国家出手擒下3名华人首富,他们干的事,根本不能饶恕

墨印斋
2026-03-24 21:34:56
第81波打击!以军司令部遇袭,美迎来艰难一夜,特朗普向35国求助

第81波打击!以军司令部遇袭,美迎来艰难一夜,特朗普向35国求助

黑鹰观军事
2026-03-26 19:09:40
梅西让一些名人开始看球!他们一看球就知道梅西是GOAT!

梅西让一些名人开始看球!他们一看球就知道梅西是GOAT!

历史第一人梅西
2026-03-24 23:20:12
去年中乙金靴费尔南多加入苏超南京队,目前他效力于云南玉昆

去年中乙金靴费尔南多加入苏超南京队,目前他效力于云南玉昆

懂球帝
2026-03-26 17:50:02
2026中国大学综合实力排名200强:前十稳定,郑大冲进前20

2026中国大学综合实力排名200强:前十稳定,郑大冲进前20

马蹄烫嘴说美食
2026-03-26 13:46:58
共和党元老惊叹:特朗普只用一年,就让美国制度向恶霸统治投降

共和党元老惊叹:特朗普只用一年,就让美国制度向恶霸统治投降

阿器谈史
2026-01-18 21:24:07
越南5年免签新政策4.1开始实施

越南5年免签新政策4.1开始实施

创作者_cLg1
2026-03-26 09:42:32
A股:两个信息落地,明天,周五或会这样走了!

A股:两个信息落地,明天,周五或会这样走了!

明心
2026-03-26 16:35:30
人过五十才懂:和子女最好的相处,不是给钱出力,而是守住这条线

人过五十才懂:和子女最好的相处,不是给钱出力,而是守住这条线

荷兰豆爱健康
2026-03-23 01:42:20
张雪峰心源性猝死多严重,那个最快护士就有多“牛逼”(张雪峰的惯用词)

张雪峰心源性猝死多严重,那个最快护士就有多“牛逼”(张雪峰的惯用词)

天山箴言录
2026-03-26 16:45:50
女子因桃花眼走红,订婚两年热度依旧,网友喊话:88号快回来上班

女子因桃花眼走红,订婚两年热度依旧,网友喊话:88号快回来上班

梅子的小情绪
2025-12-19 14:04:18
2026-03-27 03:12:49
量子位 incentive-icons
量子位
追踪人工智能动态
12348文章数 176425关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
时尚
旅游
艺术
健康

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

400万人爱过的女孩,被黄谣网暴180天后

旅游要闻

河南开封万岁山武侠城,游客买300元门票:给妻子拍照被保安阻拦

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版