网易首页 > 网易号 > 正文 申请入驻

将科研脏活累活真·丢给AI!上海AI Lab推出科研智能体FlowSearch

0
分享至

将复杂科研过程自动化落地,上海人工智能实验室推出FlowSearch!

在GAIA、HLE、GPQA以及TRQA等科研基准上,FlowSearch不仅实现了性能全面领先,还展示了AI在复杂科研任务中的动态协作与深度推理能力。



展开来说,当AI在问答基准和标准化测试中表现卓越之时,其进行科学研究的能力也在被更多关注。

科学研究不同于解题或信息检索,它是一个开放性、长期且复杂的认知过程——研究者需要提出原创问题、设计实验方案、收集并整合多源证据,并在不断迭代中形成系统结论。

这样的过程远超计算能力本身,它要求的是创新思维、动态推理能力以及对复杂知识关系的精准掌控。

FlowSearch,正是一个由动态结构化知识流驱动的深度科研智能体

它通过动态结构化知识流构建科研任务的多层依赖图,并在多智能体框架下实现任务的并行探索、知识的递归整合和流程的自适应优化。

与传统“输入—计算—输出”的封闭式AI不同,FlowSearch更像一个理解你研究思路的伙伴——当发现新信息,它会主动调整计划;当证据链不完整,它会引导进一步探索;当推理偏离目标,它会进行自我修正。

研究团队表示,它标志着科研智能体从“被动工具”迈向主动探索伙伴的新阶段,让科学发现不再只是等待AI输出结果,而是与AI一起探索、不断前进。

FlowSearch:让AI成为你的科研探索伙伴

FlowSearch由三大核心模块组成,每个模块都像科研团队中的“关键成员”,协同完成复杂任务:

1、Knowledge Flow Planner:规划研究路线,像科学家一样拆解问题、逐层细化制定任务;

2、Knowledge Collector:执行任务、收集信息,就像勤奋的实验助理一样整理数据;

3、Knowledge Flow Refiner:反思和优化整个研究流程,确保科研思路清晰、连贯、可持续。

当你提出研究问题时,FlowSearch先由Planner构建初步的知识流——每个节点代表一个子问题或关键概念,节点之间的连接描绘了知识依赖关系。

随后,多名“智能体”同时开始执行任务,Collector不断填充节点内容,而Refiner会根据中间结果动态调整流程——增删任务、优化依赖,让科研路径像有生命一样逐步演化。



动态结构化知识流:科研的逻辑网络

FlowSearch使用有向无环图把科研任务和知识关系可视化。每个节点都携带任务类型(检索、求解、回答)、描述和知识上下文,而节点间的边定义了信息流向。

这种设计让科研推理不再依赖线性顺序,而能同时展开多条探索路径,每一步都可追踪和验证。

换句话说,它不仅让 AI 能“想清楚每一步”,也让你能随时理解科研过程的脉络。

递归式知识流规划:逐层拆解科研问题

高质量的科研规划源于逐层细化的专家式思维。Planner模块采用递归扩展策略——从总问题出发,识别每一层需要细化的子任务,生成新的节点和依赖关系。

这一过程持续进行,直到形成完整的初始知识流。FlowSearch中的InternPlanner模型经过结构化科研任务数据微调,能够学习专家的拆解方式,让AI的规划既逻辑清晰,又稳健可靠。

知识采集与动态反思:让科研像“活”起来

Knowledge Collector执行任务、收集信息,并把结果整理成节点知识,为后续推理提供输入。

任务执行完成后,Knowledge Flow Refiner会启动反思机制:它能根据新信息调整节点和依赖关系,优化任务顺序,确保知识流持续进化。

这意味着FlowSearch不只是一个执行工具,它具备自组织、自纠错、自优化能力,可以在复杂科研任务中保持全局一致性,同时灵活应对局部变化。

以上设计让FlowSearch同时具备:

  • 层次化分解能力:仿佛每个科研问题都能被拆解到最合适的颗粒度;
  • 多路并行探索能力:智能体可以同时处理多个任务,提高效率;
  • 全局收敛能力:动态调整确保最终知识流完整、逻辑自洽。

无论是复杂跨学科研究,还是大规模数据分析,FlowSearch都能让科研不再只是“等待AI输出”,而是真正的与AI共同探索。

实验结果与分析

1、综合性能突破

FlowSearch在三大权威基准GAIA、GPQA-diamond、HLE上,全面超越现有方法。



在生物领域的专业基准TRQA上,FlowSearch依托通用工具链超越了多个领域专用模型,显示出强大的专业问题解决能力。



2、模块有效性验证

去除动态知识流建模或反思模块均导致显著性能下降,验证了结构化规划与动态调整机制在提升推理深度与系统稳定性方面的关键价值。



3、Internplanner模型训练效果

经过微调的Internplanner-32B相比基础模型Qwen-3-32B在GAIA上提升约6个百分点,表明结构化知识训练能够显著增强模型的规划能力与任务一致性。



4、案例分析

通过FlowSearch与OWL的对比案例可以看出,FlowSearch通过显式依赖建模与中间结果整合,有效避免了证据丢失与逻辑链断裂,展现出更高的推理透明度与可解释性。



同时,FlowSearch不仅能够高质量地完成科研问答任务,还能直接适配于科学调研与报告生成任务,产出完整、全面且逻辑清晰的科学调研成果。

应用前景与科研影响

团队表示,FlowSearch的提出标志着科研智能体从“任务执行”向“知识驱动推理”的关键转变。

  • 对于科研新人,它能够构建完整的知识探索路径,降低进入新领域的学习门槛;
  • 对跨学科研究者,它提供了知识流整合与多模态信息融合能力;
  • 对资深学者,它可作为智能研究助手,在假设生成、证据聚合和报告撰写阶段显著提升效率。

更重要的是,FlowSearch的动态结构化框架为未来可解释科研智能体自演化科学发现系统奠定了通用基础——使智能体具备类研究者的思考、探索与自我反思能力,推动人工智能从工具向真正的科研伙伴演进。

论文链接:https://arxiv.org/abs/2510.08521
GitHub仓库:https://github.com/Alpha-Innovator/InternAgent

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我和邻居大哥做了5年临时夫妻,分开时他让我掀开床底,我愣住了

我和邻居大哥做了5年临时夫妻,分开时他让我掀开床底,我愣住了

芳华情感
2026-02-24 22:34:37
怪不得地主恶霸非要霸占白毛女,这是四川原型罗昌秀救出时四张照

怪不得地主恶霸非要霸占白毛女,这是四川原型罗昌秀救出时四张照

宋诉搞笑配音
2026-02-20 06:31:01
建国后周总理数次邀请张发奎回国,张发奎婉拒:我两头都不会去的

建国后周总理数次邀请张发奎回国,张发奎婉拒:我两头都不会去的

阿校谈史
2026-02-24 21:35:52
库里+克莱都不够!爱德华兹25岁前三分1272记,历史第一

库里+克莱都不够!爱德华兹25岁前三分1272记,历史第一

体育闲话说
2026-02-24 22:33:06
于德豪和张帆互换东家?交易窗口期未开,何谈交易落锤

于德豪和张帆互换东家?交易窗口期未开,何谈交易落锤

齐鲁壹点
2026-02-25 14:36:32
突传噩耗!知名演员因病去世,年仅57岁!很多人看过他的戏……

突传噩耗!知名演员因病去世,年仅57岁!很多人看过他的戏……

福建卫生报
2026-02-25 11:51:01
刘邦有啥突出才能,能成为皇帝?毛泽东:封建皇帝里最厉害的一个

刘邦有啥突出才能,能成为皇帝?毛泽东:封建皇帝里最厉害的一个

小莜读史
2026-02-18 17:12:13
我在国安局退休后,发现一家理发店,进出的人都留着一样头型

我在国安局退休后,发现一家理发店,进出的人都留着一样头型

千秋文化
2026-02-21 19:49:29
世界变成了两种颜色

世界变成了两种颜色

西楼饮月
2026-02-25 23:19:30
一家三代35人的“春节大巴”:14天自驾6000公里,家人间收获更多理解和关爱

一家三代35人的“春节大巴”:14天自驾6000公里,家人间收获更多理解和关爱

红星新闻
2026-02-24 20:56:32
一个家的上等风水,不是钱财,不是运气,而是这3点

一个家的上等风水,不是钱财,不是运气,而是这3点

金沛的国学笔记
2026-01-08 18:13:18
国防部直接把话挑明了,家里有满18岁男青年必须办的就是兵役登记

国防部直接把话挑明了,家里有满18岁男青年必须办的就是兵役登记

南权先生
2026-02-12 15:38:28
乌媒:俄乌冲突爆发4周年,泽连斯基首次展示冲突初期所使用地下掩体

乌媒:俄乌冲突爆发4周年,泽连斯基首次展示冲突初期所使用地下掩体

环球网资讯
2026-02-24 17:12:54
怪发型,唇穿孔,冬奥花滑华裔冠军叛逆征服了全世界!

怪发型,唇穿孔,冬奥花滑华裔冠军叛逆征服了全世界!

ChicMyGeek
2026-02-24 17:10:12
可打美航母!英媒:中国或违反联合国规定,运超高音速导弹去伊朗

可打美航母!英媒:中国或违反联合国规定,运超高音速导弹去伊朗

爱史纪
2026-02-26 01:21:53
我军俘虏了国民党中将却不认识,正要押走时,突然有人向他敬礼

我军俘虏了国民党中将却不认识,正要押走时,突然有人向他敬礼

南宗历史
2026-02-26 02:51:44
夫妻性生活:女人最讨厌的5种“床上行为”,男人千万别犯!

夫妻性生活:女人最讨厌的5种“床上行为”,男人千万别犯!

精彩分享快乐
2025-11-25 00:05:03
这菜隔天吃一次,一降血脂、二降血糖、三降胆固醇,中老年人多吃

这菜隔天吃一次,一降血脂、二降血糖、三降胆固醇,中老年人多吃

江江食研社
2026-02-01 16:30:06
瞬间破防!箖箖玥儿抱弟弟画面曝光,网友泪目:最治愈的手足情

瞬间破防!箖箖玥儿抱弟弟画面曝光,网友泪目:最治愈的手足情

一口娱乐
2026-02-25 19:29:13
唐嫣彭冠英官宣后,恶心的一幕出现了,婚变传闻终于真相大白

唐嫣彭冠英官宣后,恶心的一幕出现了,婚变传闻终于真相大白

艳姐的搞笑视频
2026-01-16 13:24:42
2026-02-26 05:27:00
量子位 incentive-icons
量子位
追踪人工智能动态
12201文章数 176392关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

夫妻晚5秒错过免费高速付1700元:气得我不得了

头条要闻

夫妻晚5秒错过免费高速付1700元:气得我不得了

体育要闻

勇士爆冷惜败鹈鹕 梅尔顿28分赛季新高

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

上海楼市放大招,地产预期别太大

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

手机
教育
旅游
游戏
家居

手机要闻

超大核飙到4.74GHz!三星Galaxy S26系列首发第五代骁龙8至尊版for Galaxy

教育要闻

2026马年的中国境外留学市场会提速吗?

旅游要闻

重庆酉阳樱花漫古城,吊脚飞檐藏春归,这才是中式浪漫天花板!

《如龙极3》中文配音访谈:中文配音与本地化并非易事

家居要闻

艺居办公 温度与效率

无障碍浏览 进入关怀版