网易首页 > 网易号 > 正文 申请入驻

Marinka Zitnik团队发布大规模工具开源框架—ToolUniverse,推动科学AI智能体进入全新时代

0
分享至



科学史的每一次飞跃,往往伴随着工具的革新。随着近期大模型和智能体的飞速发展,这条路径正在通向一种全新的阶段:“AI 科学家”。 在AI赋能科研的前沿,我们正见证一个重要的里程碑:从证明AI智能体“能否”解决特定科学问题,转向思考如何让它“高效、可靠、规模化”地参与整个研究过程。

近日,由哈佛大学Marinka Zitnik团队(第一作者为高尚华)在arXiv上发表了文章Democratizing AI scientists using ToolUniverse发布了首款大规模工具开源框架—ToolUniverse, 正是为构建这类 “AI 科学家” 而生,推动AI智能体的发展跨入全新时代。



图:ToolUniverse 网站 https://aiscientist.tools/

1. 科学工具的进化:当 AI 从 “生成” 走向 “推理”

传统 LLM(大语言模型)的核心能力是 “文本生成”,但科学研究需要的远不止于此:它需要分解复杂问题(如 “如何优化降胆固醇药物”)、规划实验步骤、调用专业工具(如分子模拟软件)、验证数据合理性,甚至在结果偏离预期时自我修正。这种 “推理 + 行动” 的闭环,正是 AI 从 “模型” 升级为 “科学家” 的关键。

AI 智能体的突破在于将 LLM 与三大机制深度耦合:

1.规划能力:将“发现新药物” 拆解为 “靶点识别→化合物筛选→性质优化→专利验证” 等可执行步骤;

2.记忆系统:追踪中间结果(如“某化合物对肝组织的渗透率”),避免重复计算或逻辑断裂;

3.工具调用:连接外部数据库、模拟器、分析软件,弥补 LLM 自身在专业计算(如分子结合能预测)上的短板。

但科学研究的特殊性给 AI智能体 其提出了更高要求:不同学科(生物、化学、物理)的工具格式不统一、数据需可复现、实验流程需严谨验证。若仅依赖通用的工具调用协议(如 MCP,模型上下文协议),无法解决 “如何让 AI 理解质谱数据格式”“如何协调分子模拟与临床数据库的输出” 等专业问题。而这,正是ToolUniverse 解决的核心问题之一。

2. ToolUniverse:科学 AI Agent 的生态基石

ToolUniverse 并非单一工具,而是一套 “连接 LLM 与科学工具” 的标准化生态(图 1)。它的核心目标是:让任何 LLM 都能通过统一接口,调用 600 + 科学工具,完成从 “提出假设” 到 “验证结论” 的全流程研究。


图1:ToolUniverse 是一个用于打造 AI 科学家的生态系统。通用型大语言模型(LLM)、推理模型与智能体可连接 ToolUniverse 提供的 600 余种科学工具,实现科研工作流自动化。

3. 突破通用协议局限:科学专属的 “HTTP”

就像 HTTP 协议统一了互联网通信,ToolUniverse 为 AI 科学家定义了专属的 “科学工具交互标准”(图 2),既能够无缝集成本地部署的开源工具,也能安全、规范地连接强大的闭源模型与API服务,解决了 MCP 协议在科研场景中的三大痛点:


图2: ToolUniverse 通过统一协议连接机器学习模型、智能体、科学软件工具、数据库与 API。它引入了标准化的工具规范框架,使语言模型能够一致地发现、调用并解析各类工具。类似于 HTTP 在互联网通信中确立标准的方式,ToolUniverse 协议通过两项核心操作:Find Tool(查找工具) 与 Call Tool(调用工具), 定义了 AI 科学家如何请求工具并接收结果。

1.工具发现难:通过“Tool Finder” 组件,AI 可结合关键词搜索、向量嵌入检索、LLM 推理,从 600 + 工具中精准匹配需求(如 “需要预测化合物肝毒性” 时,自动定位 ADMET-AI 工具);

2.调用不规范:“Tool Caller” 组件会先验证输入(如分子结构格式是否符合 SMILES 标准),再执行工具,最后将输出转化为结构化数据(如 “结合能 - 8.2 kcal/mol” 而非杂乱文本);

3.推理难闭环:新增“推理控制层”,让 AI 能理解工具输出的科学意义(如 “该化合物脑渗透率高→可能引发中枢副作用”),而非仅机械调用。

这种标准化设计,让 AI 从 “会用工具” 升级为 “会用科学工具解决问题”。

4. 四大核心组件:支撑 AI 科学家的完整生命周期

ToolUniverse 通过四大组件(图 3),覆盖了 AI 科学家从 “工具获取” 到 “ workflow 优化” 的全流程需求,真正实现 “可编程的科学协作”:

1)Tool Manager:工具的 “注册与管理中心”

它解决了“如何将新工具接入生态” 的问题:

1.本地工具(如实验室自研的数据分析脚本)只需提交“功能描述 + 参数格式 + 输出示例”,即可被自动纳入统一 schema;

2.远程工具(如云端分子模拟平台)通过 MCP 协议接入,无需暴露内部代码,兼顾安全性与兼容性;

3.自动验证工具有效性(如“输入错误分子结构时是否返回提示”),确保 AI 调用时的可靠性。

2)Tool Composer:科学 workflow 的 “搭建者”

科学研究很少依赖单一工具,比如“药物筛选” 需要串联 “靶点数据库→化合物库→分子对接工具→毒性预测工具”。Tool Composer 的作用就是:

1.定义工具间的数据流(如“分子对接工具的输出结构,直接作为毒性预测工具的输入”);

2.支持条件逻辑(如“若毒性预测超标,则返回上一步重新筛选化合物”);

3.生成可复现的 workflow 脚本,方便人类科学家追溯或修改。

3)Tool Discover:工具的 “自动生成器”

当现有工具无法满足需求(如“需要一种新的基因表达数据可视化工具”),AI 可通过自然语言描述需求,Tool Discover 会:

1.将文本描述转化为结构化工具规格(如“输入:CSV 格式表达矩阵;输出:热图 + 火山图”);

2.自动生成代码、测试用例,通过“预期行为 vs 实际输出” 的反馈循环迭代优化;

3.无需人工编码,让工具库随科研需求动态扩展。

4)Tool Optimizer:工具的 “质量守护者”

科学研究强调可复现性,Tool Optimizer 通过三大动作保障工具稳定性:

1.定期生成测试用例(如“用已知活性的化合物验证分子对接工具的准确性”);

2.分析工具输出与规格的偏差(如“某工具预测的结合能与实验值误差突然增大”);

3.自动更新工具文档或参数设置,确保 AI 调用时的一致性。


图3: ToolUniverse 提供了六项关键能力,支持 AI 科学家完整的生命周期:查找工具、调用工具、添加新工具、将工具串联为工作流、从自然语言生成新工具,以及优化工具规范以提升可用性
5.跨模型兼容:让每类LLM都能成为科学助手

不同科研场景对 LLM 的需求差异极大:实验室本地分析可能需要轻量开源模型(如 Llama 3),而复杂 hypothesis 推理可能依赖云端大模型(如 Claude 3),生物医药研究还需专业模型(如 TxAgent)。

ToolUniverse 的兼容性设计打破了 “模型绑定” 局限(图 4):它将工具调用转化为 “标准化函数调用”,无需修改 LLM 的权重或 Tokenizer—— 只需通过轻量级包装器,向模型传递 “工具列表 + 参数格式”,模型输出即可被解析为工具调用指令。

这种设计的价值在于:

科研团队可根据成本、隐私需求选择模型,无需担心“换模型就要重写工具调用逻辑”;

能在相同实验条件下对比不同模型的性能(如“用 Gemini-CLI vs Claude 3 做药物筛选,哪个准确率更高”);

支持专业模型与通用工具的结合(如“让 TxAgent 调用 ChEMBL 数据库,分析药物 - 靶点相互作用”)。


图4: ToolUniverse 为构建不同类型的 AI 科学家提供了简洁而高效的协议:既可用于基于通用大语言模型(如左图的Claude),也可用于具备更强推理与控制能力的智能体系统(如右图的Gemini-CLI),以及专注于生物医学研究的 AI 智能体(如TxAgent)。

6.案例实证:AI科学家如何优化降胆固醇药物

理论架构需要实践验证。我们以“寻找更安全的降胆固醇药物” 为例,看看 ToolUniverse 构建的 AI 科学家(基于 Gemini-CLI agent)如何完成全流程研究(图 5)。

步骤1:靶点识别——锁定关键蛋白

AI 首先调用 “文献挖掘工具” 和 “药物 - 靶点数据库”,通过分析 thousands of 研究论文与临床数据,得出结论:HMG-CoA 还原酶是胆固醇合成的关键酶,且该酶在肝脏外的过度抑制会引发肌肉疼痛等副作用。这一步完全复刻了人类科学家的 “靶点发现” 逻辑,但效率提升 10 倍以上。

步骤2:起始化合物筛选——从现有药物入手

AI 通过 ToolUniverse 查询 “已上市降胆固醇药物库”,筛选出以 HMG-CoA 还原酶为靶点的药物,最终选择 “洛伐他汀(lovastatin)” 作为起始化合物 —— 理由是 “临床验证充分,但肝外组织渗透率高,存在副作用风险”。

步骤3:化合物优化——提升安全性与有效性

AI 调用三大工具协作:

ChEMBL 数据库:获取洛伐他汀的 100 + 结构类似物;

Boltz-2 工具:预测每个类似物与 HMG-CoA 还原酶的结合能(数值越低,结合越强);

ADMET-AI 工具:预测类似物的肝渗透率、脑渗透率、代谢稳定性。

通过综合排序,AI 筛选出两个候选:

普伐他汀(pravastatin):已知药物,肝外渗透率低,副作用更少(验证了 AI 的可靠性);

CHEMBL2347006/CHEMBL3970138:新化合物,结合能比洛伐他汀高 30%,脑渗透率降低 50%,生物利用度提升 25%。

步骤4:专利与验证——规避法律风险

最后,AI 调用 “专利检索工具”,发现新化合物已被注册用于心血管疾病治疗,虽无法直接开发,但为后续结构修饰提供了方向。

整个过程中,AI 不仅完成了 “调用工具” 的动作,更体现了科学推理能力:它能解释 “为何选择该靶点”“为何淘汰某化合物”,甚至能根据副作用风险调整优化方向 —— 这正是 “AI 科学家” 与普通工具调用的本质区别。


图5:展示了一个基于 ToolUniverse 构建并应用于药物发现的 AI 科学家实例。该系统与Gemini-CLI智能体相连,能够识别生物学靶点、筛选并优化候选药物、评估分子性质,并利用计算工具验证结果。整个工作流程展示了 AI 科学家如何在药物研发的各个阶段进行推理、整合多源证据,并在必要时融入人类反馈。

7.从用到建:当使用者同时也成为共创者

一个健康的生态系统,其生命力不仅来源于使用,更来源于创造与贡献。

ToolUniverse内置了Tool Discover和Tool Optimizer等核心组件。前者允许用户通过自然语言描述,自动化生成新工具的规范与代码框架;后者能通过多轮测试与反馈,持续优化现有工具的说明与易用性。这一机制巧妙地将用户从纯粹的“消费者”转变为潜在的“共建者”,激励社区智慧反哺生态,形成一个自我完善、持续生长的良性循环。


ToolUniverse 的终极愿景,是赋能各个科学领域的专家,而不仅仅是 AI 专家。当生物学家、化学家、药物研发人员能够基于一个稳定、丰富的工具生态,轻松定制符合其独特研究需求的 “AI 科研伙伴 ” 时,或许将迎来一个真正 AI 辅助科研的全新时代。 AI 科学家不仅能调用数据库、模拟器,还能通过标准化协议控制实验室自动化设备(如液体处理机器人、质谱仪),实现 “ 提出假设 → 设计实验 → 自动执行 → 分析结果 ” 的全流程闭环。

若你想参与这场 “AI + 科学 ” 的变革,可通过以下渠道深入了解 ToolUniverse :

具 项目主页: https://aiscientist.tools

项目主页https://aiscientist.tools

论文详解:https://arxiv.org/abs/2509.23426

代码开源:https://github.com/mims-harvard/ToolUniverse

当 AI 能真正理解科学问题、自主协调工具、与人类共同推进认知边界时,我们或许正站在 “科学发现新范式” 的起点。

https://arxiv.org/abs/2509.23426

学术合作组织

(*排名不分先后)



战略合作伙伴

(*排名不分先后)

转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。

BioArt

Med

Plants

人才招聘

近期直播推荐


点击主页推荐活动

关注更多最新活动!


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖南女子远嫁广东后晒月子餐,75岁奶奶眼泪流下来:吃不惯就回来

湖南女子远嫁广东后晒月子餐,75岁奶奶眼泪流下来:吃不惯就回来

糖逗在娱乐
2025-11-01 15:51:21
58岁魏骏杰接女儿放学,15岁女儿近180 和爸爸很像,家中温馨时尚

58岁魏骏杰接女儿放学,15岁女儿近180 和爸爸很像,家中温馨时尚

乐悠悠娱乐
2025-11-01 15:22:16
美媒:若中国不偿还百年的债务,美国也将不承认欠中国8600亿美元

美媒:若中国不偿还百年的债务,美国也将不承认欠中国8600亿美元

近史博览
2025-11-01 23:12:41
大动作:英伟达将在韩国部署26万枚GPU!为什么黄仁勋押注韩国?

大动作:英伟达将在韩国部署26万枚GPU!为什么黄仁勋押注韩国?

王爷说图表
2025-10-31 17:02:15
消息称:中国将部分解除安世半导体出口禁令!

消息称:中国将部分解除安世半导体出口禁令!

EETOP半导体社区
2025-11-02 00:09:04
最新研究发现:宇宙不可能是,也永远不可能是计算机模拟!

最新研究发现:宇宙不可能是,也永远不可能是计算机模拟!

徐德文科学频道
2025-11-01 15:06:36
不是胰脏癌!坣娜真正死因曝光..老公心碎发声:在床边抱着她离世

不是胰脏癌!坣娜真正死因曝光..老公心碎发声:在床边抱着她离世

ETtoday星光云
2025-10-31 11:22:10
72岁老人中毒身亡!医生提醒:吃完降压药千万别碰它,中老年要看

72岁老人中毒身亡!医生提醒:吃完降压药千万别碰它,中老年要看

39健康网
2025-10-28 19:30:54
湖南一对夫妇冷战20年从不亲热,谁料,妻子突然去世,丈夫整理遗物才知真相...

湖南一对夫妇冷战20年从不亲热,谁料,妻子突然去世,丈夫整理遗物才知真相...

二胡的岁月如歌
2025-10-27 18:29:26
法布雷加斯:没人能像我们这样压迫那不勒斯,我们本应该取胜

法布雷加斯:没人能像我们这样压迫那不勒斯,我们本应该取胜

懂球帝
2025-11-02 03:56:09
南京35岁女子在家啃老13年,父母退休后直接离家,4个月后女儿傻眼

南京35岁女子在家啃老13年,父母退休后直接离家,4个月后女儿傻眼

如烟若梦
2025-10-30 16:16:31
北大终身教授季羡林,一针见血:人老了,不在于运动,不在于喝水

北大终身教授季羡林,一针见血:人老了,不在于运动,不在于喝水

忠于法纪
2025-10-27 08:53:35
国乒接近全军覆没!七人参赛已输六场外战:陈熠2-4不敌韩国名将

国乒接近全军覆没!七人参赛已输六场外战:陈熠2-4不敌韩国名将

越岭寻踪
2025-11-02 02:49:13
没葬入八宝山的七位大人物,个个都是伟大领袖!最后被安置何处?

没葬入八宝山的七位大人物,个个都是伟大领袖!最后被安置何处?

青梅侃史啊
2025-10-30 20:02:45
WTT冠军赛:王艺迪3-0!1-6落后11-9逆转,横扫张本美和进4强?

WTT冠军赛:王艺迪3-0!1-6落后11-9逆转,横扫张本美和进4强?

刘姚尧的文字城堡
2025-11-02 04:22:57
开拓者2分爆冷取胜,全队围在一起庆祝,谁注意杨瀚森的举动

开拓者2分爆冷取胜,全队围在一起庆祝,谁注意杨瀚森的举动

体坛小李
2025-11-01 14:15:53
历史上的施琅、清军攻台

历史上的施琅、清军攻台

名人苟或
2025-10-30 06:31:08
广州一小男孩骑单车时不慎刮蹭到路边的迈巴赫!车主:你去帮我买水吧…

广州一小男孩骑单车时不慎刮蹭到路边的迈巴赫!车主:你去帮我买水吧…

广东活动
2025-11-01 12:11:38
泉州市千亿山庄一栋豪宅别墅拍卖,被人低价捡漏1200万竞得

泉州市千亿山庄一栋豪宅别墅拍卖,被人低价捡漏1200万竞得

天天话事
2025-11-01 20:13:03
周末男子带小三去游玩,父亲安慰儿媳:我收拾他,男子回来后傻眼了

周末男子带小三去游玩,父亲安慰儿媳:我收拾他,男子回来后傻眼了

温情邮局
2025-09-08 14:23:26
2025-11-02 05:08:49
BioArt incentive-icons
BioArt
探索生物艺术之奥秘
8297文章数 18467关注度
往期回顾 全部

科技要闻

事关安世半导体,商务部最新发声!

头条要闻

美国防长国务卿受威胁 躲进军事基地

头条要闻

美国防长国务卿受威胁 躲进军事基地

体育要闻

NBA球员,必须吃夜宵

娱乐要闻

王家卫这波录音,撕烂了遮羞布

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

换新一口价11.98万 第三代蓝电E5 PLUS开启预售

态度原创

数码
家居
旅游
健康
公开课

数码要闻

预热 2026 FIFA 足球世界杯,闪迪推出多款授权设计存储产品

家居要闻

吸睛艺术 富有传奇色彩

旅游要闻

运河明珠,千年守望:杭州拱宸桥的前世今生与文化密码!

核磁VS肌骨超声,谁更胜一筹?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版