网易首页 > 网易号 > 正文 申请入驻

耶鲁等团队联合发布首个虚拟细胞Agent,可自动设计出先进的模型

0
分享至

首个能够从零开始自动化设计和生成虚拟细胞模型的多智能体系统来了!

近日,美国耶鲁大学马克·格斯坦(Mark Gerstein)教授、斯米塔·克里希纳斯瓦米(Smita Krishnaswamy)教授、唐相儒,宾夕法尼亚大学黄治教授、崔岩,斯坦福大学吴方,哈佛大学林希虹教授,以及德国慕尼黑亥姆霍兹中心法比安·泰斯(Fabian Theis)教授、汪伟旭等组成的联合团队,在预印本平台arXiv上传了题为《CellForge:虚拟细胞模型的智能体化设计》(CellForge: Agentic Design of Virtual Cell Models)[1] 的研究论文。


图丨相关论文(来源:arXiv)

该多智能体系统不仅可用于虚拟细胞建模,还可以被广泛地用于 AI for Science 的各类模型设计。这项成果在 AI for Science 的方法论上迈出了关键一步,也为单细胞组学、药物研发和合成生物学提供了一条新的自动化科研路径。


图丨马克·格斯坦(Mark Gerstein)教授(来源:资料图)

CellForge 可直接输出用于虚拟细胞建模等 AI for Science 任务的网络模型架构。具体而言,研究人员只需输入原始单细胞多组学数据及任务描述(如指定对照与扰动条件,或提出构建新扰动模型的指令),CellForge 便能自动生成优化后的模型,并输出包含训练与预测的可执行代码。

与传统人工设计模型的方法不同,CellForge 的独特之处在于其“多智能体架构”。CellForge 由多个专家型 Agent 共同协作,每个 Agent 扮演不同角色,例如数据专家、模型设计师、生物学家和模型训练专家。它们通过多轮辩论批判性讨论,逐步收敛到最优的设计方案。

这一过程高度模拟了现实科研中的跨学科团队合作:研究人员往往需要通过查阅文献、交流实验思路、比较优缺点,最终凝聚出一个合理的研究计划。CellForge 将这一过程转化为内部的 Agent 协作,从而实现了完全自动化的模型构建流程。

在定量实验中,CellForge 生成的模型在多个数据集和场景下显著超越了此前发表在Nature Methods、Nature Biotechnology等期刊的先进单细胞扰动预测模型。

这一流程不仅降低了复杂生物建模的操作门槛,同时也确保了计算模型的科学严谨性,为单细胞组学分析及合成生物学研究提供了一种高效、精准的解决方案。

人体由具有不同功能、不同类型的细胞构成,而细胞的核心特性由其基因表达模式决定。例如,免疫细胞可以对抗炎症或感染,干细胞能够分化成组织,而癌细胞则通过调控基因表达逃逸细胞分裂的控制。细胞的基因表达由 RNA 分子介导,后者是 DNA 转录的直接产物。基因表达不仅决定了细胞的类型,还动态反映了细胞的状态变化。

虚拟细胞建模是当前生物学与人工智能交叉领域的前沿方向,旨在预测细胞对各种扰动(基因编辑、药物处理、细胞因子刺激等)的定量响应。通过研究细胞基因表达的变化,可以揭示细胞如何从健康状态转变为炎症状态甚至癌变状态。然而,构建此类模型面临多重技术挑战。

该研究中,一个重要的突破在于 CellForge 的跨模态能力。单细胞组学数据包括 RNA 测序(scRNA-seq)、染色质可及性数据(scATAC-seq)、蛋白质标记数据(CITE-seq)等多种模态。以往的研究通常针对特定模态开发模型,很难推广到新的数据类型。而 CellForge 通过其任务分析模块自动识别模态特征,并在方法设计阶段生成合适的网络架构,从而展现出跨模态的泛化能力。

在验证测试中,它不仅在 RNA-seq 任务上超过了scGPT、Geneformer、ChemCPA 等领域代表性模型,还在 ATAC-seq 和 CITE-seq 任务上实现了突破性提升。这种能力对于推动新型实验模态的研究至关重要,因为生物学数据的异质性极高,而 CellForge 的灵活性意味着它能够快速适配不同的研究场景。

研究团队的目标是开发一种基于强大的自进化的多智能体框架的方法,让模型能够根据当前细胞状态和任务,预测之前未遇到过的干扰,并自主设计出之前不存在的且最适合的模型架构。


(来源:arXiv)

CellForge 的工作流程分为三个核心环节:

·首先是任务分析。系统在接收到原始单细胞多组学数据以及研究者提出的自然语言任务描述后,会自动对数据进行表征分析,并检索相关文献,以理解该任务在科学背景中的位置。这一步类似于科研人员做综述和查找先前工作,为后续设计提供知识支撑。

·第二步是方法设计。在这一阶段,多个智能体会像专家团队一样提出各自的建模思路,包括可能的神经网络架构、训练方法和优化方案。随后,它们通过多轮批判性对话不断迭代,直到达成一致意见,生成最优的研究计划。

·最后是实验执行。系统会将最终设计转化为可运行的代码,自动完成数据预处理、模型训练、验证和推理,并输出最终结果。这意味着研究人员只需输入数据和研究目标,CellForge 便能从头到尾产出完整的科研工作流。


图丨 CellForge 架构与工作流程(来源:arXiv)

与以往的 AI 系统相比,CellForge 系统不仅能够提出假设或研究方案,还能让每个智能体根据文献搜索结果提出想法。这些智能体会互相审视对方的方案,并进行多轮(可能多达 10 轮)的批判性讨论,直至方案收敛到最优解。

更值得一提的是,CellForge 具备自动生成可执行代码的能力。这一点在现有 AI for Science 框架中尚不多见。大多数系统往往停留在提出研究思路或提供部分分析,而 CellForge 可以将讨论结果直接转化为高质量的 Python 代码,涵盖数据预处理、模型训练、超参数优化和结果可视化等完整流程。

这意味着研究人员无需再手动编写复杂的代码,而是可以让 CellForge 直接自己运行生成的程序,迅速获得实验结果。研究团队指出,这种“端到端”的自动化能力显著降低了科研门槛,让没有深厚计算背景的生物学研究者也能够使用先进的建模方法。


图丨 CellForge 三个模块的示例输出(来源:arXiv)

为验证 AI 自主设计的网络架构是否能够超越人类的设计,研究团队选择了六个数据集,涵盖基因敲除、药物处理和细胞因子刺激等多种扰动类型,涉及多种模态。研究团队在每个数据集上都进行了三次实验。

在 CellForge 系统中,输入是一个数据集和一个研究问题,系统会根据这个数据集和研究问题输出针对性的模型。虽然任务可能相似,但由于数据集不同,系统会为每个数据集设计一个量身定制的方案。

在系统的内部机制上,CellForge 的关键创新是多智能体的协作优化。每个智能体基于文献检索和数据分析提出方案,其他智能体会对这些方案进行批判和质疑。这个过程可能会反复进行上千轮,直到各方收敛到最优解。

研究人员还为其设计了类似深度优先和广度优先的搜索机制,使智能体在提出方案之前能先进行充分的知识探索,从而提高设计的合理性。这种“批判性共识”机制不仅提升了模型性能,也让生成的方案更具可解释性,避免了单一大模型容易出现的幻觉和偏差问题。


图丨 CellForge 的多 Agent 讨论过程(来源:arXiv)

在性能评估中,CellForge 不仅在单细胞建模任务中显著超越了 scGPT、Geneformer、ChemCPA 等领域代表性方法,还与近期提出的通用科研自动化框架 Biomni 和 DeepResearch 进行了对比。

结果显示,CellForge 在任务特异性和模型生成能力上更具优势,能够输出更高质量、更可执行的研究方案,尤其在人类专家打分和跨模态预测中领先明显。这一差异凸显了 CellForge 针对虚拟细胞建模的深度优化,相较通用框架更贴合生物学实际应用需求。


图丨CellForge 生成结果的专家评估对比(来源:arXiv)

使用过 CellForge 的研究人员对 DeepTech 表示,可基于该系统实现高效的科学突破,无论输入什么样的数据集、任务或研究问题,都能基于此设计出比人类设计的神经网络架构更好的模型,助力科学发现进入规模化时代。

这一突破意味着,AI 可大幅缩短科学发现的周期。过去,设计模型需要花费多达五六年的时间,但现在,AI 系统可以基于之前的工作基础,快速进行科学发现和模型设计。

从应用角度来看,CellForge 的潜力远不止于学术研究。虚拟细胞建模本身是一个关键的前沿方向,其核心目标是预测细胞在基因编辑、药物处理或环境刺激下的响应。传统药物研发流程往往依赖动物实验和临床试验,成本极高且失败率居高不下。CellForge 通过虚拟建模,可以在计算机中提前预测细胞对药物的反应,从而筛选出最有前景的候选药物,减少不必要的试错过程。这种能力有望显著缩短药物研发周期,降低临床试验的失败风险。因此,CellForge 在癌症研究、免疫治疗和干细胞分化等领域都可能成为重要的工具。

研究团队还强调,这一系统不仅仅是科研辅助工具,更是迈向“AI 科学家”的一步。与解决标准化测试题目或优化固定模型不同,CellForge 能够根据数据和任务自主构思全新的网络架构。这种从零设计的能力意味着 AI 不再只是人类的助手,而是具备了独立进行科学探索的潜质。

未来,团队计划将 CellForge 与自动化实验平台结合,使其能够直接控制实验设备,完成从模型设计到实际实验的闭环验证。这一方向一旦实现,将进一步加速科学研究的工业化和规模化进程。

马克·格斯坦教授和唐相儒博士此前的工作为本次开发 CellForge 系统提供了底层技术支持。例如通过开发Medagents系统 [2],首次将 AI 多智能体应用于疾病诊断。此外,他们之前还有一项关于ChemAgent的研究 [3],探讨了如何利用可自主进化的智能体系统更好地回答量子力学或量子化学等领域的专家级别的复杂化学推理问题。

从长远来看,CellForge 的出现可能改变科研范式。过去,科学发现往往依赖于专家的创造性思维和长期积累,一个新的建模方法可能需要五六年的时间才能从概念走到应用。而 CellForge 这样的系统可以在几天甚至几小时内完成从文献调研到模型设计、代码生成和实验验证的全过程。这意味着科学发现可能进入一种“可扩展”的新模式,即通过算力和智能体协作实现科研的加速与量产。这不仅会提高研究效率,也可能带来前所未有的科学突破。

目前,CellForge 的论文和代码均已公开(https://github.com/gersteinlab/CellForge),研究团队希望全球科研人员能够使用和改进这一系统,共同推动 AI for Science 的发展。正如论文所言,CellForge 的目标不是取代科学家,而是为他们提供一个强大的智能协作平台,让人类与 AI 共同探索未知的生命奥秘。

参考资料:

1.https://arxiv.org/abs/2508.02276

2.https://arxiv.org/abs/2311.10537

3.https://openreview.net/forum?id=kuhIqeVg0e

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
6天赔光90万?蜜雪冰城也不挣钱?中年人的“老板梦”竟是骗局

6天赔光90万?蜜雪冰城也不挣钱?中年人的“老板梦”竟是骗局

现代小青青慕慕
2026-01-12 16:42:00
人口4连降,结婚人数却意外反弹了!

人口4连降,结婚人数却意外反弹了!

言叔财经视角
2026-01-19 12:12:31
国产第一、全球第四,巨亏400亿

国产第一、全球第四,巨亏400亿

中国新闻周刊
2026-01-19 12:18:23
国乒退队潮来袭!6男2女悄悄告别,主力伤病逼出最残酷新老交替

国乒退队潮来袭!6男2女悄悄告别,主力伤病逼出最残酷新老交替

老特有话说
2026-01-18 22:49:06
梁小龙遗言曝光,让人泪目!遭封杀20年,承认出轨,跟星爷反目

梁小龙遗言曝光,让人泪目!遭封杀20年,承认出轨,跟星爷反目

鋭娱之乐
2026-01-18 22:10:30
打脸了?2015年专家预测:一旦开放二胎,中国新生人口将会激增

打脸了?2015年专家预测:一旦开放二胎,中国新生人口将会激增

知鉴明史
2025-10-04 18:55:52
天崩地裂!13000公里时速,导弹爆炸温度数千度:普京真掀桌子了

天崩地裂!13000公里时速,导弹爆炸温度数千度:普京真掀桌子了

古事寻踪记
2026-01-15 07:07:07
药师提醒:银杏叶片、血塞通、复方丹参片,心脑血管用药别再选错

药师提醒:银杏叶片、血塞通、复方丹参片,心脑血管用药别再选错

蜉蝣说
2026-01-17 18:36:03
项立刚视角看西贝罗永浩事件: 不要以为我们都比贾国龙聪明!

项立刚视角看西贝罗永浩事件: 不要以为我们都比贾国龙聪明!

玖宇维
2026-01-17 11:52:32
参加遵义会议的三个军团政委,为何只有一人在建国后未获重用?

参加遵义会议的三个军团政委,为何只有一人在建国后未获重用?

抽象派大师
2025-12-01 11:55:18
梁小龙本可以安享晚年!生前脸色蜡黄 仍大口喝白酒,离世早有征兆

梁小龙本可以安享晚年!生前脸色蜡黄 仍大口喝白酒,离世早有征兆

东方不败然多多
2026-01-19 11:40:19
江苏朱氏家族:一门出12博士,却都为美国效力,最高官居能源部长

江苏朱氏家族:一门出12博士,却都为美国效力,最高官居能源部长

梦史
2025-12-25 16:04:43
据说:市面上90%的烤鸭都是用这种做的?你还吃吗?

据说:市面上90%的烤鸭都是用这种做的?你还吃吗?

今朝牛马
2026-01-08 18:32:41
U23国足进4强仅一夜,收到1坏消息!越南媒体:我们2大优势进决赛

U23国足进4强仅一夜,收到1坏消息!越南媒体:我们2大优势进决赛

侃球熊弟
2026-01-18 11:54:48
肠子悔青!基恩 3 年前力荐曼联签两人 如今身价 1.6 亿镑

肠子悔青!基恩 3 年前力荐曼联签两人 如今身价 1.6 亿镑

澜归序
2026-01-19 04:01:29
梁小龙好友曝细节,去世原因曝光,走的时候家人在身旁,没受折磨

梁小龙好友曝细节,去世原因曝光,走的时候家人在身旁,没受折磨

鋭娱之乐
2026-01-19 08:48:48
梁小龙究竟有多能打?王晶、成龙评价极高,洪金宝直言他是独一人

梁小龙究竟有多能打?王晶、成龙评价极高,洪金宝直言他是独一人

老媹古装影视解说
2026-01-19 13:03:52
优势仅剩1分!巴萨将帅集体炮轰裁判:又是他 2年2次误判

优势仅剩1分!巴萨将帅集体炮轰裁判:又是他 2年2次误判

叶青足球世界
2026-01-19 09:31:03
英国议员呼吁禁止美国参加冬奥会!国际奥委会:我们的使命是团结

英国议员呼吁禁止美国参加冬奥会!国际奥委会:我们的使命是团结

全景体育V
2026-01-19 08:12:45
67户人家狂赚30亿!又一个华西村杀疯了,家家住别墅人人是股东

67户人家狂赚30亿!又一个华西村杀疯了,家家住别墅人人是股东

小莜读史
2026-01-13 22:09:47
2026-01-19 14:16:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16146文章数 450817关注度
往期回顾 全部

科技要闻

这一仗必须赢!马斯克死磕芯片"9个月一更"

头条要闻

罗永浩被禁言后首亮相 现身B站颁奖典礼获年度新人奖

头条要闻

罗永浩被禁言后首亮相 现身B站颁奖典礼获年度新人奖

体育要闻

21年后,中国男足重返亚洲四强

娱乐要闻

离婚三年,孙怡董子健首次公开互动

财经要闻

公章争夺 家族反目 双星为何从顶端跌落?

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

数码
家居
亲子
教育
游戏

数码要闻

技嘉AORUS RTX 5060 Ti AI BOX评测:雷电5加持硬核性能

家居要闻

隽永之章 清雅无尘

亲子要闻

年轻妈妈每月省2000定投,孩子十八岁时教育金已自动攒好

教育要闻

初中孩子如何才能学好英语,单词记不住怎么办?靠一法破局

游戏七日薄:《少女与学院城》《蜉蝣之国囚徒》领衔

无障碍浏览 进入关怀版