![]()
后AlphaFold时代,大模型正在重塑生物学。
Evo2是其中的里程碑式成果,作为最大的开源AI生物学模型,拥有超400亿参数,首次整合了 DNA、RNA 和蛋白质进行通用预测和设计任务,引发学术与工业界的强烈关注。
而这个里程碑式突破的背后,来自一个成立仅只有4年的非营利研究机构——Arc Institute。
与传统高校研究不同,Arc以颠覆性的体制支持科学技术的发展,解决生物学中一些最棘手的挑战。
如今,Arc启动了一项“登月计划”:打造虚拟细胞,用AI模型来预测细胞行为。
近日,硅谷顶级风投公司a16z对谈了Arc Institute的联合创始人Patrick Hsu博士,他也是Evo2的核心科学家。
![]()
图: Patrick Hsu
Patrick Hsu师从基因编辑大牛张锋,现任加州大学伯克利分校生物工程教授,也是虚拟细胞项目的重要支持者,近期他还解锁了投资人这一新身份。
在播客对谈中,Patrick Hsu展示了对于AI生命科学的深刻思考,虚拟细胞的研究方向,也回答了人们对于AI生物学模型的疑惑。
Evo2的出现证实了生物学基础模型的Scaling Law能够实现,生物学有望复制GPT的发展轨迹。
太多AI制药公司的愿景走到了基础研究的前面,因此Arc真正投入的虚拟细胞,正是让这种基础突破成为可能。
虚拟细胞的“AlphaFold”时刻,意味着模型以90%高准确率预测出能将细胞状态,并且能被实验验证。
AI最终会像互联网一样,成为药物研发中无处不在、不可或缺的基础设施,而不仅仅是营销噱头。
未来,脑机接口、合成生物与机器人只要一定程度上取得成功,将彻底改变人们的生活方式。
![]()
核心使命与“登月计划”:构建虚拟细胞
主持人:你如何描述Arc的“登月计划”?你们真正想实现的是什么?
Patrick:我想让科学研究变得更高效。我也可以在哲学层面去说,比如加速科学进步,但这对很多人来说太抽象了。
我认为最重要的是,科学研究是发生在现实世界中的。如果你做的不是AI研究(它的进展速度取决于GPU的迭代速度),那么你就必须真正动手操作实验,才能研发出改变生命的药物,这些事情都需要在现实世界中,耗费大量时间完成。
这就意味着,科学家必须培养细胞、组织和动物。而我认为,当前机器学习与生物学结合的前景在于,我们实际上可以极大地加速这一过程,甚至将其大规模并行化。Arc的“登月计划”就是构建“虚拟细胞”,并用基础模型来模拟人类生物学。
我们希望为实验科学家、对技术持怀疑态度的人找出一些有用的东西,毕竟他们只想看到数据和结果,然而,我们希望这个工具能成为细胞生物学家开展工作时的第一选择。
主持人:为什么科学研究本身如此缓慢?这到底是谁的错?
Patrick:这是个好问题,答案也很复杂。这其实是一个复杂的“戈尔迪之结”(Gordian Knot),归根结底涉及激励机制。
人们经常归结于科研资金问题,说科研经费应该更充足或分配得更好。但问题也出在培训体系上——我们如何激励长期职业发展?如何区分基础科学研究和具有商业价值的工作?以及研究人员今天能实际涉足的问题领域本身。我认为,现在的研究越来越跨学科,但一个研究团队或一家公司很难同时精通两件以上的事情。
比如,你可能同时擅长计算生物学和基因组学,或者化学生物学和分子胶技术,但同时精通五件事就越来越难了。
我们创立Arc研究所的初衷,正是想尝试一种组织实验:把神经科学、免疫学、机器学习、化学生物学和基因组学这些领域的人才聚集在同一屋檐下,看看当这些不同领域的碰撞频率增加时,会发生什么。理论上,这将打开一个巨大的问题空间,是单个团队无法触及的。
我们有两个旗舰项目:一个是寻找阿尔茨海默症的药物靶点,另一个就是构建“虚拟细胞”。我认为,除了人才和基础设施,模型本身也能真正让科学变快——如果这些模型足够准确和实用,我们就能以神经网络前向传播的速度来做实验。
![]()
虚拟细胞处于GPT-1到GPT-2阶段
主持人:我们能不能再深入聊聊“虚拟细胞”的概念?为什么这是我们的最终目标?实现它需要什么?瓶颈在哪里?
Patrick:当前AI生物学中成功案例是AlphaFold,它解决了蛋白质折叠问题。给一段氨基酸序列,它就能预测出蛋白质的三维结构。
虽然不完美,也无法模拟生物物理和分子动力学,但它能以90%以上的准确率给出最终结构的状态,这就是人们常说的“AlphaFold时刻”。
我们也希望“虚拟细胞”能达到同样的地位。
在Arc,我们把这一目标具体化为“扰动预测”:其理念是有一个多种细胞类型和细胞状态的流形(manifold)——比如心肌细胞、血细胞、肺细胞等。我们知道,细胞可以在这个流形上移动——有时会发炎,有时会凋亡,有时会停滞在细胞周期,或处于应激、代谢饥饿等状态。如果我们能构建一个“通用细胞空间”的表征,我们能否找出哪些“扰动”才能让细胞在这个空间中移动?
这正是我们研发药物的本质。无论是小分子药物 ,还是抗体,我们本质上都在寻找越来越特异的“探针”。过去我们靠实验方法来炮制这些探针,现在我们有了计算方法来“零样本”生成这些结合体。但最终,我们使用这些结合体的目的是抑制某些功能,从而将细胞从“致病状态”拖拽回稳定的健康状态。
这在复杂疾病中(没有单一病因),很明显,需要一系列复杂的改变。你可以理解为组合扰动。过去人们称之为“多靶点药理学”,但现在我们正从“这个药物偶然作用于多个靶点”转向“有目的地、组合式地操纵这些靶点”:为了从细胞状态A到状态B,我需要先做这三个改变,再做两个,最后再做六个,按时间顺序进行。我们希望模型能够提出这样的建议。
我们之所以将“虚拟细胞”定义为这个方向,是因为我们认为它在实验上非常实用。我们想要打造一个湿实验室生物学家的“副驾驶”(Copilot),能帮他们决定明天实验室里该做什么。
我们并不是试图做一些像理论论文那样的事情,虽然读起来真的很有趣,在基准测试中的性能又提高了,数字上升了。我们更希望的是,模型能实际建议“明天在实验室里测试这12种条件”,然后科学家实际测试这些建议。
这就是我们进入“干湿实验室闭环”的方式:模型预测 → 实验验证 → 改进模型→ 再次预测。我们的目标是实现“计算机内靶点识别”,能够发现新的药物靶点,并设计出实现这些改变所需的药物组合。
我认为,如果能做到这一点,我们就能打造一家全新的、垂直整合的、AI驱动的制药公司。这无疑是当下非常激动人心的想法,但我觉得,许多这类公司的“愿景”和“包装”其实走在了基础科研能力突破的前面。而Arc真正投入的,正是让这种基础突破成为可能——不仅为我们自己,也为整个科学界。
![]()
主持人:为什么AI在图像生成和语言模型方面的发展,比在生物学领域快得多?你最希望在哪些方面加快速度?
Patrick:自然语言和视频建模,确实比建模生物学要简单得多。某种程度上,如果你懂机器学习,你就已经“会说话”了,你也“会看图”。因此,你评估模型生成结果的能力是天生的。
但我们并不“懂”生物学的语言,我们顶多是以非常浓重的口音在说。当我们训练DNA基础模型时,我并不能天然地理解输入模型的token是什么,也不知道输出的是什么。
同样,对于“虚拟细胞”模型,我们的目标之一就是找到方法,去解读模型输出的那些模糊、奇怪的结果。我认为,这正是拖慢迭代周期的原因——我们必须进行“实验室闭环”(lab-in-the-loop)的实验,用真实的实验数据来验证模型的预测。提高这一验证过程的速度和维度将至关重要。
主持人:在生物学中,有很多我们看不见、甚至还不知道存在的东西。在这种情况下,我们如何构建“虚拟细胞”?
Patrick:人们在自然语言处理(NLP)领域也讨论过类似问题。学术界曾长期认为,把大量非结构化数据输入Transformer模型就能奏效,这种想法曾被认为是奇怪、反直觉且极具争议的。
现在,我们并不是说这会在所有其他领域,包括生物学领域都行得通,但关于“什么是准确的生物模拟器”、“什么是虚拟细胞”,确实存在争议。你说得对,我们无法测量一切——比如我们还无法以高通量、高空间分辨率的方式测量代谢物。
然而能力会分阶段提升:最初模型可能只能模拟单个细胞,然后是细胞对,再是组织中的细胞,最后是更广泛的生理系统和完整动物环境。这些是不同层次的复杂性,会随着时间逐步积累和改进。某种程度上,这也和数据与建模中的“规模法则”(scaling laws)有关。
我举个例子:分子生物学中常讨论RNA水平不能完全反映蛋白质及其功能。目前,我们还没有像单细胞转录组学那样可扩展的蛋白组学测量技术。但我们正在进步,可以将某些蛋白质信息节点叠加到RNA信息之上。
但从某种角度看,RNA的表达是一种“镜像”——它可能是蛋白质层面发生事件的低分辨率映射。但最终,蛋白质信号传导的活动会在转录状态中有所反映。对于单个细胞,这种映射可能不够准确,但当我们想象正在生成的海量基因组和功能基因组数据时,大量RNA数据开始反映出蛋白质层面正在发生的事情,就像一种“镜像回声”,代谢信息也是如此。
主持人:这个过程中,Arc的方法论是什么?
Patrick:你必须专注于当前可扩展的东西。我们现在能规模化单细胞和转录信息,未来会逐步加入蛋白质信息,还需要空间信息和时间动态信息。
我把这些事情分为三个层次:发明(invention)、工程(engineering)和规模化(scaling)。目前有些生物技术已经具备规模化条件,但还有很多东西我们仍需发明。
这也是为什么我们觉得需要一个研究机构来应对这类问题——我们不想仅仅成为一个工程公司,只专注于扩大单细胞扰动筛选的规模。那固然有趣,但三年后可能就过时了。因此,我们正在投入大量资源开发新技术,相信它们会随着时间推移结出硕果。
主持人:你觉得我们离这个“虚拟细胞的AlphaFold时刻”还有多远?
Patrick:可以用GPT-1、GPT-2、GPT-3、GPT-4、GPT-5的能力来类比。我认为我们现在大概处于GPT-1到GPT-2之间。
很多人当时的兴奋点在于,我们居然实现了GPT-1,这意味着我们看到了一条通过“规模法则”逐步提升能力的路径。在Arc,我们和Brian等人开发的“Evo”系列DNA基础模型就展示了这一点:这些“基因组生成”结果就像是生命的“模糊图像”。
我们不认为如果合成这些新基因组,生命体就能存活。但我们也不认为这遥不可及,只要我们持续追踪这些能力的发展。我们正采取一种高度整合的方法来攻克这个问题:需要整理公共数据,生成海量内部私有数据,建立基准,训练新模型,开发新架构——全栈式地推进。我们会一步步攀登这座山峰。
![]()
图: Evo 2
![]()
构建生物学模型:逐渐增加复杂性
主持人:什么是生物学领域的“GPT时刻”?我指的是那种公开发布、彻底改变公众对能力边界认知的时刻,同时也激励新一代人才涌入生物学领域。
Patrick: 生物学的好处在于,我们拥有大量真实可靠的知识基础。比如,有整本整本书籍详细描述了细胞信号传导、细胞生物学以及这些系统是如何运作的。
因此,即使完全没有虚拟细胞模型,如果你去问ChatGPT或Claude一些问题,比如关于受体酪氨酸激酶信号通路,它们也会给出一个解释。所以,我们希望这个模型能够预测一些著名的、经典的生物学发现中的扰动效应。
我举个例子:如果你把诱导多能干细胞(iPSC)或人类胚胎干细胞状态,以及成纤维细胞状态输入模型,它能否预测出“山中伸弥因子”这四种转录因子可以将成纤维细胞重编程为干细胞样的状态?换句话说,模型能否从已有知识中推出2009年诺贝尔奖的成果?这是一个非常经典的例子。
反过来,如果你有一个干细胞,模型能否发现像Neurogenin 2、Ascl1、MyoD这样的分化因子,从而预测出它能转化为神经元、肌肉细胞等。这些是发育生物学中的经典案例。
此外,我们还可以用这类模型来重现或发现FDA批准药物的作用机制。例如,如果你在乳腺癌细胞状态下抑制HER2,模型能否预测出相应的细胞反应?或者预测出某些克隆会更具转移性,或更具耐药性,从而导致微小残留病灶?
我们可以为这些模型设计大量生物学评估任务,它们都基于教科书中的经典案例,而不是像当前第一代模型那样,仅仅依赖一些非常量化的指标,比如基因差异表达的平均绝对误差。这些只是机器学习的基准测试。我们需要提升评估的复杂度,让这些结果能够被一位从未接触过AI的老教授所理解。
主持人:你提到教科书是“真实知识”,你是否认为我们会发现很多教科书内容其实是错误的?
Patrick:我认为教科书是对知识的压缩。比如,你看那些经典的细胞信号通路图示:A信号激活B,B抑制C,这非常二维化,是对复杂系统理解的简化表达。
教科书代表了我们公认的可靠知识体系,但大家都知道,其中存在无数例外。而发现这些例外,正是科学发现的本质所在。
主持人:当我们谈论生物学模拟与真实生命能量之间的差异时,要真正模拟极其复杂的人体,还需要什么?
Patrick:有些人不喜欢“虚拟细胞”这个词,觉得它太媒体化,不够严谨。但我觉得有趣的是,很多人却能接受“数字孪生”或“数字化身”这类词,它们描述的是对生物学更高层次的抽象建模。
相比之下,虚拟细胞其实更具体、更严谨。我认为这些术语是有用的,因为它们表达了我们的目标和雄心:长远来看,我们并不只关心预测单个细胞的扰动响应。我们真正关心的是预测药物毒性、衰老过程,或者为什么肝细胞在反复暴露于乙醇分子后会发展为肝硬化。这些化学或环境扰动应该是可以预测的。
我认为我们必须逐步增加复杂性。为什么我们如此焦虑于模拟整个身体,却连单个细胞都还做不到?细胞被广泛认为是生物学的基本计算单元,我们应该从这里开始。就像AI早期从数学、代码、语言建模等相对简单的任务开始一样,我们可以通过逐步积累,最终构建出超级智能。
主持人:这很有道理。以建模生物学的基本单位细胞为目标,从这个基础出发,我们应该能够逐步构建更复杂的系统。
Patrick:就像早期AI从语言翻译、基础NLP任务开始,远在今天如此宏大的野心之前。如果我们足够幸运,希望生物学也能复制这样的发展轨迹。
![]()
药物进展缓慢,不是AI的问题
主持人:看起来,生物技术和制药行业的增长速度正在放缓。要让这些科学创新真正反映在商业模式和行业增长上,还需要什么?
Patrick:许多生物技术初创公司最初试图向制药公司销售软件,后来发现他们只能竞争有限的SaaS预算,于是意识到必须转向竞争更大的研发预算。当前一代公司认为,我们的“生物智能体”将取代人力,直接参与研发预算的竞争——就像AI Agent在其他垂直领域所做的那样。但这能否实现,取决于这些技术是否真能显著提升药物研发效率。我认为这是这个行业最重要的问题。
我们相信虚拟细胞的未来,不仅因为它可能带来根本性的机制洞察和发现,更因为它一旦成功,将在工业层面极具实用价值。当然,这还需要时间来验证。
如果90%的药物在临床试验中失败,这意味着两件事:一是我们最初选择了错误的靶点;二是我们设计的药物分子本身无法完成任务。但具体到每一次失败,我们并不清楚是哪个原因,或是两者兼有,需要随着时间逐步厘清。
即使在“虚拟细胞”模型达到90%准确率的情况下,它可能会建议:你需要只在心脏中靶向某个GPCR受体,而在其他所有组织中都不作用。但目前我们根本没有能实现这种精准靶向的药物分子。因此,我们还需要研究新型化学物质,以实现对具有多重功能的靶点进行组织或细胞类型特异性的调控。
我认为生物学进展缓慢的原因,就在于理解、干预和安全性评估方面存在一层又一层的“俄罗斯套娃”式复杂性。但令人惊叹的是,我从事这一领域以来,进步速度是惊人的。
我在罗氏研究所读博时,正值单细胞基因组学、人类遗传学、CRISPR基因编辑等技术发展的高峰期。早期的单细胞测序论文可能只分析了20或40个细胞,而如今,我们即将生成包含数十亿次扰动的单细胞数据。这简直是生物学的“摩尔定律”!
主持人:我经常问创业者这类问题,比如那些说“我们要用AI做药物发现”的人。你认为在AI领域,哪些地方被过度炒作?哪里已经取得了实实在在的进展?
Patrick:我认为毒性预测模型存在炒作现象。还有任何与蛋白质相关的东西——显然包括蛋白质结合,现在越来越多地涉及蛋白质设计,我认为那方面已经有实质性的进展了。
而被炒作的地方,则是所谓的“多模态生物模型”,不管这到底意味着什么。当然,我也认为病理学AI预测模型是有实际价值的,比如自动化病理学家和放射科医生的工作。那是非常强大的。此外,还有很多不需要训练复杂的生物学基础模型的任务,比如撰写监管文件、报告等,这些也都很有价值且重要。
主持人:那么为什么AI至今还没有真正产出药物?
Patrick:AI用于药物研发是一个很奇怪的现象:业内每个人都试图宣称自己的药物是第一个由AI设计出来的分子。
但我觉得,再过几年,AI将成为整个研发流程中不可或缺的一部分,就像我们使用互联网和手机一样自然。它会融入到我们所做的每一个环节。
所以,为什么AI还没“成功”?因为药物研发是一个漫长且多因素参与的过程——包括设计、合成、测试和审批。我认为,安全性和有效性是这个行业的两大支柱,我们必须在这两点上做得更好。我们需要更快地预测某个分子是否有效、是否安全。
举个例子,如果你设计了一个小分子,现在可以通过计算模拟它与整个蛋白质组中每个蛋白的对接情况,判断它是否会与非靶标蛋白结合。这可以用来优化结合的选择性和亲和力,从而帮助预测安全性和有效性。
但效果如何呢?这需要通过实验来验证,形成反馈闭环。而实验本身耗时很长,几小时、几天、几个月甚至几年。这正是我们在Arc公司选择以“虚拟细胞模型”作为切入点的原因——我们认为它可以整合上述所有环节。
主持人:构建一个好的虚拟细胞模型,核心在于输入所有相关数据。但如果我们喂给模型的数据本质上是不完整或关键缺失的,该怎么办?
Patrick:我认为这几乎是肯定的。很明显,当前生物学并没有测量到许多最重要的东西。当然,生物学研究最终主要依赖两种高通量手段:成像和测序。还有很多我们关心的生物学现象,这些技术无法大规模捕捉。这正是我们一直思考RNA层为何能成为其他生物学层次“镜子”的原因。
这里有一个区别:机制性模型vs.气象模拟类模型。比如你要预测天气,你可以建立AI模型来告诉你下周二会不会下雨。它不会解释物理或地质上为什么会下雨,但只要你知道会不会下雨,对吧?
同样对于虚拟细胞模型,它可能不会告诉我为什么细胞会这样反应,就像AlphaFold不会解释蛋白质“为什么”这样折叠,但它给出了准确的最终状态,这就已经非常重要了。
![]()
未来,看好合成生物与脑机接口
主持人:我们一直在谈论科学和生物技术,但你也是一位顶尖的AI专家和投资人。我想了解一下你目前的投资重点,你最关注哪些领域?你在哪里投入时间和精力?你对未来有哪些期待?
Patrick:我的目标是找到能改善人类体验的方法,而且是在我们有生之年就能实现的。我在想,如果我们这一代人能把几件事做好,就能彻底改变世界,以及我们未来的生活方式。
我认为合成生物学显然是其中之一,比如GLP-1类药物、改善睡眠的技术、延长寿命的方法,这些都是很容易让人兴奋的方向。
脑机接口(BCI)则是另一个未来几十年将取得重大突破的领域。第三是工业和消费级机器人,它们能以有趣的方式扩展体力劳动的规模。
你可以想象,即使这些领域只是取得一定程度的成功,也会深刻地改变世界。所以我非常有兴趣推动这些事情的发生。
有些事,如果不是我们在正确的时间把正确的人聚集起来并提供资金,它就根本不会发生,这才是真正激励我的地方。这也是我一直在支持的方向,比如投资抗衰老公司New Limit、脑机接口公司Nudge、机器人公司The Bot Company。这些是我认为必须发生的事,因此应该发生。
![]()
主持人:我想请你用之前的问题框架来来谈谈你在机器人、脑机接口和长寿科技这些领域的看法。哪里被高估?哪里有机会或路径?哪里已有实际成果?
Patrick:我认为智能体(Agents)最酷的一点是,它们能完成真实工作。与之前的SaaS公司相比,智能体能真正替代生产力。目前它们还有很多错误,但我认为通用计算机操作智能体可能会比代码生成智能体晚一年左右出现,但趋势已经明确。随着它们从无错误地完成几分钟任务,发展到几小时、几天,我们将看到完全不同的产品形态。法律、业务流程外包、医疗健康等领域都会沿着这个轨迹发展,这将非常令人振奋。
我认为真正的价值在于——全球经济中最大的开支是服务,而不是软件。我们之所以对AI如此兴奋,正是因为它能冲击服务经济。
至于炒作,无疑集中在模型能力上。要知道,我们当前的架构可以追溯到2017年。回顾深度学习的历史,大约每八年就会出现一次重大变革。现在是2025年,我们似乎真的急需一种全新的架构。
目前有很多非常有趣的研究思路正在浮现。尤其是机器学习的“黄金时代”(大约2009到2015年),有很多被埋没的小众论文,引用次数可能只有二三十次。随着算力成本逐年下降,我们将有能力把这些想法放大。当年在1亿或6500万参数规模下看不到的扩展规律,现在放到10亿、70亿、350亿、700亿参数规模上,就能看出这些想法是否“爆发”。
这非常令人兴奋,因为这将为新的超级智能实验室创造大量机会,超越当前主流基础模型公司的做法。这些大公司正逐渐变成应用型AI企业。
新公司需要打造产品形态、为企业做强化学习、赚钱、开发代码智能体、靠API创收。这很重要,也是当下的生存竞赛。长期来看,除了强化学习环境,我们还需要探索新的学习方式和奖励信号获取方法,这将非常激动人心。
—The End—
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.