![]()
谷歌发布基于Gemma家族、270亿参数的生物学基础模型Cell2Sentence-Scale,它成功预测并经实验验证了一条潜在的癌症免疫疗法新通路,劈柴哥说这标志着AI在科学发现中的一个里程碑
![]()
就在今天,谷歌DeepMind与耶鲁大学宣布,正式推出一个专为单细胞分析设计的270亿参数新基础模型,该模型名为Cell2Sentence Scale 27B(简称C2S-Scale),构建于Gemma开源模型家族之上
C2S-Scale成功生成了一个关于癌细胞行为的全新假说,并且这一假说已在活细胞实验中得到验证。这一发现揭示了一条颇具前景的新路径,有望用于开发对抗癌症的新疗法。
此项工作建立在谷歌今年早些时候的研究之上,当时他们证明了生物学模型也遵循明确的“缩放定律”(scaling laws)——就像自然语言一样,更大的模型在生物学任务上表现更好。
但这引出了一个关键问题:更大的模型仅仅是把现有任务做得更好,还是能够获得全新的能力?
这次的成果给出了答案:规模化的真正潜力在于创造新想法和发现未知
C2S-Scale 27B如何工作
癌症免疫疗法面临的一大挑战是,许多肿瘤对人体免疫系统来说是“冷”的——即无法被免疫系统识别。而关键策略之一,就是通过一个叫做抗原呈递(antigen presentation)的过程,迫使这些“冷”肿瘤展示能触发免疫反应的信号,从而变“热”
研究团队给C2S-Scale 27B模型布置了一项任务:寻找一种能充当“条件性放大器”的药物。
具体来说,这种药物只有在特定免疫环境阳性的条件下才能增强免疫信号。在这种环境中,已经存在低水平的关键免疫信号蛋白——干扰素,但其水平不足以自行诱导抗原呈递。
这种任务需要模型具备高水平的条件性推理能力,而这似乎是模型规模扩大后才涌现出的能力。团队之前使用的小规模模型无法解决这种依赖于特定上下文的效应。
为了实现这一目标,研究人员设计了一个双重上下文虚拟筛选方案,分两个阶段进行:
1.免疫环境-阳性 (Immune-Context-Positive): 向模型提供来自真实患者的样本数据,这些样本保留了完整的肿瘤-免疫细胞相互作用和低水平的干扰素信号
2.免疫环境-中性 (Immune-Context-Neutral): 向模型提供孤立的细胞系数据,其中不包含任何免疫环境信息
随后,团队模拟了超过4000种药物在这两种不同环境下的效果,并要求模型预测:哪些药物仅仅在第一种阳性环境下才能促进抗原呈递。
这样做旨在将筛选偏向于与患者真实情况更相关的场景。在模型筛选出的众多候选药物中,一部分(约10-30%)在现有文献中已有记载,而其余的则是完全出人意料的发现,此前从未被报道过与此相关
AI预测到实验室验证
模型的预测结果非常清晰
它发现了一种名为silmitasertib (CX-4945)的激酶CK2抑制剂,表现出惊人的“上下文分裂”效应。模型预测,当silmitasertib应用于免疫环境-阳性设定时,抗原呈递会显著增强;而在免疫环境-中性设定中,则几乎没有效果。
这个预测之所以令人亢奋,是因为它的新颖性。尽管CK2被认为与多种细胞功能(包括免疫调节)有关,但此前没有任何文献报道过通过silmitasertib抑制CK2能明确增强MHC-I表达或抗原呈递
这表明,模型正在生成一个全新的、可供检验的科学假说,而不仅仅是复述已知事实
当然,一个预测只有在临床应用中得到验证才有价值。真正的考验首先来自实验室
在项目的下一阶段,团队将这个假说带到了实验台上,在人类神经内分泌细胞模型中进行测试——这是一种模型在训练期间完全没有见过的细胞类型
实验结果证明:
单独使用silmitasertib处理细胞,对抗原呈递(MHC-I)没有影响
单独使用低剂量干扰素处理细胞,效果有限
同时使用silmitasertib和低剂量干扰素处理细胞,则产生了显著的协同放大效应
值得注意的是,在实验室测试中,silmitasertib和低剂量干扰素的组合使用,使得抗原呈递增加了约50%。这将使肿瘤对免疫系统来说变得更加可见。
模型的预测,在体外实验中得到了多次证实。C2S-Scale成功识别出一种新颖的、干扰素条件下的放大器,揭示了将“冷”肿瘤变“热”的潜在新通路,有望让肿瘤对免疫疗法更敏感
AI驱动生物学
这一成果不仅为开发使用多种药物协同作用的组合疗法提供了强有力的、经实验验证的线索,也为一种新型的生物学发现模式提供了蓝图。
它证明了,通过遵循缩放定律并构建像C2S-Scale 27B这样的大型模型,我们可以创建出足够强大的细胞行为预测模型,用于进行高通量虚拟筛选、发现依赖于特定条件的生物学现象,并生成有生物学依据的假说。
目前,耶鲁大学的团队正在进一步探索这一新发现的机制,并在其他免疫环境中测试更多由AI生成的预测。通过进一步的临床前和临床验证,这些假说最终可能加速新疗法的开发进程。
上手C2S-Scale 27B
新的C2S-Scale 27B模型及其相关资源现已向研究社区开放。
预印本paper:
https://www.biorxiv.org/content/10.1101/2025.04.14.648850v2
在Hugging Face模型和资源:
https://huggingface.co/vandijklab/C2S-Scale-Gemma-2-27B
在GitHub代码:
https://github.com/vandijklab/cell2sentence
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.