从单个基因的设计到完整基因组的设计,是一个极具挑战的问题。
近日,来自斯坦福大学、Arc 研究所等机构的研究人员表示,他们利用人工智能(AI)成功生成了16 条完整的噬菌体基因组,并在实验中实现了复制和杀菌。相关论文已发表于生物学预印本平台 bioRxiv,尚未经过同行评审,题为“Generative design of novel bacteriophages with genome language models”。
作为专门感染细菌的病毒,噬菌体是强大的生物技术工具,可用于靶向抗菌治疗、通过噬菌体展示技术开发诊断工具以及改造细菌以创造新产品,被视为未来抗生素替代疗法的重要方向。
在这项研究中,团队选择了具有里程碑意义的ΦX174 噬菌体作为设计模板。ΦX174 是诺贝尔化学奖得主 Fred Sanger 博士测序的第一个完整基因组,也是 Craig Venter 博士化学合成的第一个基因组。后者因领导 Celera Genomics 参与人类基因组计划而知名。
ΦX174 由 5,386 个核苷酸编码 11 个基因,包含至少 7 个调控元件和 2 个识别序列。其既处于现阶段 DNA 合成成本的可行上限,同时又足够复杂,可以展示基因组级别的设计能力。ΦX174 的重叠基因架构对设计提出了严格考验:重叠区域的突变必须同时满足多个蛋白的结构约束。
由于标准基因预测软件最多只能识别其中 7 个基因,无法处理重叠的阅读框。研究团队开发了一套新的注释流程,结合开放阅读框(ORF)搜索和针对噬菌体蛋白数据库的同源性比对,最终识别出 ΦX174 的全部 11 个基因。
随后,他们使用了自主研发的Evo 系列基因组大模型来生成噬菌体基因组。
Evo 1(2024 年 11 月发表于 Science)在 270 万条噬菌体和原核生物基因组上训练,首次展示了 AI 在 CRISPR-Cas 系统和转座子设计上的成功;Evo 2(2025 年初发布,与 NVIDIA 合作)规模更大,训练数据涵盖超过 9.3 万亿个核苷酸,囊括从细菌、古菌到人类和植物的全谱系信息,被称为“迄今最大规模的生物学 AI 模型”。与 ChatGPT 类似,Evo 的原理也是大语言模型,只不过不再通过书籍和博客学习,而是海量的基因组数据。
尽管基础的 Evo 模型已在 200 万条噬菌体基因组上训练,具备一定的噬菌体基因组生成能力,但其缺乏针对 ΦX174 的可控性。研究人员通过监督微调(Supervised Fine-Tuning)解决了这个问题。经过微调后,研究人员能够通过合适的提示直接引导 Evo 生成 ΦX174 样式的序列。
最终,在经过实验测试的约 300 个噬菌体设计中,筛选出16 条能够抑制生长的候选噬菌体,它们不仅能完成复制,还能快速杀死细菌。此外,多个由 AI 生成的噬菌体在生长竞争和裂解动力学方面表现出比 ΦX174 更高的适应性。
这些功能性基因组与最接近的天然序列相比,分别含有 67–392 个新突变。其中Evo-Φ2147拥有 392 个突变,与噬菌体 NC51 的平均核苷酸一致性为 93.0%,按照某些分类学标准已可视为一个新物种。此外,13 条基因组含有自然界未曾发现的突变,表明 Evo 能够探索超越自然演化范围的序列空间。
另外,Evo-Φ36整合了远缘噬菌体 G4 的 DNA 包装蛋白 J,这在以往的理性设计尝试中都未能成功。冷冻电镜结果显示,G4 的 J 蛋白(25 个氨基酸)比 ΦX174 的短 13 个氨基酸,并在衣壳结构中呈现出独特的方向。这说明 AI 能够协调复杂的补偿性突变,使新组合蛋白能够正常发挥功能。
此外,研究人员进一步探索了 AI 是否能设计出对细菌演化更具抗性的噬菌体疗法。在实验中,他们构建了三株对 ΦX174 具有抗性的大肠杆菌。结果表明,AI 生成的噬菌体混合物能在 1–5 轮传代内突破所有三株耐药菌,而野生型 ΦX174 完全失效。序列分析表明,这些噬菌体整合了 2–3 条不同 AI 设计的基因片段,说明 AI 创造的多样性为突破耐药提供了多条进化路径。
预印本的第一作者 Samuel King 强调,这些 AI 设计的基因组可以为基于噬菌体的策略提供启示,用于对抗全球范围内影响农作物的大规模多重耐药细菌。未来,该研究计划扩展到更大型的噬菌体基因组,以提供更强的模块化和设计灵活性,包括导致呼吸道感染的铜绿假单胞菌,或导致农作物黑腐病的黄单胞菌,并探索其他基因组系统,例如细菌的操纵子。
然而,也有业内人士提出担忧:Craig Venter 表示,虽然研究团队刻意避免让模型学习能感染人类的病毒。但其他科研人员若将方法用于天花、炭疽等病原体,可能带来灾难性后果;纽约大学朗格尼医学中心的生物学家 Jef Boeke 表示:人工智能能否为更大的生物体生成真正的基因组仍是一个悬而未决的问题。例如,大肠杆菌的基因组大约是 ΦX174 的 1000 倍。
1.https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1.full.pdf
2.https://www.technologyreview.com/2025/09/17/1123801/ai-virus-bacteriophage-life/
免责声明:本文旨在传递合成生物学最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.