撰文丨王聪
编辑丨王多鱼
排版丨水成文
要实现抗体的治疗潜力,需要同时优化其多种特性,包括抗原结合特异性、黏度、清除率和免疫原性等。然而,目前用于此类任务的方法耗时且耗费资源,往往难以平衡这些特性。
2026 年 4 月 15 日,西北工业大学计算机学院彭佳杰团队联合北京大学戴慧教授团队、天津大学郝建业教授团队(西北工业大学谢东娜为论文第一作者),在 Nature 子刊Nature Computational Science上发表了题为:DualGPT-AB: a dual-stage generative optimization framework for therapeutic antibody design 的研究论文。
该研究提出了双阶段条件生成式蛋白质语言模型新框架——DualGPT-AB,专为多属性协同优化的治疗性抗体设计而打造。该框架突破传统抗体设计难以兼顾抗原结合特异性、黏度、免疫原性等多个成药属性约束的瓶颈,在靶向HER2的抗体优化任务中实现性能跃升,实验验证获得杀伤活性优于赫赛汀(Herceptin)的候选抗体,为 AI 驱动的抗体药物开发提供高效、可扩展的新范式。
![]()
抗体设计:多目标优化的难题
治疗性抗体需要同时具备多种优良特性:不仅要能特异性结合靶抗原(例如 HER2),还要有良好的成药性,包括低粘度、合适的清除率、高稳定性、良好溶解性和低免疫原性等。其中,抗体重链互补决定区 3(CDRH3)是决定抗原结合特异性的关键区域,其设计尤为复杂。
传统方法往往采用多步筛选或线性加权的方式处理这些属性,但难以有效平衡多个目标,且忽略了属性间的内在关联。这导致设计过程耗时耗力,成功率有限。
DualGPT-AB:双阶段智能设计框架
在这项最新研究中,研究团队开发了一种用于治疗性抗体设计的DualGPT-AB,其核心在于采用了双阶段条件生成预训练 Transformer(GPT)框架,巧妙结合了生成式 AI 与强化学习。
第一阶段:基础学习
研究团队首先从 Observed Antibody Space(OAS)数据库中获取大量 CDRH3 序列,并用三个基础属性(FvNetCharge、FvCSP、HISum)进行标注,训练一个“先验 GPT”。这个模型学会了生成满足这三个基础属性的序列,为后续优化打下坚实基础。
第二阶段:强化探索
在第二阶段,研究团队引入强化学习策略,以先验 GPT 为基础初始化智能体。通过 2000 次迭代,智能体不断探索序列空间,生成的新序列用五个扩展属性(增加 HER2 特异性和 MHCIIminPR)进行评估和奖励。这些高质量序列构成新的训练集,用于训练“增强 GPT”。
这种双阶段设计,有效解决了数据稀缺问题:先验 GPT 提供稳定起点,避免强化学习初期的冷启动问题;强化学习则引导模型探索更优序列区域,实现多属性协同优化。
![]()
DualGPT-AB 的工作流程
实验结果:显著优势与验证
性能对比
在生成 10000 个独特序列的测试中,DualGPT-AB 的成功率(同时满足所有五个属性)达到 78.2%,显著优于其他先进方法。例如,比第二名的 AdaLead 高出 37.8 个百分点。即使排除单个属性进行测试,DualGPT-AB 也表现出更强的稳健性。
高质量抗体库
研究团队用 DualGPT-AB 构建了包含 1274 个高溶解度 CDRH3 序列的候选库。序列分析显示,Herceptin(赫赛汀)CDRH3 中的 G103、Y105、A106、F107 和 D108 等残基高度保守,这些位置对 HER2 结合至关重要。同时,生成的序列在氨基酸组成上呈现独特特征:半胱氨酸、谷氨酸、苯丙氨酸、甘氨酸和酪氨酸含量更高,这可能有助于优化亲水性和溶解度。
结合亲和力验证
从候选库中随机选择 100 个抗体进行结合亲和力预测,结果显示超过一半的抗体预测结合力与 Herceptin 相当,其中 8 个抗体甚至表现出更强的预测结合力。通过 AlphaFold3 和 AREA-AFFINITY 预测,最佳抗体的结合亲和力(-log₁₀K_D=9.13)超过了 Herceptin(-log₁₀K_D=8.84)。
湿实验验证
研究团队对 9 个设计的候选抗体进行了体外实验验证。其中两个抗体(CDRH3_39 和 CDRH3_68)表现出高 HER2 结合亲和力,并通过了表面等离子体共振(SPR)和酶联免疫吸附试验(ELISA)确认。更重要的是,抗体依赖性细胞介导的细胞毒性(ADCC)和补体依赖性细胞毒性(CDC)实验表明,这些设计的候选抗体具有强大的抗肿瘤活性,其中一个候选抗体 CDRH3_39 甚至比 Herceptin 效果更佳。
![]()
CDRH3_39、CDRH3_68 与赫赛汀的 HER2 结合能力和抗肿瘤活性对比
展望:AI 驱动抗体研发新范式
DualGPT-AB 框架的成功不仅体现在其高性能上,更在于它提供了一种可扩展的抗体设计范式。通过将目标属性表示为可学习的嵌入向量,模型能够捕捉序列与属性间的复杂关系;而双阶段优化策略则平衡了探索与利用,在广阔的设计空间中高效导航。
这项研究标志着AI在治疗性抗体设计领域迈出了重要一步。随着算法的不断优化和数据的持续积累,AI驱动的抗体研发有望加速新药发现进程,为癌症等疾病患者带来更多高效、安全的治疗选择。未来,类似框架还可能扩展到其他蛋白质设计领域,开启计算生物学的新篇章。
论文链接:
https://www.nature.com/articles/s43588-026-00976-0
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.