
近年来,人工智能(AI)在分子结构预测与药物设计领域取得了革命性的进展,例如AlphaFold 3等模型的问世极大地推动了结构生物学的发展。然而,当前的主流AI生成模型往往局限于特定的分子类型或任务,例如专门用于小分子对接、或者专门用于多肽序列设计,它们高度依赖为特定任务量身定制的算法与先验分布。
这种“各自为战”的局面源于一个核心挑战:不同类型的分子(如小分子与蛋白质)通常使用截然不同的底层表示方式,这本质上限制了模型在不同分子类型和任务之间的迁移与通用性。此外,虽然自然语言提示在大型语言模型中大放异彩,但对于定义涉及复杂空间关系或多个分子片段的微观化学任务而言,自然语言显得过于模糊,不够精确。由于所有的分子交互任务归根结底都受制于基础的原子间相互作用物理法则,一个自然的问题随之产生:我们能否开发一个统一的、基于原子级别的AI基础模型,通过学习海量数据来捕捉最底层的分子相互作用,从而在一个框架内解决所有基于口袋的药物生成任务?
为了打破现有模型的局限性,近日,清华大学马剑竹、首都医科大学宣武医院王子华、北京大学韩传辉、清华大学王新泉联合研究团队,在Cell上发表了文章Unified modeling of 3D molecular generation via atomic interactions with PocketXMol,正式推出了一种全新的原子级生成式AI大模型——PocketXMol。该模型首次在同一框架内实现了小分子与多肽3D结构预测和从头设计的“大一统”。
![]()
1. 三大核心技术创新,打破任务与分子类型的壁垒:PocketXMol摒弃了传统的“氨基酸序列”或特定化学基团的显式建模,直接将输入的分子抽象为最基础的“原子”和“化学键”的集合。为了实现多任务的统一,模型引入了三个关键组件:
原子级任务提示(Task Prompt): 创新性地使用二进制指示符(binary indicators)来精确控制哪些原子或化学键是已知的,哪些是需要生成的。这种方法比文本提示更精确地定义了输入和输出的空间与结构关系。
通用去噪器(Universal Denoiser): 采用了一种通用的去噪架构,能够自动识别输入分子中不同任务对应的噪声类型和尺度。这使得不同任务的数据分布被映射到一个统一的噪声空间中,从而允许模型在不进行任何“特定任务微调(fine-tuning)”的情况下,直接进行联合多任务训练并应用于新任务。
统一的原子级分子表示: 无论是小分子还是线性/环状多肽,在模型眼中都是原子级别的三维排布。这种表示不仅无缝衔接了各类分子,还使其天然具备了设计非天然氨基酸(NAA)的能力,这对于现代多肽药物开发至关重要。
2. 卓越的计算性能:在13项基准测试中击败55个前沿模型研究团队构建了一个包含超1100万个小分子、数万个蛋白质-多肽以及蛋白质-小分子复合物的三维结构超大规模数据集对PocketXMol进行了联合训练。
在涵盖小分子对接、多肽对接、3D构象预测、基于结构的药物设计(SBDD)、PROTAC(蛋白降解靶向嵌合体)设计、片段连接与生长、分子优化、线性与环状多肽设计等13项计算生成任务的全面评估中,PocketXMol与55个基准模型(包括AlphaFold 3、RFdiffusion、ProteinMPNN等)进行了对比。结果显示,PocketXMol在其中11项任务上取得了当前最佳(State-of-the-art)的表现,并在剩余2项任务中保持了极高的竞争力。
3. 出色的湿实验验证:从小分子抑制剂到体内肿瘤靶向多肽为了验证该AI模型的真实临床转化潜力,研究团队针对具有高度挑战性的抗肿瘤靶点进行了严格的湿实验(Wet-lab)验证,并取得了令人瞩目的成果:
设计新型Caspase-9小分子抑制剂: Caspase-9介导的细胞内源性凋亡是阻碍肿瘤内源性免疫感应途径的主要障碍之一。然而,现有的泛Caspase抑制剂难以对Caspase家族成员进行有效区分。研究团队利用PocketXMol专门针对Caspase-9设计了新型抑制剂。合成的16种分子中,优化后的化合物(如D12)不仅能强效抑制Caspase-9及下游Caspase-3的激活,其抑制效力甚至可与市面上的商业泛Caspase抑制剂(如QVD)相媲美。酶学实验进一步证实,D12不直接抑制Caspase-3,展现出了高度的靶向特异性。
开发靶向PD-L1的高亲和力抗癌多肽: 针对著名肿瘤免疫检查点PD-L1,PocketXMol直接“从头设计”了数十种候选多肽。在实验合成并测试的382种多肽中,有15种候选多肽对PD-L1的结合亲和力(KD)达到了惊人的10-8M级别,这一命中率远远超过了传统随机多肽文库的筛选效率。细胞实验证实,代表性多肽(如P282)能够特异性地结合在PD-L1阳性肺癌细胞(H1975)的细胞膜上,并有效阻断PD-1与PD-L1的相互作用。更为关键的是,活体动物荧光成像实验表明,通过静脉注射的荧光标记AI多肽能够快速、精准地在小鼠的肿瘤部位富集,展示了其作为肿瘤诊断探针及靶向治疗药物的巨大潜力。
总之,这项工作标志着人工智能在微观分子世界“基础大模型”构建上迈出了里程碑式的一步。PocketXMol模型通过学习最底层的原子级相互作用,成功弥合了3D结构预测与分子生成设计之间的鸿沟,首次证明了单一的AI基础模型足以胜任并统一涵盖小分子、多肽以及PROTAC等多种模态的药物设计任务。凭借其卓越的计算性能与已被实验证实的真实靶向药物设计能力,PocketXMol为AI驱动的创新药发现(AIDD)提供了一个强大而通用的平台,有望极大加速未来各类重大疾病新型疗法的研发进程。
![]()
https://www.cell.com/cell/fulltext/S0092-8674(26)00050-4
学术合作组织
(*排名不分先后)
![]()
战略合作伙伴
(*排名不分先后)
![]()
![]()
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐

点击主页推荐活动
关注更多最新活动!
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.