冷冻电镜(cryo-EM)技术的革新为解析生物大分子复合体结构提供了强大工具,但小分子配体在电镜密度图中的分辨率不足及建模困难,始终是结构生物学与药物研发领域的关键挑战。2025年8月11日发表于《PLOS Computational Biology》的研究《Cryo-EM ligand building using AlphaFold3-like model and molecular dynamics》,提出了一种整合人工智能(AI)预测与密度引导分子动力学模拟的创新方案,为解决这一难题提供了系统性解决方案。 一、研究背景与核心挑战
蛋白质-配体相互作用的原子级解析是理解分子调控机制与药物设计的基础。尽管冷冻电镜技术已能解析多种复杂生物分子结构(包括X射线晶体学难以处理的靶点),但配体的分辨率往往显著低于周围蛋白质区域。例如,在β-半乳糖苷酶与抑制剂的复合体中,蛋白质分辨率可达1.5Å,而配体密度仅为3-3.5Å。
传统配体建模方法存在明显局限:
刚性拟合或柔性拟合法多针对蛋白质优化,难以兼顾配体的化学多样性;
基于物理的对接方法依赖预先解析的蛋白质结构,且在蛋白质与配体密度重叠时难以优化;
自动化建模高度依赖初始模型质量,对新型复合体适应性差。
在此背景下,该研究创新性地将AlphaFold3类AI模型的结构预测能力与分子动力学模拟的柔性优化能力结合,构建了一套高效的配体建模流程。
二、技术方案与实验设计 1、核心方法:多步骤整合流程
研究团队开发的配体建模 pipeline 包含三个关键步骤:
AI初始预测:使用与AlphaFold3架构和训练策略相似的Chai-1模型(开源权重),仅通过蛋白质氨基酸序列和配体的SMILES编码,生成5个蛋白质-配体复合体预测模型。
刚性对齐:通过ChimeraX软件将预测模型与实验冷冻电镜密度图进行刚性对齐,初步匹配空间位置。
密度引导分子动力学模拟:在GROMACS中进行柔性拟合,通过施加与模拟密度和参考电镜图相似度梯度相关的力,实现蛋白质与配体的协同构象优化,无需预先限定配体结合位点或残基信息。
2、评价指标与验证体系
为量化建模效果,研究采用多维度指标:
模型-密度图交叉相关系数(CC):衡量配体、结合口袋及整体蛋白质与电镜密度的匹配度;
蛋白质-配体相互作用能(PLIE):评估结合构象的化学合理性(非自由能估算);
GOAP评分:验证蛋白质几何结构的 plausibility。
实验数据集选自PLINDER数据库,包含10个2021年12月后解析的生物医药相关复合体(确保未纳入Chai-1训练集),涵盖激酶(如LRRK2、PI3Kα)、G蛋白偶联受体(H1R、HCA3)及次级转运蛋白(如GlyT1、NET),配体分子量218-442 g/mol,分辨率2.7-3.7Å。
![]()
![]()
三、关键发现与性能验证 1、AI预测与柔性拟合的协同效应
研究结果显示,该方法在10个测试体系中均实现了显著的建模精度提升:
直接适用场景:对于LRRK2-MLi-2、PI3Kα-阿培利司等体系,Chai-1初始预测已达到较高精度(配体CC≥0.6),柔性拟合后保持90%以上与实验结构的一致性。
需优化场景:7个体系初始AI预测精度较低(配体CC 0.2-0.57),经密度引导模拟后,配体CC提升至0.6-0.8,相对实验结构的准确率从40-71%升至82-95%。例如,HCA3-阿西弗兰复合体的配体CC从0.35提升至0.61,GlyT1-SSR504734从0.24提升至0.62。
![]()
2、蛋白质构象优化的附加价值
柔性拟合不仅改善配体定位,还能优化蛋白质构象:
对于ThTr2-硫胺素、NET-安非他酮等体系,AI初始预测的蛋白质构象与实验功能状态偏差较大(准确率71-75%),模拟后整体蛋白质准确率提升至93-94%,表明该方法可同时适应蛋白质构象变化(如转运蛋白的向内/向外开放状态转换)。
结合口袋残基的准确率提升更为显著(从63-97%升至84-98%),验证了蛋白质-配体协同优化的必要性。
![]()
![]()
3、挑战性场景的解决方案
针对OATP1B1-雌酮硫酸盐等复杂体系(配体初始预测方向颠倒),研究通过增加Chai-1预测次数(从5次增至25次),筛选出更优初始模型,经模拟后配体准确率达92%,PLIE稳定在-10 kJ/mol,证明扩展AI采样可有效应对配体取向等难点。
![]()
四、方法优势与创新点
输入需求极简:仅需蛋白质序列与配体SMILES,无需结构模板或结合位点先验知识,规避了传统方法对预处理结构的依赖。
全自动化流程:从预测到拟合无需人工干预,通过模型-密度CC自动筛选最优初始模型,降低了对结构生物学专家的依赖。
兼容性与扩展性:已整合至GROMACS工具包,支持多配体(包括离子、辅因子)同时建模,且可通过增强采样技术拓展至更复杂体系。
该方法的核心局限在于对初始AI预测质量的依赖:若模型与真实构象偏差超过4Å,柔性拟合可能陷入局部最优。此外,经典分子动力学力场对小分子的描述精度、高柔性蛋白质的建模难度仍是待解决问题。
未来可通过以下方向优化:
整合多尺度模拟(如量子力学/分子力学)提升配体力场精度;
开发迭代式密度引导模拟策略,逐步提高分辨率约束;
结合生成式AI扩展初始模型采样空间,覆盖更多构象状态。
该研究系统验证了AlphaFold3类模型与密度引导模拟在冷冻电镜配体建模中的协同作用,其构建的 pipeline 不仅显著提升了配体建模精度(82-95%准确率),还为药物研发提供了从序列到结合构象的高效解析工具。对于激酶抑制剂设计、GPCR配体筛选等领域,该方法可加速候选分子的结构活性关系(SAR)分析,降低实验成本。相关数据与代码的公开(Zenodo:10.5281/zenodo.14842872)为方法的推广与优化奠定了基础,有望成为冷冻电镜结构解析的标准流程之一。
参考文献:Haloi N, Howard RJ, Lindahl E (2025) Cryo-EM ligand building using AlphaFold3-like model and molecular dynamics. PLOS Computational Biology 21(8): e1013367.
![]()
识别微信二维码,可添加药时空小编
请注明:姓名+研究方向!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.