网易首页 > 网易号 > 正文 申请入驻

BioMD:从结构快照到连续轨迹,蛋白-配体全原子动力学生成模型

0
分享至



作者 | 论文团队

编辑丨ScienceAI

从 AlphaFold2 到 AlphaFold3,结构预测模型解决了「算得准」的问题,Alphafold3 不仅能预测蛋白结构,还能准确建模蛋白质和药物配体相互作用。然而,在药物发现与计算化学的真实工作流里,科学家还要回答第二个同样关键的问题:分子如何运动 —— 配体在结合口袋中如何涨落、蛋白主链与侧链如何协同形变,乃至配体沿何路径解离至溶剂。传统分子动力学(MD)通过数值积分给出原子轨迹,但极小时间步(飞秒量级)与长程生物学过程(微秒 — 毫秒)之间的鸿沟,使「算得长」长期是一道硬门槛。

近年来,机器学习开始作为 MD 的替代或加速器出现;但在蛋白 — 小分子配体这一场景下,现有方法或将蛋白视为刚体只考虑配体运动,或专为蛋白设计而无法处理小分子配体。能不能有一套方法,把蛋白和配体一起建模、全原子、连续轨迹、还能跑得出来?

在这一背景下,粤港澳大湾区数字经济研究院(IDEA)与瑞士洛桑联邦理工学院(EPFL)的研究者提出 BioMD,一个面向蛋白 — 配体全原子系统的长时程轨迹生成模型。研究论文被 ICLR 2026 录用。



论文链接:https://openreview.net/forum?id=LQDeJk6NOr

项目主页:https://github.com/IDEA-XL/BioKinema



图 1 | 配体 RMSD 随帧间隔的变化(左)与配体解离轨迹示例(右)。短时尺度内构象变化温和、长时程可出现显著位移,为分层生成框架提供了直觉动机。

技术痛点:「会画静态结构」与「会跑动力学」之间有多远?

现有路线大致可分为两类,两类都有各自的天花板:

  • 构象生成类模型(如 AlphaFold 3、ConfDiff):擅长预测结构快照,但无法给出时序连续的轨迹,更无法描述配体解离这类稀有事件。
  • 轨迹生成类模型(如 NeuralMD、MDGen):尝试对动力学建模,但前者将蛋白视为静止只考虑配体运动,后者专为蛋白设计,均不支持蛋白 — 小分子全原子联合建模。

更底层的难点在于误差累积:「长轨迹」意味着在高维构象空间里走出连贯路径,如果逐帧生成,误差会随时间滚雪球式放大。



图 2 | BioMD 方法总览。(a) 两阶段分层:粗粒度预测(Forecasting)与细粒度插值(Interpolation);(b) 时间调度:已知帧无噪声(τ=1),待生成帧从纯噪声出发(τ=0)经迭代恢复,「噪声即掩码」让两任务共享同一套网络。

核心洞察:把「长轨迹」拆成「先粗后细」两段问题

BioMD 的出发点来自 MD 数据中一条经验规律:在短时间隔内,配体构象变化往往相对温和;而在长间隔上,可能出现显著位移乃至解离(图 1)。团队据此把长时程生成拆成两个协同阶段:

  • 粗粒度预测(Forecasting):先对轨迹做稀疏采样(每隔 k=10 步取一帧),在「关键帧」序列上学习大跨度演化 —— 先搭出轨迹骨架。
  • 细粒度插值(Interpolation):在相邻关键帧之间补全中间帧,以两端锚点为条件在局部把运动补连贯。

两阶段并非两套独立模型,而是被统一进同一个条件流匹配框架中,仅通过不同的输入掩码模式切换任务。这一设计让有效序列长度大幅缩短,从而抑制误差累积的根本来源。

「噪声即掩码」:两任务一套网络的统一训练框架

团队采用条件流匹配(Conditional Flow Matching)训练速度场模型。对轨迹序列的每一帧施加独立噪声调度:已知的条件帧保持「干净」(τ=1),待生成帧从纯噪声出发(τ=0)迭代恢复。通过「噪声即掩码」策略 —— 将噪声水平视为帧是否已知的指示器 —— 预测与插值只需用不同的掩码模式控制,复用同一速度场网络 u_θ。

直观理解:模型「一次看整条轨迹」,通过掩码告知哪些时刻是锚点、哪些需要生成,从而把长程建模难点拆解为可训练的子问题。这一思路借鉴了 Diffusion Forcing 中逐帧独立噪声的设计哲学,并将其扩展到蛋白 — 配体联合轨迹生成场景。

在网络架构上,BioMD 直接在全原子笛卡尔坐标上工作,由 SE (3) 等变图 Transformer 编码初始构象的空间几何约束,再由 FlowTrajectoryTransformer 在整条轨迹上同时建模帧内原子交互(AttentionPairBias)与跨帧时序依赖(TemporalAttention)。训练目标中还引入键长约束、碰撞惩罚与几何中心损失三类辅助项,将基本物理合理性直接写入优化过程。



图 3 | BioMD 详细架构。预测 / 插值两种模式共用同一速度场网络,由 SE (3) 图编码器提取条件表征,FlowTrajectoryTransformer 同时处理帧内空间交互(AttentionPairBias)与跨帧时序依赖(TemporalAttention)。

实验结果:动力学生成性能验证

MISATO:配体口袋内动力学

MISATO 聚焦配体在结合口袋内的短时程动力学,每条轨迹含 100 帧(8ns MD 采样)。BioMD 在物理稳定性指标(键长 / 键角误差、位阻碰撞率)上大幅优于所有对比方法,碰撞率比 NeuralMD 低约两个数量级。配体 RMSF 皮尔逊相关系数达到 0.486,比 NeuralMD 高出 42.8%;蛋白 RMSF 相关系数 0.685,而对比方法均无法模拟蛋白构象变化。



图 4 | MISATO 测试集构象集合对比(6DGE、3FCF)。BioMD 生成的构象分布与配体扭转角分布与传统 MD 参考高度吻合。

DD-13M:配体解离路径

DD-13M 关注更具挑战性的配体解离场景。采用自回归(AR,块大小 j=5)生成策略的 BioMD-rel,在解离成功率上表现突出:单次尝试成功率 70.9%(@1),10 次尝试内成功率高达 97.1%(@10)。效率上,metadynamics 找到首条路径约需 1 小时(2654 步),BioMD 仅需 10 秒以内(50 步粗粒度帧)。



图 5 | 6EY8 配体解离路径。BioMD 不仅复现了 metadynamics 发现的两条已知路径,还独立发现了第三条新路径(绿色标注),路径 RMSD 仅 0.24 Å(metadynamics = 0.12 Å)。

ATLAS:蛋白单链动力学

在蛋白单链 100ns 动力学基准 ATLAS 上,BioMD 在 13 项指标中 9 项达到 SOTA,全局 RMSF 相关系数 0.76,比 MDGen 提升 52%,在多项分布准确性指标上也超越领先的序列方法 EBA。生成 100ns 轨迹约需 56 秒,比传统 MD 快数个数量级。

意义与展望

BioMD 想传递的信号很明确:当生成模型不只追求「一张漂亮的静态结构」,而是尝试在全原子层面给出可检验的动力学轨迹时,计算化学与药物发现或许能多一条「算得长、跑得快」的路。分层生成策略有效缓解了长轨迹中误差逐帧放大的老难题;而全原子级别的建模方式,让蛋白和配体可以被放在同一个框架里一起模拟,无需为了降低计算成本而牺牲原子级精度。

BioMD 能否真正融入工业药物发现流程,还需要在更大体系、更长时间尺度(微秒 — 毫秒)以及更多物理可观测量上接受严格检验。我们期待与开源社区共同探索更多可能。

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
埃尔多安罕见放狠话:巴基斯坦若不介入,土耳其或直接踏入以色列

埃尔多安罕见放狠话:巴基斯坦若不介入,土耳其或直接踏入以色列

精彩启程
2026-04-14 12:41:43
两分钟内连震两次,中国地震台网:四川内江市资中县发生3.9地震

两分钟内连震两次,中国地震台网:四川内江市资中县发生3.9地震

环球网资讯
2026-04-13 17:20:19
这游戏把"开高达"做成了真事,日本玩家众筹140%求它别死

这游戏把"开高达"做成了真事,日本玩家众筹140%求它别死

像素与芯片
2026-04-13 13:15:19
斯诺克世锦赛资格赛审判轮对阵出炉!9名中国球员全力冲击正赛

斯诺克世锦赛资格赛审判轮对阵出炉!9名中国球员全力冲击正赛

莼侃体育
2026-04-14 11:36:36
萝莉岛大雷出现!比想象中炸裂,牵扯多国总统,难怪爱泼斯坦必死

萝莉岛大雷出现!比想象中炸裂,牵扯多国总统,难怪爱泼斯坦必死

离离言几许
2026-02-02 21:16:35
女生主动起来有多黏人?网友:这些女的太开放了

女生主动起来有多黏人?网友:这些女的太开放了

带你感受人间冷暖
2026-01-27 00:20:06
6.8万紫貂被扯坏后续:女子丢工作后道歉,黑历史被扒,全网社死

6.8万紫貂被扯坏后续:女子丢工作后道歉,黑历史被扒,全网社死

小徐讲八卦
2026-04-12 15:43:13
没想到,张雪机车夺冠8天后,台湾馆长竟因一特殊举动口碑暴涨

没想到,张雪机车夺冠8天后,台湾馆长竟因一特殊举动口碑暴涨

梨花黛娱
2026-04-13 15:43:12
中国跳水队公布世界杯总决赛名单:陈芋汐、陈艺文在列

中国跳水队公布世界杯总决赛名单:陈芋汐、陈艺文在列

懂球帝
2026-04-13 22:48:15
芒果台踩雷!赵子琪被淘汰后直播开撕,她的过往连张朝阳都忌惮

芒果台踩雷!赵子琪被淘汰后直播开撕,她的过往连张朝阳都忌惮

小徐讲八卦
2026-04-12 06:23:01
水到渠成的好运!4月下旬赚钱速度越来越快,越来越轻松的3生肖

水到渠成的好运!4月下旬赚钱速度越来越快,越来越轻松的3生肖

毅谈生肖
2026-04-14 10:17:01
“新型啃老”已来了,比“传统啃老”更严重,很多父母还没认识到

“新型啃老”已来了,比“传统啃老”更严重,很多父母还没认识到

芭比衣橱
2026-04-14 11:43:20
勒温:利马拽我头发被罚下场?规则又不是我制定的,我不记仇

勒温:利马拽我头发被罚下场?规则又不是我制定的,我不记仇

懂球帝
2026-04-14 05:27:14
77年李德生探望叶帅,席间叶帅突然提点:你去看看你们的老政委

77年李德生探望叶帅,席间叶帅突然提点:你去看看你们的老政委

掠影后有感
2026-04-14 10:04:25
第三波来了!多架专机直飞中国,东南亚11国选边站,中方已致贺电

第三波来了!多架专机直飞中国,东南亚11国选边站,中方已致贺电

书纪文谭
2026-04-13 16:06:20
三天闪电访华!苏林急得直跺脚,东南亚集体掉头靠向中国

三天闪电访华!苏林急得直跺脚,东南亚集体掉头靠向中国

安珈使者啊
2026-04-14 09:30:18
粟裕那一枪,到底是打歪了,还是故意打歪的

粟裕那一枪,到底是打歪了,还是故意打歪的

鹤羽说个事
2026-03-30 22:03:41
伊朗军方:若伊朗港口受威胁 波斯湾任何港口都不安全

伊朗军方:若伊朗港口受威胁 波斯湾任何港口都不安全

新京报
2026-04-13 15:25:21
杨贵妃没有死,被安倍仲麻吕带到了日本,生下了安倍晴明(上)

杨贵妃没有死,被安倍仲麻吕带到了日本,生下了安倍晴明(上)

青山易观
2024-09-23 23:22:48
96年,军委给清贫度日的李敏副军级待遇,李:父母是父母,我是我

96年,军委给清贫度日的李敏副军级待遇,李:父母是父母,我是我

旧史新谭
2026-04-14 01:45:21
2026-04-14 14:55:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1277文章数 226关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

体育要闻

他做对了所有事,却被整个职业网坛放逐了八年

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印受审当庭表示认罪悔罪

汽车要闻

长城欧拉5限定版纯电版上市 限量99台售价13.38万元

态度原创

家居
房产
数码
本地
时尚

家居要闻

现代融合 自然灵动

房产要闻

改善标杆,1.5w+起横扫国兴!海口楼市,打出最猛一张牌!

数码要闻

TCL T7M Pro体验:SQD-Mini LED技术加持,客厅换代首选

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

今年科切拉的风吹向了谁?

无障碍浏览 进入关怀版