网易首页 > 网易号 > 正文 申请入驻

ICLR 2025 | Deep Signature 高效表征生物大分子复杂运动的方法

0
分享至

编辑 |ScienceAI

理解蛋白质动力学行为对于解析其功能机制和开发分子疗法至关重要。然而,生物过程通常涉及复杂的高维动力学以及原子间相互作用,这对现有计算处理技术构成了巨大挑战。

本文介绍了来自香港城市大学李皓亮研究团队所提出的 Deep Signature,一个用于生物大分子复杂运动表征学习的深度学习框架。该框架能够高效地表征分子构型的动态变化,并适用于多种下游任务。该论文已接受于ICLR`2025

论文题目:Deep Signature: Characterization of Large-Scale Molecular Dynamics

论文地址:https://openreview.net/pdf?id=xayT1nn8Mg

开源代码:https://github.com/WonderSeven/Deep-Signature

研究背景

生物过程在分子层面上主要受大分子(特别是蛋白质和酶)构象动态变化的驱动。这些构象变化决定了诸如蛋白–配体结合、分子运输和酶促反应等关键生物事件。

因此,深入解析这些分子动力学行为对于理解分子功能和药物设计至关重要。分子动力学 (Molecular Dynamics, MD) 模拟基于密度泛函理论,能够高精度地生成每个原子在三维构象空间中的轨迹,是目前研究分子动态机制的重要计算工具。

尽管 MD 模拟技术取得了显著进展,但对其高维轨迹数据的分析仍然面临重大挑战。这一挑战主要源于大规模分子体系中复杂的原子间相互作用,以及跨越不同时间尺度的动态行为。

目前,许多研究采用简化的生物物理模型来分析特定的动力学特征,如波动、弛豫时间、稳定性和状态转换等。

然而,随着高性能计算,尤其是 GPU 加速深度学习的发展,研究人员开始尝试使用数据驱动的方法自动学习 MD 轨迹的分子表示。例如,近年来的研究利用体素化建模和蛋白表面建模等方法提取分子结构和化学特征,以进行自动化药物发现。

不过,这些方法的计算复杂度随时间步数呈线性增长,难以适用于长时间尺度的 MD 模拟。

当前 MD 轨迹分析的另一大局限性在于对生物结构信息的利用不足。这主要是因为,在动态过程中处理原子间高阶相互作用的计算复杂度极高,这一复杂度通常至少随系统大小呈二次增长,而生物结构信息涉及的共价键与非共价键相互作用对分子功能至关重要。

现有研究尚未对此进行深入探索,这一研究空白限制了我们对分子行为的全面理解,也影响了药物设计和耐药性研究的精确预测。

此外,一个理想的分子运动表征方法除了能解决上述挑战外,还需具备如几何对称性(如平移、旋转不变性)、对于异质的分子结构的泛化性和一定的可解释性。该任务不同于传统的时间序列分类和时空数据分析,现有技术无法直接处理。因此,我们迫切需要为大规模 MD 数据分析设计新的深度学习框架。

模型部分

图一

作者提出了一种计算高效的框架——Deep Signature,它结合生物结构信息与粗粒化映射(Coarse Graining),用于自动分析蛋白质轨迹动力学。

方法的整体框架如图一所示,我们可以看到Deep Signature主要由两个模块构成:

(1)深度谱聚类模块(Deep spectral clustering module), 该模块基于软谱聚类(Soft Spectral Clustering)来聚合原子的协同动态,其中聚类分配函数由图神经网络自动学习,从而避免了手动选择粗粒化映射的需求。

(2)路径签名变换模块 (Path signature transform module),路径签名(Path Signature)是一个数学上严格定义的概念,它通过迭代积分来紧凑而丰富地描述粗糙路径的几何信息,特别适用于高采样、非平滑的分子轨迹分析。

Deep Signature 的特征提取方法在理论上保证了以下关键几何对称性:平移不变性、近似旋转不变性、原子坐标排列等变性以及时间重参数化不变性,确保了其对 MD 轨迹的随机波动具有鲁棒性。

关于 Deep Signature 模型设计和具体实现的更多细节,由于比较繁杂,可以移步参阅论文。

实验结果

为了验证 Deep Signature 的有效性,作者在以下三项基准任务上进行了实验:

1. 基因调控动力学(Gene Regulatory Dynamics)

从上表可以看到 Deep Signature 在所有评测指标上均优于基线方法,右图分别对比了不同方法在模拟时间增加和系统规模扩大的表现,Deep Signature 在这两种实验场景均表现非常稳定。

2. 表皮生长因子受体(EGFR)突变动力学

3.G 蛋白偶联受体(GPCR)动力学

泛化性分析

这里使用 t-SNE 对 EGFR 的训练集(绿圈)和测试集数据(橙圈)的特征空间进行可视化,以分析路径签名变换后学习到的特征的可判别性和泛化性。

结果表明,相较于基线方法,Deep Signature 提取的特征分布更均匀,使得不同类别的样本更易区分。此外,尽管训练集和测试集的数据因原子数量变化及拓扑结构的异质性存在分布偏移,Deep Signature 依然能够学习到良好的可泛化的特征。这一优势得益于几何对称性以及层归一化的引入,从而显著提升了模型的泛化能力。

可解释性分析

我们采用Gradient⊙ Input 方法来量化所提取的 log-signature 特征中各个元素对最终预测结果的贡献,并且因为深度聚类模块仅涉及线性变换,我们可以对这些动态交互的重要性进行排序。

下图展示了在EGFR由突变引起的构型动态变化过程中,对其药物敏感性预测起关键作用的三个关键原子的交互动态:

值得注意的是,这些原子均位于铰链区域,该区域包含所有 ATP 结合位点,这一发现与实验观测结果高度一致,进一步验证了我们方法的合理性和生物学解释性。

总结

本文提出了一个用于分析大规模生物系统中动力学的深度学习框架 Deep Signature。该方法结合软谱聚类来聚合协同动态和对数路径签名变换来表征全局交互动态,所提取的表征具备平移不变性、近似旋转不变性和置换等变性等优良性质。实验结果表明,Deep Signature 在多个生物过程基准数据集上表现出色,能够有效捕捉复杂的分子交互动力学。这一研究有希望为药物发现、蛋白质工程和生物分子研究提供了新的计算工具,推动了计算分子模拟的发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
联合国爆发争端,凌晨中美大吵一架,美国犯下大错,局势已恶化

联合国爆发争端,凌晨中美大吵一架,美国犯下大错,局势已恶化

芊芊子吟
2026-02-26 11:26:11
伊朗发射法塔赫高超音速导弹

伊朗发射法塔赫高超音速导弹

界面新闻
2026-02-28 23:51:14
卡塔尔首都多哈响起爆炸声,滞留机场中国留学生目击拦截导弹空中爆炸:机场钢架都在振动,不时传来哭声,200多名同胞建群共享离境消息

卡塔尔首都多哈响起爆炸声,滞留机场中国留学生目击拦截导弹空中爆炸:机场钢架都在振动,不时传来哭声,200多名同胞建群共享离境消息

极目新闻
2026-03-01 14:06:31
中央定调,延迟退休后,62岁退休,比60岁退休的多领10%养老金?

中央定调,延迟退休后,62岁退休,比60岁退休的多领10%养老金?

另子维爱读史
2026-02-17 19:02:27
CP感真玄学,25岁陈飞宇和38岁陈晓,同演孙千爱人,但差距太明显

CP感真玄学,25岁陈飞宇和38岁陈晓,同演孙千爱人,但差距太明显

亦暖追剧随笔
2026-02-28 17:24:22
50岁舒淇和老公冯德伦回台北娘家拜年,俩人古怪玩闹,真的好欢乐

50岁舒淇和老公冯德伦回台北娘家拜年,俩人古怪玩闹,真的好欢乐

草莓解说体育
2026-03-01 12:14:23
10万亿年后的宇宙:地球早已消失不见,所有的恒星都会熄灭

10万亿年后的宇宙:地球早已消失不见,所有的恒星都会熄灭

观察宇宙
2026-02-28 19:27:39
奇怪的现象:多数中年人一旦失业,手里有存款,第一件事竟是躺平

奇怪的现象:多数中年人一旦失业,手里有存款,第一件事竟是躺平

木言观
2026-03-01 21:41:55
向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

谈史论天地
2026-02-10 08:16:24
不会哭别尬哭!看央视新剧中孙千泪如雨下,让假哭演员无地自容

不会哭别尬哭!看央视新剧中孙千泪如雨下,让假哭演员无地自容

七堇年a
2026-03-01 20:34:04
千载难逢——咆哮雄狮和史诗狂怒行动给了伊朗人决定自己命运的机会

千载难逢——咆哮雄狮和史诗狂怒行动给了伊朗人决定自己命运的机会

老王说正义
2026-03-02 00:04:14
你有知道哪些炸裂的秘密?网友:我有个秘密说出来肯定大家要笑死

你有知道哪些炸裂的秘密?网友:我有个秘密说出来肯定大家要笑死

带你感受人间冷暖
2026-01-29 00:10:05
伊朗称发射4枚导弹袭击“林肯”号航母

伊朗称发射4枚导弹袭击“林肯”号航母

新华社
2026-03-01 22:05:22
美国没想到,俄罗斯也没想到!中国石油,如今会成为“遥遥领先”

美国没想到,俄罗斯也没想到!中国石油,如今会成为“遥遥领先”

来科点谱
2026-02-20 07:16:30
中国的“斤”用了3000年,为何与国际接轨后,刚好相当于500克?

中国的“斤”用了3000年,为何与国际接轨后,刚好相当于500克?

千秋文化
2026-01-31 21:22:19
俄专家终于说出大实话,一旦爆发海战,全世界仅有一国能击败美军

俄专家终于说出大实话,一旦爆发海战,全世界仅有一国能击败美军

壹知眠羊
2026-01-08 11:34:42
突发,公司全员息岗,鼓励员工自主择业,另谋出路!

突发,公司全员息岗,鼓励员工自主择业,另谋出路!

黯泉
2026-03-01 21:38:57
中国未来最大的对手,不是特朗普,而是手握近万亿美元的马斯克?

中国未来最大的对手,不是特朗普,而是手握近万亿美元的马斯克?

钦点历史
2026-02-14 14:56:28
阿隆索下课后 维尼修斯当大腿:5场6球!皇马开启续约谈判

阿隆索下课后 维尼修斯当大腿:5场6球!皇马开启续约谈判

叶青足球世界
2026-03-01 15:52:26
场外油价飙涨10%,直冲80美元!中东局势升级,黄金原油谁更疯

场外油价飙涨10%,直冲80美元!中东局势升级,黄金原油谁更疯

21世纪经济报道
2026-03-01 20:24:11
2026-03-02 01:59:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1240文章数 224关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

媒体:美以能精准"斩首"背后 摩萨德的"手笔"令人咋舌

头条要闻

媒体:美以能精准"斩首"背后 摩萨德的"手笔"令人咋舌

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

黄景瑜 李雪健坐镇!38集犯罪大剧来袭

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

本地
房产
教育
时尚
公开课

本地新闻

津南好·四时总相宜

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

教育要闻

11年,学生平均增高5.52厘米!成都这所小学,登上教育部发布会

今年春天最流行的4件卫衣,照着穿就很好看

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版