网易首页 > 网易号 > 正文 申请入驻

基于图像与动态轨迹预训练的蛋白质-配体结合表征学习框架

0
分享至



作者 | 论文团队

编辑 | ScienceAI

在药物研发中,对蛋白质 - 配体结合 (PLB) 关系的预测起着关键作用。然而传统实验方法在检测 PLB 关系时需要消耗大量的人力与物力;现在虽然拥有很多基于人工智能方法实现 PLB 预测的模型,但其对 PLB 关系预测的精确度还不能满足药物开发的需求。

为了提升 PLB 预测的效果,深圳职业技术大学、湖南大学等团队基于蛋白质与配体结合过程进行了建模,提出了一种基于图像的蛋白质 - 配体结合表征学习框架 ——ImagePLB。该框架实现了以下目标:

1. 采用多视角图像进行配体特征提取,有效避免了基于图结构的特征提取对原子数量的敏感性问题;

2. 实现了对配体图像 - 蛋白质口袋的结合表征提取,从而获得高质量的 PLB 表征;

3. 基于复合物的四维柔性动力学轨迹数据进行了预训练,进一步提升模型性能。

该研究的论文以《An Image-based Protein-Ligand Binding Representation Learning Framework via Multi-Level Flexible Dynamics Trajectory Pre-training》为题,已发表在《Bioinformatics》期刊上。



论文地址:https://doi.org/10.1093/bioinformatics/btaf535

开源地址:https://github.com/HongxinXiang/ImagePLB

团队采用多视角图像作为配体特征,并基于蛋白质与配体的动态结合过程,提出了一种基于 Transformer 架构的绑定表征学习器 (BRL),以实现配体特征与结合位点中各氨基酸特征的融合提取,为 PLB 分析任务提供了高质量的蛋白质 - 配体融合特征。

同时,为了提升 PLB 分析任务的自监督学习能力,研究团队在相互作用过程中引入了时间概念,并通过四维柔性动力学轨迹实现了对 ImagePLB 的预训练任务。



图 1.(a) EGNN、SE (3)-Transformer 和 ResNet18 在 PDBbind-30 数据集训练集、验证集和测试集上的 1000 个训练周期性能表现。(b) EGNN 和 ResNet18 在不同最大原子长度下的 PDBbind-30 性能对比。(c) 提出的蛋白质 - 配体结合 (PLB) 表征学习框架 (ImagePLB)。

算法流程及模型结构

为了实现高质量 PLB 关系分析的任务,研究团队构建了 ImagePLB 框架以完成该任务,并且为 ImagePLB 框架设计了预训练策略与训练策略。



图 2.ImagePLB 总体架构

研究团队在使用多视角图像对配体特征进行提取的基础上,引入 Transformer 来对蛋白质 - 配体复合物动态结合过程进行模拟。同时,研究团队还设计了基于四维数据的后续轨迹预测任务 MLNTP 实现对 ImagePLB 的预训练并构建了基于指数函数的轨迹正则化机制,解决了由相邻轨迹过于相似引起的模型坍塌问题。

实验结果与性能提升

为了验证本文工作的有效性,研究团队使用 ResNET18 作为 LRL 的编码器,EGNN 作为 PRL 的编码器。在 MISATO (~20,000 个实验蛋白质 - 配体复合物的分子动力学模拟数据) 数据集上完成预训练之后,使用了 PDBbind-30、PDBbind-60、PDBbind-scaffold 以及 LEP 这四个常用基准数据集对模型性能进行验证。



图 3.PDBind 数据集实验结果

研究团队在 PDBind 数据集上为 ImagePLB 设置了 PLB 关系亲和力预测这一回归任务,ImagePLB 及其增强版本 ImagePLB-P 在多个指标上均优于现有模型,充分证明了该框架的有效性。



图 4.LEP 数据集实验结果

在 LEP 数据集上,研究团队为 ImagePLB 设计了 PLB 配体效能预测分类任务。如图 4 所示,ImagePLB 拥有极强的竞争力,其将为蛋白质 - 配体结合表征学习领域的研究范式提供新的理论基础。



图 5.PDBbind-30-nonoverlap 数据集实验结果

为进一步评估模型在蛋白质与配体对上的泛化能力,研究团队基于 PDBbind-30 数据集进一步加强了配体非重叠性约束以构建新的数据集 PDBbind-30-nonoverlap。图 5 结果显示,ImagePLB 和 ImagePLB-P 取得了最佳性能,表明了 ImagePLB 和 ImagePLB-P 框架具有较强泛化能力。

为了对各策略的有效性进行验证,研究团队针对 LRL 模块、预训练策略以及轨迹正则化策略设计了对应的消融实验,比较了:

1. 使用 ResNET18 实现基于图像的配体特征提取 / 使用 EGNN 实现基于结构的配体特征提取;

2. (使用 / 不使用) 预训练策略 (ImagePLB /ImagePLB-P);

3. (使用 / 不使用) 轨迹正则化策略 (w/o TR)。



图 6.LRL 模块消融实验结果

图 6 表明,当用图像替代配体结构数据时,在 PDBbind-30 和 PDBbind-60 数据集上的结果均表明了图像能有效增强模型捕捉配体 - 蛋白质相互作用的能力。

在对预训练策略进行分析时,研究团队结合图 3 与图 4 结果进行了分析。如图 3 和图 4 显示,ImagePLB-P 在几乎所有数据集上都优于 ImagePLB,充分证明了所提出的预训练策略的有效性。



图 7. 轨迹预测任务在未使用和使用轨迹正则化策略时的预训练损失对比



图 8.ImagePLB、ImagePLB-P 及不含轨迹正则化策略的 ImagePLB-P 对比

在验证轨迹正则化策略有效性时,研究团队首先对比了引入与不引入轨迹正则化的预训练损失。图 7 与图 8 所示结果充分证明了轨迹正则化的优势,能有效防止模型在理解蛋白质 - 配体结合的动态过程时所出现的模型坍塌问题。

总结与展望

在本研究中,研究团队明确了基于图的蛋白质 - 配体结合(PLB)分析面临两大挑战:一是难以获取高质量的蛋白质 - 配体结合表征,二是对最大原子数量敏感。为解决这些问题,团队提出了 ImagePLB 框架。ImagePLB 展示了将图像表示与动态轨迹预训练引入蛋白质 - 配体结合学习的新范式,克服了这两个挑战,向「智能药物设计基础模型」迈出了关键一步。

未来,研究团队期待将这一框架进一步扩展到多肽、抗体等大分子相互作用预测中,并融合结合动力学、毒性、代谢稳定性等多目标属性优化,从而推动 AI 在虚拟筛选与先导化合物优化领域真正走向实际药物研发。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
押注中国!泰王罕见访华,三大诉求曝光,东南亚风向要变了

押注中国!泰王罕见访华,三大诉求曝光,东南亚风向要变了

特特农村生活
2025-11-10 01:45:07
吴宜泽爆冷夺冠!赛后来听听各界媒体专家怎么说,含金量太高了

吴宜泽爆冷夺冠!赛后来听听各界媒体专家怎么说,含金量太高了

老糿尾声体育解说
2025-11-09 23:44:33
人在医院可以无知到啥地步?网友:智商低的人反而是生育主力军

人在医院可以无知到啥地步?网友:智商低的人反而是生育主力军

带你感受人间冷暖
2025-11-09 00:20:03
泰王为何此时破例访华?专家:不只为了旅游和铁路,有三大信号!

泰王为何此时破例访华?专家:不只为了旅游和铁路,有三大信号!

达文西看世界
2025-11-09 17:18:23
三部门联合发文:3至6岁儿童尽量避免接触使用视屏类电子产品

三部门联合发文:3至6岁儿童尽量避免接触使用视屏类电子产品

快科技
2025-11-08 14:30:13
杜兰特15中11砍31分!火箭逆转胜雄鹿 字母哥37分罚丢关键球

杜兰特15中11砍31分!火箭逆转胜雄鹿 字母哥37分罚丢关键球

罗说NBA
2025-11-10 07:11:20
斯洛特:面对曼城我们很难把球从后场传出来,也很难保住球权

斯洛特:面对曼城我们很难把球从后场传出来,也很难保住球权

懂球帝
2025-11-10 03:45:25
15小时亏损百亿,订单暴跌9%,跨境电商为何集体倒戈中国平台?

15小时亏损百亿,订单暴跌9%,跨境电商为何集体倒戈中国平台?

削桐作琴
2025-11-07 14:57:56
卡地亚晚宴:巩俐显老态,宋佳那英合唱,郭晶晶换发型气质都变了

卡地亚晚宴:巩俐显老态,宋佳那英合唱,郭晶晶换发型气质都变了

妙知
2025-11-09 19:54:56
承认打不赢广东队?四川最强核心拒绝夺金,目标仅仅只是打进前3

承认打不赢广东队?四川最强核心拒绝夺金,目标仅仅只是打进前3

绯雨儿
2025-11-09 11:53:06
雷军这回栽了,小米法务被这个女人拿捏,太打脸

雷军这回栽了,小米法务被这个女人拿捏,太打脸

公子麦少
2025-11-07 14:39:17
世界排名更新!吴宜泽飙升九位,丁俊晖中国最高特鲁姆普继续第一

世界排名更新!吴宜泽飙升九位,丁俊晖中国最高特鲁姆普继续第一

世界体坛观察家
2025-11-10 00:02:31
茅台跌破1499,从“神话”回归现实?

茅台跌破1499,从“神话”回归现实?

观澜商业
2025-11-09 23:39:19
战后越南是怎样快速恢复人口的?这个办法太狠,我们永远不会学

战后越南是怎样快速恢复人口的?这个办法太狠,我们永远不会学

小影的娱乐
2025-11-09 14:08:10
解放军强势压制,萧美琴飞离欧洲,返台前留下2句话,态度很嚣张

解放军强势压制,萧美琴飞离欧洲,返台前留下2句话,态度很嚣张

影孖看世界
2025-11-09 18:26:19
17分钟视频后续来了!主要是这几点

17分钟视频后续来了!主要是这几点

魔都姐姐杂谈
2025-11-09 15:45:32
悲剧!宝马车女司机被侧翻的渣土车砸死,家里有孩子在等她

悲剧!宝马车女司机被侧翻的渣土车砸死,家里有孩子在等她

魔都姐姐杂谈
2025-11-09 19:09:17
澳媒提醒特朗普:中国不但是社会主义国家,而且运行得相当不错

澳媒提醒特朗普:中国不但是社会主义国家,而且运行得相当不错

南宫一二
2025-11-09 19:46:27
深度 | 【锂电+储能】产业链最核心的 10 家上市公司

深度 | 【锂电+储能】产业链最核心的 10 家上市公司

飞跑的鹿
2025-11-09 20:38:18
中国空姐入职新航一天就被炒的瓜

中国空姐入职新航一天就被炒的瓜

吃瓜体
2025-11-08 21:25:40
2025-11-10 07:35:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1142文章数 218关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

美俄核对抗即将“零约束” 人类面临挑战

头条要闻

美俄核对抗即将“零约束” 人类面临挑战

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

艺术
手机
游戏
公开课
军事航空

艺术要闻

Kelly Birkenruth:美国当代现实主义画家

手机要闻

愈演愈烈!iPhone半夜“偷拨号”持续发酵,疑似iOS26的锅?

《暗黑四》又在藏什么?官方暗示TGA有新内容!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄媒:俄军即将攻占乌克兰"第三首都"

无障碍浏览 进入关怀版