网易首页 > 网易号 > 正文 申请入驻

提升10,000倍,深度图学习加速RNA虚拟筛选,助力药物靶标发现

0
分享至

编辑 | 萝卜皮

RNA 是尚未开发的药物靶标的巨大宝库。基于结构的虚拟筛选 (VS) 利用结合位点信息识别候选分子,传统上采用分子对接模拟。然而,对接很难在大型化合物库和 RNA 靶标中扩展。

机器学习提供了一种解决方案,但由于数据和实际评估有限,它在 RNA 方面的开发仍不够充分。

麦吉尔大学(McGill University)、马克斯普朗克生物化学研究所(Max Planck Institute of Biochemistry)、巴黎综合理工学院(Ecole Polytechnique)的研究人员提出了针对 RNA 量身定制的数据驱动 VS 流程,利用粗粒度 3D 建模、合成数据增强和 RNA 特定的自我监督。

该模型实现了对接速度的 10,000 倍提升,同时在结构不同的测试集上将活性化合物排在前 2.8%。它对结合位点变异具有很强的稳健性,并成功地从 20,000 种化合物体外微阵列中筛选出未知的 RNA 核糖开关,平均富集因子为 2.93,1% 。这标志着基于结构的 RNA VS 深度学习首次通过实验验证获得成功。

该研究以「RNAmigos2: accelerated structure-based RNA virtual screening with deep graph learning」为题,于 2025 年 3 月 21 日发布在《Nature Communications》。

只有一小部分 RNA 编码蛋白质,而 ncRNA 目前已知在广泛的生物过程中发挥着关键作用。例如,大约 2000 个基因编码 micro-RNA,而 micro-RNA 又影响 60% 基因的表达。尽管 micro-RNA 无处不在,但第一种 RNA 靶向药物 risdipalm 直到最近才获得 FDA 批准,而且几乎所有市售的小分子疗法仍然以蛋白质为靶点。

靶向 RNA 的能力将大幅增加可用药物的空间,并在过度使用的蛋白质靶点不足的情况下提供替代方案。例如,lncRNA 可以代表肿瘤学中有趣的治疗靶点,而蛋白质靶点可能过于专业化。RNA 靶标也代表了治疗缺乏蛋白质靶标的疾病(如三阴性乳腺癌)的一种途径。

在此背景下,RNA 越来越被认为是开发新型小分子疗法的有前途的靶标家族,这凸显了对 RNA 药物发现的有效工具的需求。

在最新的研究中,麦吉尔大学等机构的研究人员提出了一种基于结构的 RNA 虚拟筛选方法——RNAmigos2,该方法与分子对接相比只需极短的时间,为大规模基于靶标的 RNA 药物发现打开了大门。

RNAmigos2 旨在使用查询 RNA 结构快速筛选配体库中的结合物。其工作流程如下图所示,以候选结合位点结构(作为完整 3D 或碱基配对网络)和要筛选的化合物列表作为输入。然后,该工具会为每种化合物返回一个反映结合可能性的分数。

图示:RNAmigos2 化合物筛选流程概述。(来源:论文)

RNAmigos2 架构

RNAmigos2 模型采用编码器-解码器框架,具有两个编码器和两个解码器,每个编码器和解码器都在不同的数据源上进行训练。两个编码器分别将输入的 RNA 结合位点和小分子映射到嵌入中。RNA 3D 结构表示为一个称为 2.5D 图的图,该图对结构中发生的所有规范(Watson-Crick 和 Wobble)和非规范碱基对相互作用进行编码。

这种表示使研究人员能够用适合机器学习框架的离散数学对象捕捉 RNA 3D 结构的关键特征,并且被证明是 RNA 化学信息学应用的有用生物学先验。

RNA 编码器以 2.5D 图作为输入,并学习使用自监督训练方案在所有可用的非冗余 RNA 子结构上生成 RNA 表征。配体以分子图表示。配体编码器使用在 中提出并在大量化合物数据集上训练的变分自动编码器模型来学习配体的神经表征。

为了训练解码器,研究人员从 PDB 中提取了 1740 个 RNA-配体复合物,并将它们分组到 436 个相似的结合位点簇中,他们使用 RMAlign 以 0.75 的相似性阈值识别了这些结合位点。这种方法代表了对 RNA 药物靶标关联预测的严格基于结构的划分。

第一个解码器 (Compat) 被训练为二元分类器,以区分结合位点的天然配体和诱饵。此外,为了综合增加 PDB 化合物的有限数量和药物相似性,研究人员进行了大规模对接实验,将 500 种药物类 ChEMBl 化合物对接在 1740 个结合位点上。

第二个解码器经过训练后,可以使用对接数据预测结合亲和力 (Aff)。给定一个结合位点和配体列表,研究人员对所有对象进行编码,并使用联合解码器预测可用于虚拟筛选的兼容性分数。之后,该团队通过模型为活性化合物分配高分的能力来衡量模型的性能,而不是为非活性(诱饵)化合物池分配高分。

图示:RNAmigos2 模型集成基准。(来源:论文)

性能强悍

测试显示,该模型运行速度比对接快一万倍以上。尽管运行时间仅需数秒而非数小时,但所提出的方法可检索到更高的分子对接富集因子(候选配体列表的前 2.8% vs 4.1%)。

这一结果对口袋身份相对敏感,但对口袋扰动足够稳健,可与现代口袋挖掘算法结合使用。此外,通过将模型与得分最高的化合物的实际对接分数相结合,研究人员设法将对接错误率降低了四倍,所用时间减少了四分之一。

图示:RNAmigos2 辅助的虚拟筛选效率。(来源:论文)

团队在独立的大规模(25k 种化合物)体外结合筛选中确定了该工具的性能,并表明它在两个 CPU 核心分钟内提供了 2.93 的 1% 的富集因子。这些结果共同确立了 RNAmigos2 作为基于结构的 RNA 虚拟筛选的最新水平。研究人员已经公开发布了他们所有的数据集、源代码和模型权重,希望激发社区朝着这个重要方向努力。

相关代码:

https://doi.org/10.5281/zenodo.14803961

https://github.com/cgoliver/rnamigos2/

目前,该方法的局限性包括需要预定义的结合位点,为此需要开发与结合位点预测器的集成,以及对结合位点灵活性进行建模。

未来研究的一个有趣方向是研究使用其他对接工具来训练其他模型,从而产生快速替代模型,这些替代模型可能因不同的评分函数而产生不同的错误模式。

研究人员设想,RNAmigos2 等工具将与迅速兴起的以 RNA 为中心的分子设计技术和新发布的支持核酸的 AlphaFold3 发挥协同作用,为下一代 RNA 药物发现铺平道路。

值得注意的是,该方法具有独特的优势,只需手头有低分辨率结构数据(例如碱基对相互作用)即可实现基于结构的 RNA 虚拟筛选。鉴于潜在的 RNA 靶标数量惊人,这一特性可能成为挖掘整个基因组并全面迎接 RNA 治疗时代的重要资产。

论文链接:https://www.nature.com/articles/s41467-025-57852-0

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“这真是玩手机玩的”,8岁女孩吃饭姿势怪异,网友都看不下去了

“这真是玩手机玩的”,8岁女孩吃饭姿势怪异,网友都看不下去了

妍妍教育日记
2026-03-22 08:30:09
3天暴跌40%!被套牢的中国大妈,该醒醒了:黄金从来不是避险资产

3天暴跌40%!被套牢的中国大妈,该醒醒了:黄金从来不是避险资产

社会日日鲜
2026-03-22 07:07:19
名嘴郭正亮解释“为什么不上少康战情室节目了”

名嘴郭正亮解释“为什么不上少康战情室节目了”

总在茶余后
2026-03-23 01:15:52
武汉七旬老人呼吸困难,自行拿剪刀捅胸,胸腔插着自制引流管,连接矿泉水瓶“排气”,医生紧急提醒!

武汉七旬老人呼吸困难,自行拿剪刀捅胸,胸腔插着自制引流管,连接矿泉水瓶“排气”,医生紧急提醒!

台州交通广播
2026-03-20 23:17:07
难以置信!深圳1100套安居房,价格1.7万左右,居然只有1人选房了

难以置信!深圳1100套安居房,价格1.7万左右,居然只有1人选房了

火山詩话
2026-03-21 17:00:09
捷克布拉格或爆发大规模抗议!超40万人走上街头

捷克布拉格或爆发大规模抗议!超40万人走上街头

项鹏飞
2026-03-22 20:12:16
张本一家遭重罚!240万罚单,津贴暂停,教练执照终止,上亿广告费无缘

张本一家遭重罚!240万罚单,津贴暂停,教练执照终止,上亿广告费无缘

最爱乒乓球
2026-03-23 00:09:35
国际大跌11%,国内油价却没降?3月23日调价真相来了

国际大跌11%,国内油价却没降?3月23日调价真相来了

刘哥谈体育
2026-03-23 01:22:17
上海出了一家水变油的“科技”公司?财联社还帮忙宣传,全是一伙诈骗犯

上海出了一家水变油的“科技”公司?财联社还帮忙宣传,全是一伙诈骗犯

回旋镖
2026-03-22 10:31:37
反转太突然!重庆举报案:上午道歉,下午纪委火速介入

反转太突然!重庆举报案:上午道歉,下午纪委火速介入

陈博世财经
2026-03-22 10:49:17
特朗普要炸电厂伊朗要炸水厂,波斯湾更危险了 | 京酿馆

特朗普要炸电厂伊朗要炸水厂,波斯湾更危险了 | 京酿馆

新京报评论
2026-03-22 17:39:56
3·15曝光:成本40元液化气卖130元,农村咋就成垄断高价重灾区?

3·15曝光:成本40元液化气卖130元,农村咋就成垄断高价重灾区?

复转这些年
2026-03-22 15:13:18
微信可以用“龙虾”了!网友:太方便了

微信可以用“龙虾”了!网友:太方便了

中国日报
2026-03-22 13:38:23
日本台湾油价接连下跌,大陆油价却疯涨至9元,差异原因一目了然

日本台湾油价接连下跌,大陆油价却疯涨至9元,差异原因一目了然

策略述
2026-03-22 23:07:05
斯诺克世界公开赛:塔猜亚打出147,10-7逆转奥沙利文夺冠

斯诺克世界公开赛:塔猜亚打出147,10-7逆转奥沙利文夺冠

懂球帝
2026-03-22 21:40:37
演员王传君发文宣布退出

演员王传君发文宣布退出

TVB的四小花
2026-03-22 20:11:19
巩俐年轻时这张剧照,演技真实到四十+全破防

巩俐年轻时这张剧照,演技真实到四十+全破防

小椰的奶奶
2026-03-22 21:43:29
女教师卖自拍淫秽视频获利24万,将自己裸体视频与和他人的性爱视频通过发送链接,出售给他人观看

女教师卖自拍淫秽视频获利24万,将自己裸体视频与和他人的性爱视频通过发送链接,出售给他人观看

观威海
2026-03-22 07:59:02
上海春节后首次重返20℃,下周气温比前期整体上升一小个台阶

上海春节后首次重返20℃,下周气温比前期整体上升一小个台阶

澎湃新闻
2026-03-22 18:12:29
快扔掉!戴一天,辐射量相当于拍117次胸片

快扔掉!戴一天,辐射量相当于拍117次胸片

FM93浙江交通之声
2025-10-28 00:01:43
2026-03-23 04:00:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1257文章数 226关注度
往期回顾 全部

科技要闻

嫌台积电太慢 马斯克要把芯片产能飙升50倍

头条要闻

媒体:特朗普48小时通牒砸向伊朗 不排除美国铤而走险

头条要闻

媒体:特朗普48小时通牒砸向伊朗 不排除美国铤而走险

体育要闻

46岁生日快乐!巴萨全队穿10号致敬小罗

娱乐要闻

47岁“国际章”身材走样?让嘲笑她的人闭嘴

财经要闻

睡梦中欠债1.2万?这只“虾”杀疯了

汽车要闻

14.28万元起 吉利银河星耀8远航家开启预售

态度原创

手机
亲子
艺术
家居
公开课

手机要闻

华为蝉联榜首,苹果紧追不舍,OPPO、vivo、小米、荣耀差距不大!

亲子要闻

孩子无意中说这样的话,可能隐藏求救信号,宝妈们要警惕!

艺术要闻

如此美妙的光影,安静而温暖,真令人折服!

家居要闻

时空交织 空间绮梦

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版