网易首页 > 网易号 > 正文 申请入驻

超级计算机用语言模型跨物种预测蛋白-蛋白相互作用

0
分享至



在一张桌前有两个人,倘若我们能读懂他们的语言神态,那我们就能推断出下一刻他们会是争吵亦或是握手。

现在,把「人」换成蛋白质,把「话」换成氨基酸序列——蛋白质相互作用是生命过程的核心:信号传导、代谢通路、病毒入侵宿主等,都依赖特定蛋白质之间的物理接触。倘若能读懂其中的相互作用,也就能为接下来的一系列研究铺平道路。

为此,格拉斯哥大学(University of Glasgow)等的研究者提出一种方法,填补现有模型在泛化能力上的缺陷。他们把单蛋白的语言模型扩展为双蛋白的「对话识别器」,让大型蛋白质语言模型学会同时听两条序列,从中判断它们是否会相互作用(PPI)。

相关的研究以「PLM-interact: extending protein language models to predict protein-protein interactions」为题,于 2025 年 10 月 27 日发布在《Nature Communications》。



论文链接:https://www.nature.com/articles/s41467-025-64512-w

一款对接翻译器

在病毒学中,PPIs 尤其重要,因为病毒完全依赖于宿主细胞进行复制,主要通过与宿主蛋白质的特异性相互作用来实现。倘若是能读懂其中的相互作用,就能为开发针对性治疗药物带来更便捷的方法。

计算算法为大规模预测 PPI 提供了一种高效的替代方案。基于大型公共蛋白质序列数据库训练的蛋白质语言模型(PLM)被用于编码序列组成、进化和结构特征,成为表示蛋白质在最新 PPI 预测器中的首选方法。

而该研究团队所提出的 PLM-Interact,通过扩展和微调预训练的 PLM,即 ESM-2,直接建模 PPI。它能把两条蛋白序列拼接入模型,使 Transformer 的注意力能跨蛋白捕捉「配对」信息,而不是先各自编码再拼特征。



图 1:PLM-interact 与现有 PPI 预测架构的比较。

在掩码语言建模(MLM)任务之外,团队加入l二元分类任务,直接训练模型判断给定的蛋白对是否真实交互。分类损失与 MLM 损失按一定比例(paper 中选择 1:10)混合训练,且模型层被全部微调以适配这一双序列任务。

这些设计让氨基酸残基间的跨蛋白注意力成为可能:模型不再只学习「单句语法」,而能学习两条序列间的「对话格局」。该方法既保留了预训练的结构-进化信息,又把相互作用信号嵌入到语言模型内部。

跨物种提升

为了检验 PLM-interact 的性能,该模型在包含421,792对蛋白的训练集(以人类数据为主)进行训练,并与其余六种方法在物种其他物种上进行测试。

相较于六种现有方法,PLM-interact 在 AUPR(精确率-召回曲线下面积)上取得了最佳成绩:在鼠、果蝇和线虫上分别提升约2%、8%、6%(对比次优方法),在更进化上远的酵母和细菌上也有显著增益。



图 2:PLM-interact 与最先进的 PPI 预测模型的基准测试结果。

PLM-interact 的改进归因于其正确识别正 PPI 的能力:它始终将更高的相互作用概率分配给真正的阳性 PPI。相比之下,其他方法在所有保留物种中都给出了较低的相互作用概率估计。

PLM-interact 能够准确预测五个关键的蛋白质相互作用,这些相互作用控制着重要的生物学功能,包括 RNA 聚合和蛋白质运输。值得注意的是,其他蛋白质 AI 工具,包括由谷歌 DeepMind 支持的 AlphaFold3,只能预测五个蛋白质相互作用中的一个。



图 3:PLM-interact 正确预测但 TUnA 和 TT3D 未能预测的每个物种的 PPI 示例。

那么,为什么这些举措有用?

把两条序列放进同一个 Transformer,等于是把「对话」上下文纳入模型的注意力机制:模型可以直接把一个蛋白的某个残基与另一个蛋白的某个残基联系起来,形成「跨分子接触」的隐式表示。这比先各自编码再拼接特征更直接,也更容易捕捉到互作所需的互补性。

把分子当语言来读

PLM-interact 展示了一个清晰的理念:把序列看成「句子」,把相互作用看成「对话」,通过模型学习语言级别的跨分子关系,也可以在未见物种上实现高度泛化。

在超过 6.5 亿个独立参数的独立参数的背后,是研究者对开发一个能够以前所未有的规模和精度的,预测蛋白质相互作用的系统所作出的贡献。这项工作是「让超级计算机学会分子语言」的一步,把序列信息转化为可以操作的生物学推断。

https://phys.org/news/2025-10-supercomputer-ai-intricate-language-biomolecules.html

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海,八旬独居老人独居无靠,居委会联系送养儿子,儿子:凭什么

上海,八旬独居老人独居无靠,居委会联系送养儿子,儿子:凭什么

街声巷闻
2025-11-17 14:36:54
惊天大瓜!原来川普和希拉里不止是政敌,同时还是情敌。

惊天大瓜!原来川普和希拉里不止是政敌,同时还是情敌。

电动猫
2025-11-18 00:18:26
聚焦“十五五”规划建议|保持制造业合理比重

聚焦“十五五”规划建议|保持制造业合理比重

新华社
2025-11-17 15:54:02
王欣瑜耗时2小时47分钟2-1艰难战胜王曦雨,晋级全运会四强

王欣瑜耗时2小时47分钟2-1艰难战胜王曦雨,晋级全运会四强

懂球帝
2025-11-18 17:17:31
张家界荒野求生赛宣布14名选手全部进入决赛:气温骤降,不再按原计划淘汰4人

张家界荒野求生赛宣布14名选手全部进入决赛:气温骤降,不再按原计划淘汰4人

极目新闻
2025-11-18 15:19:03
捷克“炮弹计划”或终止!斯洛伐克法院关键裁决,援乌战斗机合法

捷克“炮弹计划”或终止!斯洛伐克法院关键裁决,援乌战斗机合法

鹰眼Defence
2025-11-18 17:53:12
捅完琉球窝!中国再掀北海道老底,日本80年前埋的雷,炸了

捅完琉球窝!中国再掀北海道老底,日本80年前埋的雷,炸了

南宫一二
2025-11-17 07:17:39
全运乒乓男团四强巅峰对决:马龙樊振东领衔,四大豪门谁主沉浮?

全运乒乓男团四强巅峰对决:马龙樊振东领衔,四大豪门谁主沉浮?

带你逛体坛
2025-11-18 18:34:10
罗伯逊:距离世界杯只差90分钟,我相信我们能战胜丹麦

罗伯逊:距离世界杯只差90分钟,我相信我们能战胜丹麦

懂球帝
2025-11-18 14:25:08
日韩股市,开盘暴跌!

日韩股市,开盘暴跌!

证券时报
2025-11-18 09:47:04
湖人最不需要担心的人!里夫斯:GOAT詹皇回归将有4打3优势

湖人最不需要担心的人!里夫斯:GOAT詹皇回归将有4打3优势

体育妞世界
2025-11-18 14:08:30
乡镇编制膨胀:从12人到100人,时代变了乡镇变了,初心还在吗?

乡镇编制膨胀:从12人到100人,时代变了乡镇变了,初心还在吗?

君好伴读
2025-10-27 10:33:08
付某梅(女),已被大连警方抓获归案!

付某梅(女),已被大连警方抓获归案!

半岛晨报
2025-11-18 12:40:05
因文件问题无法靠港,3000头奶牛被困土耳其海上58天,船只恶臭弥漫、尸体堆积

因文件问题无法靠港,3000头奶牛被困土耳其海上58天,船只恶臭弥漫、尸体堆积

起喜电影
2025-11-18 15:29:35
赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

火山诗话
2025-11-18 18:36:08
华为Mate 80系列备货比例曝光 标准版和Pro Max成主力

华为Mate 80系列备货比例曝光 标准版和Pro Max成主力

手机中国
2025-11-18 16:50:44
钟丽缇168cm的大块头,一般男人征服不了她吧?

钟丽缇168cm的大块头,一般男人征服不了她吧?

小椰的奶奶
2025-11-18 13:14:26
毛主席视察天津时想见李银桥,得知他已经入狱,伟人只说了2个字

毛主席视察天津时想见李银桥,得知他已经入狱,伟人只说了2个字

南书房
2025-09-28 23:01:03
日本天下第一香木,传为隋炀帝所赐,仅有三位人物切下小块使用

日本天下第一香木,传为隋炀帝所赐,仅有三位人物切下小块使用

收藏大视界
2025-11-09 20:38:12
只待2天!全红婵火速从北京飞回广州,去医院看望梁小静,姐妹情深

只待2天!全红婵火速从北京飞回广州,去医院看望梁小静,姐妹情深

乡野小珥
2025-11-18 07:31:38
2025-11-18 19:39:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1155文章数 218关注度
往期回顾 全部

科技要闻

小米:汽车及AI等业务首次单季度经营盈利

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

搭载1.5T增程动力 吉利银河V900官图发布

态度原创

游戏
旅游
本地
教育
时尚

米哈游改革?离开二游 不做抽卡 还能创造奇迹吗?

旅游要闻

新疆新源县:萨哈景区初雪至 冰雪秘境引客来

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

教育要闻

论区老师“拗柴”与中考体育满分之间的逻辑必然性

从百元到大牌,《新闻女王2》的职场穿搭,每种预算都能找到参考

无障碍浏览 进入关怀版