人类蛋白组中潜在的真实互作约7.4万至20万对,而可能的蛋白-蛋白互作对总数高达2亿。如何在如此庞大的搜索空间中准确识别出真实的相互作用,一直是领域内的巨大挑战。2025年9月,Science杂志发表题为Predicting protein-protein interactions in the human proteome的里程碑式研究成果。
![]()
这项工作系统性地构建了迄今为止最全面的人类蛋白相互作用(PPI)的高精度预测模型,通过整合30PB基因组数据与深度学习技术,系统鉴定了17,849组高置信度蛋白相互作用,其中 3,631 组为首次发现的全新互作关系,不仅大幅拓展了我们对生命分子网络的认识,更为理解疾病机制、推动精准医疗提供了前所未有的分子蓝图。
![]()
研究团队开发了omicMSA技术,从2万多种真核生物的基因组数据中直接组装蛋白序列,将共进化信号的分析灵敏度提升7倍,相当于为“模糊的星空图”装上高分辨率望远镜。
![]()
在此基础上,利用AlphaFold数据库中的200万个高质量单体结构,提取出100万组域-域相互作用,训练出深度学习网络 RoseTTAFold2-PPI(RF2-PPI)模型。该模型在保持90%高精度的同时,速度比AlphaFold2快20倍,真正实现又快又准。
![]()
基于上述技术,研究人员系统筛选了2亿对人类蛋白对,最终鉴定出17,849组高置信度蛋白互作,其中3,631组为以往未知的新互作。这些预测不仅覆盖大量跨膜蛋白、免疫相关蛋白等难以实验检测的类型,还提供了高质量的三维结构模型,为机制研究打下基础。
![]()
从“基因变异”到“致病机制”,该模型的预测结果在多个疾病方向上展现出重要价值。比如,首次预测KLRG1与TLR3的相互作用,其界面突变与疱疹病毒脑炎易感性直接相关;发现未表征蛋白C8orf82与电子转移黄素蛋白复合物结合,为能量代谢障碍提供新机制;揭示CFAP91在精子鞭毛形成复合物中的支架作用,解释了CATIP突变致病的结构基础。
![]()
研究团队已公开所有预测结果和中间数据,这项研究不仅是数据库的扩充,更是研究范式的转变——从“假设驱动”转向“数据驱动”的生物学发现。当然,这项宏大的互作研究也存在明显的缺陷——没有实验验证。但是,它尽可能地为我们展现了蛋白互作的各种可能性,拓宽了我们对互作的认识和认知。美是一种呈现,好好欣赏。
除了蛋白互作可以做美图,发顶刊,蛋白与疾病或表型的相关性也可以做美图,发顶刊。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.