由超级计算机Tursa开发的蛋白质语言模型PLM-Interact,成功破译了蛋白质之间的相互作用机制。格拉斯哥大学科学家借助英国DiRAC高性能超级计算设施,开发出能解读“蛋白质语言”的人工智能模型。这项通常用于宇宙学研究的高级计算技术,在此次研究中被创新性地应用于医学领域。
![]()
值得注意的是,该模型不仅能预测蛋白质相互作用,还能精准识别哪些基因突变会破坏这些关键生物分子间的信息传递。论文通讯作者袁可博士表示:“DiRAC原本用于帮助科学家理解从最小亚原子粒子到最大宇宙尺度的自然规律,现在能转而探索蛋白质相互作用的内在世界,这令人振奋。”
初期测试表明,在预测蛋白质相互作用方面,PLM-Interact的表现优于现有所有模型(包括谷歌DeepMind的AlphaFold3等先进工具)。这一突破为理解癌症与病毒感染等疾病的发病机制开辟了新途径。
经过深度训练的精密模型
作为生命的分子机器,蛋白质是细胞结构和所有生物过程的基础。蛋白质相互作用(PPIs)的紊乱往往是癌症与遗传疾病发生的起始信号,病毒入侵时也会通过劫持宿主蛋白实现自我复制。深入解析PPIs对推进新型疗法和疫苗研发至关重要,而PLM-Interact为观察这些关键机制提供了全新视角。
该模型的成功关键在于大规模训练:研究人员借助超级计算机,使用42.1万对人类蛋白质对进行训练。Tursa的强大算力尤其对拥有6.5亿参数的模型实现快速微调至关重要,使其得以掌握复杂的蛋白质通讯密码。
![]()
预测精度实现重大突破
相较于其他前沿AI蛋白质模型,PLM-Interact的预测准确率提升16%-28%。在验证实验中,该模型成功预测出驱动RNA聚合和蛋白质转运等关键功能的五组蛋白质相互作用,而AlphaFold3仅能预测出其中一组。
更引人注目的是,研究团队证实PLM-Interact能识别基因突变如何影响蛋白质相互作用,从而引发遗传疾病或抑制癌症中的关键PPIs。在对病毒-人类蛋白质相互作用进行专项训练后,该模型在预测病毒与宿主蛋白互作方面再次超越现有工具,这为解析病毒 emergence机制、评估大流行风险及发现抗病毒新靶点带来可能。
通讯作者David L Robertson教授强调:“新冠疫情中对病毒-宿主相互作用研究的紧迫性,正说明PLM-Interact这类工具的未来价值。”
目前实验鉴定蛋白质相互作用成本高昂且耗时,而PLM-Interact提供了快速、精准且可扩展的解决方案。研究团队表示将继续挖掘该模型在多领域的应用潜力,预计后续发展将加速创新疗法开发、疫苗研制,以及对生命本质过程的深层理解。
该项突破性研究成果已发表于《自然-通讯》期刊。
如果朋友们喜欢,敬请关注“知新了了”!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.