网易首页 > 网易号 > 正文 申请入驻

Nature | 不止蛋白质结构!AlphaFold3可高精确度预测生物分子结构及相互作用

0
分享至

准确预测的生物分子复合物结构,对于人们理解细胞功能和开发合理治疗方法至关重要。随着AlphaFold的发展,人们在蛋白质的结构预测方面已经取得了巨大的进步,AlphaFold2使得蛋白结构预测达到实验层面的精度,此外,在AlphaFold2思想和技术基础上开发的一系列新算法和研究新进展也使这一领域得到了长足发展。AlphaFold在问世不久后,依靠简单的输入修改就可实现蛋白质相互作用预测,并且科研人员专门为蛋白质相互作用预测训练AlphaFold 2产生了一个高度准确的系统。

上述成功的结果引发了一个问题,即是否有可能在深度学习框架内准确预测包含更广泛生物分子的复合物的结构,包括配体、离子、核酸和修饰残基等。目前,针对各种特定相互作用类型的多种深度学习预测方法已被开发,但这些方法的准确性参差不齐,通常低于物理启发方法,并且几乎所有方法都高度专注于特定的相互作用类型,无法预测包含多种实体类型的一般生物分子复合物的结构。

为解决上述难题,谷歌DeepMind AlphaFold团队联合Isomorphic Labs公司在Nature杂志发表了题为“Accurate structure prediction of biomolecular interactions with AlphaFold 3”的文章,推出了全新的预测工具AlphaFold3(AF3),这是一个能够高精度预测蛋白质数据库(PDB)内几乎所有分子类型复合物的模型,包括准确预测蛋白质、DNA、RNA、小分子配体结构以及其相互作用模式

与先前许多专业工具相比,AF3模型准确性显著提高:预测蛋白质-配体相互作用的准确性远高于最先进的对接工具,预测蛋白质-核酸相互作用的准确性远高于核酸特异性预测工具,抗体-抗原预测精度显著高于AlphaFold-Multimer v2.3。这些结果表明,在一个统一的深度学习框架内,可实现跨生物分子空间的高精度建模。综上,AF3的发布在生物学界具有革命性的意义,将使结构生物学研究变得更加普及,并有望推动药物研发。


文章发表在Nature

主要研究内容

01

模型架构与训练

AF3的整体结构与AlphaFold 2相似,均有一个大主干,用于演化化学复合物的配对表示,然后是一个结构模块(Structure Module),使用配对表示来生成明确的原子位置,但每个主要组件存在较大差异

AF3减少了多序列比对(MSA)模块的数量(减至4个),MSA表示的处理使用配对加权平均法,并且只有配对表示用于后面的处理步骤;更简单的Pairformer模块取代AlphaFold 2的Evoformer模块成为主要的处理模块,减少对MSA信息的依赖,更多地依靠pair信息。特别地,AF3引入了扩散模块(Diffusion Module)取代AlphaFold 2中的结构模块,可直接预测原始原子坐标。扩散过程的多尺度性质(低噪声引导神经网络、改善分子的局部结构)也能消除立体化学损失,还能减少网络中键合模式(bonding patterns)的特殊处理。

在模型训练数据上,AlphaFold 3模型根据PDB中包含的生物分子结构数据进行训练,能够处理其中99%以上的已知生物分子复合物。

研究团队还开发了预测最终结构中原子水平和配对误差的置信度措施,这一过程在AlphaFold 2中通过训练期间回归结构模块输出中的误差直接完成,但其不适用于扩散训练。为此,研究团队开发了一个“rollout”过程,用于在训练过程中生成完整结构预测,使用该预测结构来排列对称的地面真值链和配体,并计算性能指标来训练置信度。


图1. AF3架构和训练细节

02

模型预测的准确性

AF3可以预测输入的聚合物序列、残基修饰和配体SMILES的结构,在图2中研究团队展示了一些例子,凸显了该模型具有推广到许多生物学上重要和治疗相关模式的能力。此外,AF3还比各种单一模型表现出更高的性能,包括蛋白质-小分子、核酸、共价、抗原抗体等各种分子的相互作用。

在PoseBusters基准数据集上,研究团队评估了AF3预测蛋白质-配体相互作用的性能,该数据集由428个蛋白质-配体结构组成。结果显示,在不使用任何结构输入的情况下,AF3预测准确率为76%,性能显著优于传统对接方法Vina以及最新开发的RFAA模型(基于深度学习方法预测生物大分子结构)。对于蛋白质-核酸复合物和RNA结构,AF3预测准确性也高于RoseTTAFold2NA(目前最好的预测方法),AF3能够预测具有数千个残基的蛋白质-核酸结构。此外,AF3还可以准确预测共价修饰,包括对任何聚合物残基(蛋白质、RNA或DNA)的修饰。

在扩展建模能力的同时,相对于AlphaFold-Multimer v2.3,AF3也提高了对蛋白质复合物的预测准确度。具体而言,AF3对蛋白质-蛋白质预测成功率有所提高,特别是对于抗体-蛋白质相互作用的预测有了显著提高,准确率达62.9%;对蛋白质单体LDDT的预测则有显著改善。上述结果表明,AF3在预测类药物相互作用(包括蛋白质-配体结合以及抗体-靶蛋白结合)方面展现出前所未有的准确性,可加速药物发现过程,大幅度减少传统药物发现方法所需的时间和成本。


图2. AF3可以准确预测生物分子复合物的结构

03

AF3预测准确性与置信度

与AlphaFold 2一致,AF3的置信度也经过精确校准。研究团队在最近的PDB评估集上进行了置信度分析,使用模型预测的相互作用界面TM分数(ipTM)作为置信度指标;随后,将ipTM分数进行分段处理,统计每个区间内的样本数量,并将其与蛋白质-蛋白质匹配的DockQ分数、蛋白质-核酸匹配的iLDDT分数以及蛋白质-配体匹配的成功率进行比较。

分析结果显示,ipTM分数与上述指标之间存在显著正相关性,表明其是一个有效的模型预测结果评估指标。此外,研究团队还对另一个置信度指标pLDDT进行了类似的实验,发现其同样与模型预测的准确性之间存在正相关性。因此,ipTM分数、pLDDT均能很好地评估模型预测结果,并为模型的预测准确性提供有力的证据


图3. AF3置信度指标与准确性相关

04

AF3模型局限性分析

AF3在蛋白质结构预测领域取得了显著的成就和空前的精度,但在立体化学、幻觉(hallucinations)、动力学和特定目标的准确性等方面仍存在一定局限性。即便如此,现有环境下,AF3仍是蛋白质结构预测领域的一个重要工具,其进步和革新也为未来的研究和应用奠定了基础。当然,这些挑战也是研究人员开发新算法或改进现有算法的动力,最终有望实现更精确和全面的结构预测。


图4. AF3模型局限性

目前,AlphaFold3的访问次数有限,科研人员每天只能进行10次预测,研究团队也表示未有开源AlphaFold 3完整代码的计划。但研究团队推出了一个支持非商业性研究的工具AlphaFold Server,可以免费访问AlphaFold3的大部分功能,界面使用简单、可视化程度良好。

Alphafold Server链接:

https://golgi.sandbox.google.com/about

结 语

分子生物学的核心挑战是理解并最终调节生物系统中复杂的原子相互作用,AlphaFold 3的问世在这一方向上迈出了一大步,其将人们从蛋白质带到广泛的生物分子,证明了在一个统一的框架中准确预测不同生物分子系统的结构是完全可能的,并有望开启更多变革性的科学。 该研究提示,基于实验技术解析结构会带来更多高质量蛋白质复合体结构,而这些可作为AI模型的训练数据,进一步提高模型的泛化能力和准确性。因此,实验技术的发展和计算方法的发展是相互补充的,两者共同发力,可帮助人们更好地理解生物世界。

参考原文:

Abramson, J., Adler, J., Dunger, J. et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature (2024). https://doi.org/10.1038/s41586-024-07487-w

快点亮"在看”吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
土媒:穆里尼奥入主费内巴切后,引援名单已锁定至少四名球员

土媒:穆里尼奥入主费内巴切后,引援名单已锁定至少四名球员

直播吧
2024-06-16 20:24:02
高中生模仿宋徽宗瘦金体,被老师打0分,评语:不要挑战考试底线

高中生模仿宋徽宗瘦金体,被老师打0分,评语:不要挑战考试底线

熙熙说教
2024-06-16 12:08:10
菲军接到任务,对华称呼已变,中方舰队拉包围圈,仙宾礁对抗升级

菲军接到任务,对华称呼已变,中方舰队拉包围圈,仙宾礁对抗升级

说天说地说实事
2024-06-15 20:02:53
上海这夜,耍大牌周也和勒肉张碧晨,都败给了“全裹”出镜的高叶

上海这夜,耍大牌周也和勒肉张碧晨,都败给了“全裹”出镜的高叶

一娱三分地
2024-06-16 08:55:03
瑞士峰会传来消息,好家伙,幸亏中国没去参加,普京早就布好局了

瑞士峰会传来消息,好家伙,幸亏中国没去参加,普京早就布好局了

千里持剑
2024-06-15 12:53:07
最新积分榜:一场0-3让日本女排扣大分!中国女排锁定亚洲第一

最新积分榜:一场0-3让日本女排扣大分!中国女排锁定亚洲第一

刺头体育
2024-06-16 22:58:55
一天拿下4城!俄军攻入恰索夫亚尔,尸骸遍地,乌军女兵掉头就跑

一天拿下4城!俄军攻入恰索夫亚尔,尸骸遍地,乌军女兵掉头就跑

秦蓁
2024-06-14 12:10:02
江苏一股民74元追高上车爱迪尔,躺平8年,最终退市

江苏一股民74元追高上车爱迪尔,躺平8年,最终退市

惜别的海岸
2024-06-16 22:53:23
周日竞彩解析:荷兰小胜收场,丹麦恐难取胜,英格兰稳定取下3分

周日竞彩解析:荷兰小胜收场,丹麦恐难取胜,英格兰稳定取下3分

阿涛说球
2024-06-16 15:46:59
路易王子萌翻天!凯特王妃现身拥抱孩子,状态堪忧人心疼

路易王子萌翻天!凯特王妃现身拥抱孩子,状态堪忧人心疼

娱记掌门
2024-06-17 01:54:35
别再说公务员多了,我国目前公务员总数仅800万,占比只有0.57%!

别再说公务员多了,我国目前公务员总数仅800万,占比只有0.57%!

小圣杂谈原创
2024-06-15 18:55:06
“母亲借钱买的”电瓶车不合标准被没收,女孩哭得撕心裂肺!

“母亲借钱买的”电瓶车不合标准被没收,女孩哭得撕心裂肺!

走读新生
2024-06-15 07:25:14
姑娘美出高级感

姑娘美出高级感

白宸侃片
2024-06-16 10:32:55
新冠疫后,罕见癌症大增

新冠疫后,罕见癌症大增

霹雳炮
2024-06-13 23:40:49
清洗王室、囚禁生母、冷落拜登,沙特王储小萨勒曼的手段有多狠?

清洗王室、囚禁生母、冷落拜登,沙特王储小萨勒曼的手段有多狠?

我是兰兰
2024-03-20 20:04:28
姜萍走红后,姜萍妈妈社媒账号首发声:女儿正在备考,谢谢大家的鼓励与支持

姜萍走红后,姜萍妈妈社媒账号首发声:女儿正在备考,谢谢大家的鼓励与支持

鲁中晨报
2024-06-16 16:35:05
历史进入垃圾时间,心肠要硬一点

历史进入垃圾时间,心肠要硬一点

西坡原创
2024-05-07 13:03:54
纪实:91大神有什么手段?无论是大学生或空姐,全都心甘情愿出镜

纪实:91大神有什么手段?无论是大学生或空姐,全都心甘情愿出镜

玲说百态味
2024-05-08 18:09:01
他刚当市长就被老百姓指责,后来官至政治局常委,如今已经86岁了

他刚当市长就被老百姓指责,后来官至政治局常委,如今已经86岁了

李姐历史
2024-06-14 09:57:42
河北新娘抛下丈夫喝药自尽,12年后丈夫不顾一切给妻子开棺

河北新娘抛下丈夫喝药自尽,12年后丈夫不顾一切给妻子开棺

青丝人生
2024-05-20 17:32:41
2024-06-17 04:38:44
测序中国
测序中国
基因行业领航新媒体
34文章数 1关注度
往期回顾 全部

科技要闻

iPhone 16会杀死大模型APP吗?

头条要闻

冷藏货车违规乘人致8人窒息后遇难 河南叶县通报

头条要闻

冷藏货车违规乘人致8人窒息后遇难 河南叶县通报

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

时尚
亲子
房产
公开课
军事航空

伊姐周日热推:电影《沙漏》;动漫《眷思量2》......

亲子要闻

玩这个游戏的都是勇士

房产要闻

万华对面!海口今年首宗超百亩宅地,重磅挂出!

公开课

近视只是视力差?小心并发症

军事要闻

以军宣布在加沙南部实行"战术暂停"

无障碍浏览 进入关怀版