网易首页 > 网易号 > 正文 申请入驻

AlphaFold:使用AI进行科学发现 蛋白质组成预测

0
分享至

在今天发表在《自然》杂志上的研究中,DeepMide展示了人工智能研究如何驱动和加速新的科学发现。DeepMide已经建立了一个专门的跨学科团队,希望利用AI推动基础研究的发展:召集来自结构生物学,物理学和机器学习领域的专家,应用前沿技术来预测基于蛋白质的3D结构仅根据其遗传序列。

DeepMide的系统AlphaFold(已在《自然》和《蛋白质》上发表的同行评审论文中进行了描述)是多年工作的结晶,它建立在数十年来使用大型基因组数据集预测蛋白质结构的研究的基础上。AlphaFold生成的蛋白质3D模型比以前的任何一种都要精确得多,这标志着生物学的一项核心挑战取得了重大进展。在CASP13使用的AlphaFold代码可以在Github这里 为有兴趣学习更多或复制DeepMide的结果任何人。这项工作已经启发了其他独立的实现,包括本文中介绍的模型,以及由社区构建,开源实现,在此介绍。

什么是蛋白质折叠问题?

蛋白质是生命中必不可少的大而复杂的分子。人体执行的几乎所有功能-收缩肌肉,感知光线或将食物转化为能量-都取决于蛋白质以及蛋白质的移动和变化方式。任何给定的蛋白质可以做什么取决于其独特的3D结构。例如,DeepMide的免疫系统利用的抗体蛋白为" Y形",并形成独特的钩。通过锁定病毒和细菌,这些抗体蛋白能够检测并标记疾病-导致微生物被清除。胶原蛋白的形状像绳索,可以在软骨,韧带,骨骼和皮肤之间传递张力。其他类型的蛋白质包括Cas9,Cas9以CRISPR序列为指导,像剪刀一样剪切和粘贴DNA片段。抗冻蛋白 其3D结构使它们能够与冰晶结合并防止生物冻结;核糖体的作用类似于程序化的装配线,有助于自身构建蛋白质。

这些蛋白质的配方-称为基因-在DeepMide的DNA中编码。基因配方的错误可能会导致蛋白质畸形,从而可能导致生物体疾病或死亡。因此,许多疾病从根本上与蛋白质有关。但是,仅仅因为您知道蛋白质的遗传配方并不意味着您会自动知道其形状。蛋白质由氨基酸链组成(也称为氨基酸残基)。

但是,DNA只包含有关氨基酸序列的信息,而不是它们如何折叠形成形状。蛋白质越大,建模越困难,因为要考虑的氨基酸之间存在更多的相互作用。正如列文塔尔的悖论所证明的那样,在达到真正的3D结构之前,随机枚举典型蛋白质的所有可能构型将花费比已知宇宙更长的时间-然而,蛋白质本身会在几毫秒内自发折叠。预测这些链将如何折叠成蛋白质的复杂3D结构是所谓的"蛋白质折叠问题",这是科学家数十年来一直致力于的一项挑战。这个问题尚未解决,已经激发了无数的发展,从刺激IBM在超级计算方面的努力(BlueGene)到新颖的公民科学工作(Folding @ Home和FoldIt)到新的工程领域,例如合理的蛋白质设计。

为什么蛋白质折叠很重要?

我认为,通过研究构成人体的分子,包括异常分子,DeepMide将能够对疾病的性质有更全面的了解,并且这种理解将使...以更直接的方式受到攻击,从而开发出新的治疗方法。

长期以来,科学家一直对确定蛋白质的结构感兴趣,因为人们认为蛋白质的形式决定了其功能。一旦了解了蛋白质的形状,就可以猜测其在细胞中的作用,科学家可以开发出与蛋白质的独特形状有关的药物。

在过去的五十年中,研究人员已经能够使用诸如冷冻电子显微镜,核磁共振和X射线晶体学这样的实验技术在实验室中确定蛋白质的形状,但是每种方法都取决于大量的试验和错误,这可能需要花费很多时间。多年的工作,每个蛋白质结构的成本高达数万或数十万美元。这就是为什么生物学家转向AI方法来替代这一艰难而艰苦的蛋白质过程的原因。

仅从遗传密码即可通过计算预测蛋白质形状的能力-而不是通过昂贵的实验来确定蛋白质的形状-有助于加速研究。

复杂的3D形状从一串氨基酸中出现

人工智能如何发挥作用?

幸运的是,由于基因测序成本的快速降低,基因组学领域的数据非常丰富。结果,在最近几年中,依赖于基因组数据的用于预测问题的深度学习方法变得越来越流行。为了促进研究和衡量最新方法以提高预测的准确性,1994年成立了两年一度的全球竞赛,称为CASP(蛋白质结构预测的关键评估),它已成为评估预测技术的金标准。

DeepMide要感谢CASP组织者数十年来的工作,以及成千上万的实验人员,他们的结构能够进行这种评估。DeepMind在此问题上的工作产生了AlphaFold,DeepMide将其提交给CASP13。DeepMide很自豪能成为CASP组织者所说的"预测蛋白质结构的计算方法能力的前所未有的进步"的一员,在进入的团队中排名第一(DeepMide的条目是A7D)。

DeepMide的团队专注于从头开始对目标形状建模的问题,而无需使用先前解决的蛋白质作为模板。当预测蛋白质结构的物理特性时,DeepMide获得了很高的准确性,然后使用两种不同的方法来构建完整蛋白质结构的预测。

使用神经网络预测物理性质 这两种方法均依赖于经过训练的深层神经网络,可以根据其遗传序列预测蛋白质的特性。

DeepMide的网络预测的特性是:

(a)氨基酸对之间的距离

(b)连接这些氨基酸的化学键之间的角度。第一个进展是在常用技术上的进展,该技术可估算氨基酸对是否彼此靠近。

DeepMide训练了一个神经网络来预测蛋白质中每对残基之间的距离分布(如图2所示)。然后将这些概率合并成一个分数,该分数可估计拟议蛋白质结构的准确性。DeepMide还训练了一个单独的神经网络,该网络使用所有距离合计来估计拟议结构与正确答案的接近程度。

两种可视化ALPHAFOLD预测准确性的方式。上图显示了三种蛋白质的距离矩阵。每个像素的亮度代表组成蛋白质的序列中氨基酸之间的距离-像素越亮,对就越近。顶行显示的是实验确定的真实距离,底行显示的是ALPHAFOLD预测距离分布的平均值。重要的是,它们在全球和本地范围内都匹配良好。底部面板代表使用3D模型进行的相同比较,其特征是相同三种蛋白质的ALPHAFOLD预测(蓝色)与真实数据(绿色)。

使用这些评分功能,DeepMide能够搜索蛋白质结构以找到与DeepMide的预测相符的结构。DeepMide的第一种方法以结构生物学中常用的技术为基础,并用新的蛋白质片段反复替换蛋白质结构的片段。DeepMide训练了一个生成神经网络来发明新的片段,这些片段被用来不断提高提出的蛋白质结构的分数。

从蛋白质序列预测结构的ALPHAFOLD系统的结构示意图

第二种方法优化的分数通过梯度下降-一个数学技术在机器学习通常用于制备小的,渐进的改善-这导致高度精确的结构。这项技术应用于整个蛋白质链,而不是应用于组装成较大结构之前必须分开折叠的片段,以简化预测过程。

Github上提供了CASP13上使用的AlphaFold版本,有兴趣的可以去搜索下载

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
78岁路都走不稳还开演唱会捞金,全网恶评如潮,她却扬言回馈粉丝

78岁路都走不稳还开演唱会捞金,全网恶评如潮,她却扬言回馈粉丝

冷紫葉
2026-01-27 15:07:16
高人预测:不出意外,2月开始将呈现5大现象,老百姓要做好准备

高人预测:不出意外,2月开始将呈现5大现象,老百姓要做好准备

小怪吃美食
2026-01-28 03:07:33
医生调侃:平时说爱国,进医院就要进口药

医生调侃:平时说爱国,进医院就要进口药

映射生活的身影
2026-01-26 14:47:32
1.28日早评|重磅公布!半导体大消息!A股又要起飞?

1.28日早评|重磅公布!半导体大消息!A股又要起飞?

龙行天下虎
2026-01-28 05:11:47
普京时代即将落幕?俄罗斯总统候选人浮出水面,谁会是接班人?

普京时代即将落幕?俄罗斯总统候选人浮出水面,谁会是接班人?

随梦而飞起
2026-01-27 16:38:27
曾不顾恩师反对,常昊执意娶大8岁师姑为妻,后来两人过得怎样?

曾不顾恩师反对,常昊执意娶大8岁师姑为妻,后来两人过得怎样?

梅亭谈
2026-01-28 05:24:38
他8次上春晚,作死被捕入狱,如今56岁无人问津,沦落到四处走穴

他8次上春晚,作死被捕入狱,如今56岁无人问津,沦落到四处走穴

小熊侃史
2026-01-06 11:17:00
主场龙客场虫?火箭队竟然成为了全联盟的第一魔鬼主场!

主场龙客场虫?火箭队竟然成为了全联盟的第一魔鬼主场!

田先生篮球
2026-01-27 12:39:54
杨鸣被曝离任不到24小时,令人担心的事发生,乌戈、郭士强被牵连

杨鸣被曝离任不到24小时,令人担心的事发生,乌戈、郭士强被牵连

不写散文诗
2026-01-27 15:17:57
哇塞!神级交易!湖人老铁太够意思啦!

哇塞!神级交易!湖人老铁太够意思啦!

体育新角度
2026-01-27 17:02:29
1964年郑维山和总参谋长起了争执,即便毛主席对此作出批示,郑维山仍坚定:我是对的

1964年郑维山和总参谋长起了争执,即便毛主席对此作出批示,郑维山仍坚定:我是对的

史海孤雁
2026-01-27 17:29:11
白银连环杀人凶手高承勇:为儿子前途收手,被捕后儿子被单位辞退

白银连环杀人凶手高承勇:为儿子前途收手,被捕后儿子被单位辞退

谈史论天地
2026-01-26 16:55:03
拔萝卜带泥!宋祖儿留学往事曝光,原来牢A直播说的话,讲对了!

拔萝卜带泥!宋祖儿留学往事曝光,原来牢A直播说的话,讲对了!

每一次点击
2026-01-22 22:24:03
孙悟空这就叫不识货!当年东海龙王手里那件7200斤的神器,他没看上,结果差点要了他的命!

孙悟空这就叫不识货!当年东海龙王手里那件7200斤的神器,他没看上,结果差点要了他的命!

历史回忆室
2026-01-15 12:58:16
孩子父亲真相大白一月后,奚美娟低调露面,手足无措,落寞呆坐

孩子父亲真相大白一月后,奚美娟低调露面,手足无措,落寞呆坐

胡一舸南游y
2025-12-26 18:40:57
特朗普释放美元贬值信号 美元指数日内跌1%

特朗普释放美元贬值信号 美元指数日内跌1%

财联社
2026-01-28 05:02:06
开源AI助手 ClawdBot 火爆全网,已狂飙50K Star!附喂饭级安装使用教程

开源AI助手 ClawdBot 火爆全网,已狂飙50K Star!附喂饭级安装使用教程

袋鼠帝
2026-01-27 12:38:56
高市公布战争方案,日本要求渔民撤离,沉默24小时,中方一锤定音

高市公布战争方案,日本要求渔民撤离,沉默24小时,中方一锤定音

瞻史
2026-01-28 06:37:44
3000 万甩卖?阿森纳王牌沦为 “新奥巴梅扬” 阿尔特塔忍无可忍

3000 万甩卖?阿森纳王牌沦为 “新奥巴梅扬” 阿尔特塔忍无可忍

澜归序
2026-01-28 07:12:56
突发! 杨兰兰澳洲与警察正面冲突! 全身香奈儿、座驾劳斯莱斯! 警察要求摘口罩!

突发! 杨兰兰澳洲与警察正面冲突! 全身香奈儿、座驾劳斯莱斯! 警察要求摘口罩!

澳洲红领巾
2026-01-27 13:12:36
2026-01-28 08:15:00
人工智能研究所AI
人工智能研究所AI
python人工智能,大数据,人生苦短,我用python
153文章数 775关注度
往期回顾 全部

科技要闻

Anthropic将融资200亿美元、估值3500亿美元

头条要闻

特朗普被指投下"第二次关税炸弹" 引发韩国强烈不安

头条要闻

特朗普被指投下"第二次关税炸弹" 引发韩国强烈不安

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮风波持续发酵,曝多个商务被取消

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

手机
亲子
时尚
本地
军事航空

手机要闻

华为Mate 80 Pro Max斩获AI手机场景智能评测第一 影像、社交、办公全面领先

亲子要闻

孩子被蜜蜂蜇了!

这些韩系穿搭最适合普通人!多穿深色、衣服基础,简洁耐看

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

军事要闻

美海军"林肯"号航母打击群抵达中东地区

无障碍浏览 进入关怀版