网易首页 > 网易号 > 正文 申请入驻

DeepMind推出二代AlphaFold,破解蛋白质分子折叠,生物学或遇“未有之变局”

0
分享至

  作者 | 陈彩娴、蒋宝尚

  近日,谷歌AI团队DeepMind所研究的 AlphaFold 算法在生物学领域取得了重要突破:通过蛋白质的氨基酸序列高精度地确定其3D结构。

  具体而言,是DeepMind的第二代AlphaFold 在国际蛋白质结构预测竞赛(CASP)上击败了其余的参会选手,能够精确地基于氨基酸序列,预测蛋白质的3D结构。 其准确性可以与使用冷冻电子显微镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。

  前基因泰克(Genentech)首席执行官Arthur D. Levinson博士称这一成就为“划时代的进步”(once in a generation advance)。

  从CASP14,这项权威的蛋白质结构预测竞赛结果中,可以看到AlphaFold2排名第一(总分远高于第二),排名前六位的分别是David Barke lab的两个工具(第二、第三位)、密歇根州立大学的 Michael Feig和密歇根大学Yang Zhang排名在第四位、第五位,而腾讯AI lab 的tFold_human 排名第六。

  这说明,在某种程度上,在对蛋白质结构和折叠的预测这件事情上,人类已非望尘莫及。

  第二代AlphaFold做了什么?

  在CASP这项比赛中,DeepMind开发AlphaFold2用的数据是:数据库里的超过17万种蛋白序列与结构,以及其他一些大型数据库里的数据。

  评估蛋白结构预测准确度的指标叫做GDT,也就是评估预测结构里的氨基酸位置,和实际的氨基酸位置差多少。差得越少,得分越高。

  GDT的分值在0-100之间。2006-2016年间,这个数字最高在40左右。 2018年,上一代的 AlphaFold得分一下子突破了50。而这次的新一代 AlphaFold,在蛋白结构预测大赛里的中位得分超过了92.4。

  更直观一些。拿它预测的结构与实际结构对比,可以看到基本完全吻合(下图,绿色是实验得到的实际结构,蓝色是计算预测结构)。

  但是对此结果,也有不少人存在疑问,主要在准确性。首先,17万的数据应该远远不够,准确性存疑;再者,蛋白质结构折叠问题太过高深,如果真能够破解,DeepMind很快就能获得诺贝尔奖。

  因此,在惊叹AlphaFold取得成果的同时,我们还需要冷静等待生物学家的实验验证。

  除了解决的问题值得我们关注,其实研究方法也更有思考价值。

  毕竟,AlphaFold的结构预测与X射线晶体学或低温电子显微镜(cryo-EM)等标准实验方法来预测并无区别,只是后者更加费力、更加昂贵。科学家表示,AlphaFold的出现也许并不会完全替代这些实验方法,但确实为人们提供了研究生物的新方式。

  2

  蛋白质结构:生物学五十年来的挑战

  蛋白质是生命的基础,与细胞组成内容紧密相关。而蛋白质的功能取决于其3D结构。

  一直以来,生物学家投入实验,致力于寻找生命的奥秘,即:氨基酸序列(蛋白质的组成部分)是如何绘制出最终的形状。

  在过去,人们一直是通过实验室来了解蛋白质的结构。比如,使用X射线束照射结晶的蛋白质,并将衍射光转化为蛋白质原子坐标,由此掌握蛋白质的第一个完整结构。

  除了实验,随着计算机的发展,该项技术在上世纪末便已用于预测蛋白质的结构,但效果并不理想。

  计算机技术用于蛋白质结构预测的困境,直到AlphaFold在2018年现身于CASP,才让科学家重新燃起了信心与希望。

  AlphaFold的第一次迭代将深度学习应用于结构和遗传数据,以预测蛋白质中氨基酸对之间的距离。根据AlphaFold的主要负责人之一John Jumper介绍,在第二个步骤中,虽然没有使用AI技术,但AlphaFold使用结构与遗传数据得出了蛋白质的外观模型,与之前的研究达成一致。

  但第一次迭代存在缺陷。因此,该团队开发了一个AI网络。该网络结合了有关确定蛋白质如何折叠的物理和几何约束的信息。他们设立了一项艰巨的目标: 该网络能够预测目标蛋白质序列的最终结构,而不仅是预测氨基酸之间的关系。

  3

  惊人的准确性

  CASP的进行历时数月。

  1994年,Moult及其同事发起了CASP,每两年召开一次。比赛团队获得约100种蛋白质的氨基酸序列,其结构未知。一些小组计算每个序列的结构,而另一些小组则通过实验确定它。然后,组织者将计算预测结果与实验室结果进行比较,并为预测结果提供全球距离测试(GDT)分数。

  研究小组有数周的时间来提交其结构预测。然后,一组独立的科学家使用度量标准来评估预测的蛋白质与实验确定的结构的相似程度,以此评估各个研究小组的预测结果。研究小组的名称为匿名。

  在今年的比赛中,AlphaFold的称号是“427组”。其预测的许多条目具有惊人的准确性,将近三分之二的预测与实验所得的结构相当。

  针对各种目标蛋白,AlphaFold的GDT中位数得分为92.4。在难度中等的蛋白质上,其他团队的最佳表现通常在预测准确度上得分75(满分100),而在AlphaFold则得分大约90,中位数为87,比下一个最佳预测高25分。

  AlphaFold甚至擅长解决楔入细胞膜中的蛋白质结构,这是许多人类疾病的核心,但众所周知,这个问题用X射线晶体学都很难解决。 医学研究理事会分子生物学实验室的结构生物学家Venki Ramakrishnan称该结果“在蛋白质折叠问题上取得了惊人的进步。”

  Moult介绍,90分以上得分的预测结果与实验方法相当。

  不过,AlphaFold并非完美胜任所有的预测。 在一种由52个小重复片段组成、组装时会扭曲彼此位置的蛋白质上,AlphaFold的预测与实验结果之间存在部分差异。

  CASP的负责人Moult介绍,无法确定是因为AlphaFold的预测误差,还是因为实验的伪像。

  此外,AlphaFold的预测与通过核磁共振成像技术确定的实验结构的匹配度差,可能是因为AlphaFold将原始数据转换为模型的方法需要改进。

  再如,AlphaFold的网络尝试为蛋白质复合物或组中的单个结构建模,因此,与其他蛋白质的相互作用扭曲了它们的形状。

  4

  应用

  AlphaFold的预测有助于确定Lupas实验室多年来试图破解的细菌蛋白质的结构。

  Lupas的研究小组以前曾收集过原始的X射线衍射数据,但要将这些类似Rorschach的图案转换为结构,则需要了解蛋白质的结构信息。Lupas介绍: “在我们花了十年时间尝试一切之后,427组的模型在半小时内为我们提供了结构。”

  DeepMind的联合创始人兼首席执行官Demis Hassabis介绍,AlphaFold可能需要几天的时间才能预测出蛋白质的结构,包括对蛋白质不同区域的可靠性估计。 但AlphaFold将开放给科学家使用。

  Hassabis认为,AlphaFold有望应用于药物发现和蛋白质设计。

  借助AlphaFold,药物设计人员能够快速确定危险的新病原体(如SARS-CoV-2)中各种蛋白质的结构,这是寻找分子以阻止疾病产生的关键步骤。

  加州大学伯克利分校的分子神经生物学家Stephen Brohawn说,DeepMind对一种叫做Orf3a的蛋白质的预测最终与后来通过cryo-EM确定的蛋白质非常相似。

  AlphaFold的出现,可能意味着获得良好的蛋白质结构,不再局限于实验室,而只需要低质量的、易于收集的实验数据。 比方说,类似蛋白质的进化分析等方向之所以能蓬勃发展,便是因为有大量的基因组数据能够被转化为结构。

  科学家评论,AlphaFold能够帮助人类了解生命基因组中数千种未溶解蛋白质的功能,了解人与人之间因为疾病而产生的基因变异。

  AlphaFold的出现也改写了外界对DeepMind的印象。此前,大家知道DeepMind,一般是因为该团队使用AI来玩游戏,比如AlphaGo。但如今,AlphaFold涉足生物学领域,例如进行蛋白质结构预测,DeepMind也因此向外界传达了自己的另一种声音:

  不仅能玩围棋,还能使用AI帮助生命科学的长远发展。

  

  1、https://www.nature.com/articles/d41586-020-03348-4

  2、https://www.sciencemag.org/news/2020/11/game-has-changed-ai-triumphs-solving-protein-structures

  3、https://www.newscientist.com/article/2261156-deepminds-ai-biologist-can-decipher-secrets-of-the-machinery-of-life/

  4、https://www.deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

  5、https://predictioncenter.org/casp14/doc/CASP14_press_release.html

  6、https://predictioncenter.org/casp14/zscores_final.cgi

  7、https://m.weibo.cn/1907380525/4577229730744076

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为何取消美国总统任期限制是件好事?(中英双语)

为何取消美国总统任期限制是件好事?(中英双语)

朝廷心腹
2026-06-12 20:44:46
“明亮红色球体”、“等离子体状球体”悬浮空中……美国防部公布第三批涉UFO档案

“明亮红色球体”、“等离子体状球体”悬浮空中……美国防部公布第三批涉UFO档案

环球网资讯
2026-06-12 22:38:17
大量上市!钾是苹果的7倍,中老年多吃它,手脚麻利,精神好!

大量上市!钾是苹果的7倍,中老年多吃它,手脚麻利,精神好!

普陀动物世界
2026-06-13 01:08:13
2026世界杯48队FIFA排名:前30仅3队缺席 新西兰第85垫底

2026世界杯48队FIFA排名:前30仅3队缺席 新西兰第85垫底

智道足球
2026-06-12 15:03:19
1929年,他扛两挺重机枪加入红军,1955年授衔时罗荣桓却左右为难

1929年,他扛两挺重机枪加入红军,1955年授衔时罗荣桓却左右为难

磊子讲史
2026-06-02 17:46:53
他主政台州,力推股份合作制激活民营经济,离任时留下工业品之都

他主政台州,力推股份合作制激活民营经济,离任时留下工业品之都

叮当当科技
2026-06-12 15:00:33
为什么中国女排没有朱婷的位置,真相大白了,她不会回来了

为什么中国女排没有朱婷的位置,真相大白了,她不会回来了

体育快递小哥哥
2026-05-11 16:32:52
藏不住了!人民日报言辞犀利评董路,范志毅早把真相说透了

藏不住了!人民日报言辞犀利评董路,范志毅早把真相说透了

阿讯说天下
2026-06-10 12:28:31
婚后才发现性生活不和谐,网友直呼:这不是搞笑吗

婚后才发现性生活不和谐,网友直呼:这不是搞笑吗

追星雷达站
2026-06-12 01:45:17
13日凌晨WTT曝出大冷门,林诗栋2-3出局,这5点让人难以理解

13日凌晨WTT曝出大冷门,林诗栋2-3出局,这5点让人难以理解

等等talk
2026-06-13 02:09:12
上海夫妻“离婚大战”牵扯出来的大瓜,把我看得目瞪口呆

上海夫妻“离婚大战”牵扯出来的大瓜,把我看得目瞪口呆

品读时刻
2026-06-12 09:04:53
丈夫抱回男婴让我先喂,我偷偷做亲子鉴定,结果出来全家傻眼了

丈夫抱回男婴让我先喂,我偷偷做亲子鉴定,结果出来全家傻眼了

晓艾故事汇
2026-06-08 08:19:26
刘涛携17女儿游意大利,一个成熟一个端庄,母女同框宛如姐妹花

刘涛携17女儿游意大利,一个成熟一个端庄,母女同框宛如姐妹花

青杉依旧啊啊
2026-06-13 02:45:31
2026NBA快船五号签选情生变

2026NBA快船五号签选情生变

体坛周报
2026-06-13 03:59:14
黄仁勋分享浪漫恋爱史 大学靠辅导功课追到妻子 台下女儿当场被甜到

黄仁勋分享浪漫恋爱史 大学靠辅导功课追到妻子 台下女儿当场被甜到

快科技
2026-06-12 18:02:46
WTT萨格勒布赛爆大冷!世界冠军出局,中日男单差距悬殊

WTT萨格勒布赛爆大冷!世界冠军出局,中日男单差距悬殊

youyou喜欢你
2026-06-12 18:49:51
杭州一咖啡馆邀4000人看世界杯,结果空无一人,网友评价一针见血

杭州一咖啡馆邀4000人看世界杯,结果空无一人,网友评价一针见血

Mr王的饭后茶
2026-06-12 16:28:23
人的一生,要闯三关。第一关,送父母终老;第三关,守好自己的命

人的一生,要闯三关。第一关,送父母终老;第三关,守好自己的命

富书
2026-05-31 21:32:50
“滴滴出行”突然改名

“滴滴出行”突然改名

浙江之声
2026-06-12 14:35:12
煤层厚达1千米,绵延上千公里!世界最大煤田真的是植物形成的?

煤层厚达1千米,绵延上千公里!世界最大煤田真的是植物形成的?

离离言几许
2026-06-08 18:21:06
2026-06-13 05:27:00
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7372文章数 20756关注度
往期回顾 全部

科技要闻

刚刚,人类历史上首位万亿美元富豪诞生!

头条要闻

SpaceX上市首日收涨19% 总市值报2.1万亿美元

头条要闻

SpaceX上市首日收涨19% 总市值报2.1万亿美元

体育要闻

欧洲恐韩?肉德维德?

娱乐要闻

一天4个瓜,肖战热巴最意外

财经要闻

万亿美元顺差背后,透露这些信号

汽车要闻

标配激光雷达/双动力可选 昊铂S600限时售17.99万起

态度原创

亲子
房产
艺术
公开课
军事航空

亲子要闻

给孩子报个幼儿园还要工资流水?难道这就是传说中的“因财施教”

房产要闻

海南最赚钱行业曝光!最快4年半,海口全款买三房!

艺术要闻

砸了640亿,再赔160亿!沙特“The Line”项目彻底凉了?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗媒体:已故最高领袖葬礼推迟举行

无障碍浏览 进入关怀版