网易首页 > 网易号 > 正文 申请入驻

媲美AlphaFold2,国产蛋白结构预测平台TRFold进入世界第一梯队

0
分享至

撰文 | 王聪

理解蛋白质的结构,有助于确定蛋白质的功能,分析各种突变的作用。截至目前,约有 18 万个蛋白质的结构已经用实验方法得到了解析,但这在已经测序的数十亿计的蛋白质中只占了很小一部分。

几十年来,结构生物学家一直使用 X 射线晶体学、核磁共振、和最近开发出的冷冻电子显微镜等实验技术来解析蛋白质结构。但是这些方法既费时又费钱,且对很多蛋白质并不适用。同时,计算生物学家也在尝试根据蛋白质的氨基酸序列直接预测其折叠成的三维结构。然而,受困于计算量庞大、计算准确度有限,蛋白质三维结构预测领域近年来进展较为缓慢。

在2021年7月16日这一天,发生了一件意义重大、影响深远的事件——DeepMind团队和华盛顿大学David Baker团队分别开源了蛋白质结构预测工具AlaphaFold2RoseTAAFold,并分别在NatureScience发表论文,详尽细致地说明了是如何做到精确预测蛋白质3D结构的。

此后,这两款蛋白结构预测工具接连取得了一系列重要突破,让许多人惊呼人工智能(AI)将颠覆结构生物学。国内结构生物学领军人物、西湖大学校长施一公院士也表示:这是人工智能对科学领域最大的一次贡献,也是人类在21世纪取得的最重要科学突破之一。

日前,来自中国上海的天壤 XLab 团队开发的TRFold在 CASP14(2020年第14届国际蛋白质结构预测竞赛)蛋白质测试集的评估中取得了 82.7 的好成绩(满分100分),这一成绩已经超过了 David Baker 团队开发的 RoseTTAFold 的 81.3 分的成绩,仅次于 AlphaFold2 的 91.1分,位居世界第二。

这也是目前国内所有公开蛋白质结构预测模型中取得的最好成绩,它标志着我国计算生物学领域的表现已经处于世界第一梯队

参加CASP14比赛的团队部分成绩排名

更重要的是,TRFold 不仅拥有媲美 AlphaFold2 的蛋白质结构预测精度,还突破了 AlphaFold2 需要超大算力的瓶颈,采取权重共享的方式节约算力,预测多数蛋白质链所需时间不超过 16 秒。

在天壤取得这一优秀成绩的时刻,《生物世界》对天壤创始人薛贵荣博士和天壤 XLab 负责人苗洪江博士进行了专访,一起了解国产蛋白质结果预测平台 TRFold 的研发情况和思考。

生物世界:如何评价天壤 TRFold 的这项阶段性成果?

薛贵荣:这一成绩,代表了天壤通过了2年半的时间,已经掌握了预测蛋白质结构的核心技术,能够参与到国际最前沿的生物医学领域中,天壤已经跨越了技术门槛,后续可以根据不同的场景进行针对性的研发和应用。

生物世界:AlphaFold2 已经做的很好了,而且还开源了代码,为什么天壤还要自己做一套算法呢?

薛贵荣:AlphaFold2 的成功是蛋白质结构预测方向的重大突破,但是围绕蛋白质结构功能问题能够达到实际落地应用准确度要求的 AI 算法的开发才刚刚开始。没有训练此类模型经验,或者简单的说没有具备能够训练出 AlphaFold2 这类复杂模型的能力是无法把该技术继续推进,解决更深层次问题的。

而且, AlphaFold2 开源的只是推理代码,并没有开源训练代码。今年 10 月份,DeepMind 团队公布了 AlphaFold-Multimer,对 AlphaFold2 进行微调后用于预测蛋白质-蛋白质相互作用。像这种更深入的研究就必须要有自己搭建底层算法的能力,才能真正地应用在生物学领域。

天壤在做 TRFold 的时候是充分考虑了后续应用的,比如说我们的模型平台有不同的版本来解决不同需求,end2end 版本用于快速生成结构,分段式版本用于大规模测算蛋白质氨基酸之间的距离。在算法开发前充分考虑后续的研究与延展是十分重要的。

AI对蛋白结构的预测,是一种基础性的工作,就像基础设施一样,未来可能会极大地重构生命科学的各个流程。像这样重要的基础性工作,我们希望中国也能够掌握,才不会受制于人。

生物世界:AlphaFold2 对蛋白结构的预测,为何能够引起如此大的关注和轰动?

苗洪江:之所以引起这么大的关注和轰动,首先是因为蛋白质结构非常重要,结构决定了功能。其次是因为目前解析蛋白质结构的实验方法,难度较高、速度较慢、无法高通量,难以满足生命科学发展的需求。另外一方面,蛋白结构的预测十分困难,整个领域近几年进展相对缓慢,没有取得特别重大的突破。最后是因为 AlphaFold2 宣布开源,这将很大程度上促进我们在分子层面对细胞和生命的理解,也将促进生物科学、药物研发、合成生物学等众多领域的发展。

生物世界:AI对蛋白结构的准确预测,一度让科研界产生了一些悲观情绪,你觉得AI是否会让结构生物学家失业?

苗洪江:AI 预测蛋白结构其实是赋能结构生物学家,它不是取代冷冻电镜,更不是取代结构生物学家。我们要积极拥抱这种新技术,推动整个领域以更快的速度发展。事实上,我们也已经看到很多结构生物学家已经在利用AI来实现更高效的研究工作。

生物世界:天壤自主研发的 TRFold,对蛋白质结构的预测,达到了一个什么样的水平?

苗洪江:CASP(国际蛋白质结构预测竞赛) 是计算生物学领域中最权威和最负盛名的比赛之一,每两年举办一次,被誉为“蛋白质结构预测领域的奥林匹克竞赛”。TM-score 是领域中通用的结构预测准确度评估打分,得分超过 60 我们就可以认为预测结果在拓扑结构上是正确的,得分超过 90 就已经与实验室解析的结构差别不大。

我们在 CASP14(2020年,第14届)蛋白质测试集上的评估取得了82.7分(满分100),这一结果已经超过了 David Baker 团队开发的 RoseTTAFold 的 81.3 分的成绩,仅次于 AlphaFold2 的 91.1 分,位居世界第二。此结果是TRFold基于更小的训练数据获得的,目前我们的算法还在迭代,比如蒸馏数据的加入,争取早日达到 90 分以上。

TRFold 基于 CASP14 蛋白质测试集的评估数据;绿色:真实结构,蓝色:预测结构

生物世界:天壤有哪些技术上的优势,敢于跟国际上最顶尖的AI公司竞争?

薛贵荣:天壤进入蛋白质结构预测领域有两年半的时间,但此前,天壤已经在人工智能领域深耕多年,从 AI 围棋 TRGo 到 AI 交通 TRTraffic,积累了很强的复杂系统的智能决策能力,夯实了自身的深度学习平台。蛋白质结构预测也是复杂场景问题,天壤的技术积累可以很快解锁此类场景,因此进入蛋白质结构预测领域是水到渠成的事情。

相比 AlphaFold2,天壤开发的 TRFold算力消耗更少,产生结果更快。TRFold 最核心的优势是可以根据不同的应用场景采用不同版本的算法,有很强的延展性,且对算力的要求更小。例如对蛋白质-蛋白质相互作用的预测,从 RoseTTAFold 到 DeepMind 最新的 AlphaFold-Multimer 都是对已知相互作用的蛋白质复合体进行结构模拟,无法判断两个/多个输入的蛋白质链是否存在相互作用,而 TRFold 复合体预测则首先对输入蛋白质链是否相互作用进行快速判别,再对其复合体结构进行预测。

生物世界:现在国内外蛋白质结构预测领域的竞争格局是怎么样的?

薛贵荣:这个领域现在竞争比较激烈,尤其是 Deepmind 开源了 AlphaFold2 模型,使得学术领域研究蛋白质结构的门槛降低了,但对于同样在做蛋白质结构预测的创业团队来说,门槛却是增高了很多,需要有更大的技术突破才能在行业中站稳脚跟。

国际上,目前在蛋白质结构预测方面做得最好的是Deepmind,其次是华盛顿大学David Baker团队。DeepMind 创始人 Demis Hassabis 最近成立了新公司 lsomorphic Labs ,通过AI建模生命的基本机制,用来重构药物发现过程。而 David Baker 团队则将 AI 应用于预测蛋白质相互作用和蛋白质设计。在国内,包括天壤,还有像腾讯中科院都取得了优秀的结果,应用场景也集中在生物科技领域。

生物世界:新冠疫情大流行对全世界产生了深远的影响,AI 技术对于新冠疫情是否有所帮助?

苗洪江:在新冠疫情初期,CASP 发起了一次针对 COVID-19 的蛋白质结构预测,天壤提交的 nsp6-D2 预测结果被 CASP 官方选为六个“最具可信度模型”之一。

现在最广泛使用的新冠 mRNA 疫苗,很多就是针对新冠病毒的刺突蛋白(S蛋白)设计的,目前也有团队正在使用 AI 技术研究刺突蛋白的突变。而 David Baker 团队合作设计的重组蛋白新冠疫苗也于近期进入了全球 3 期临床试验。该重组蛋白疫苗设计中的一个重要环节就是验证设计的蛋白质会折叠成所目标结构行使目标功能,准确的蛋白结构预测对此帮助巨大。

生物世界:天壤XLab的定位是什么,将在哪些领域发力?

苗洪江:TRFold 是由天壤 XLab 负责研发的,XLab 主要聚焦在创新领域,团队核心成员有全球顶级高校的生物计算专业、物理学专业、数学等专业的博士生,创新氛围浓郁。此次对外公布消息是基于 TRFold 已经取得了阶段性进展,

后续 XLab 将以 TRFold 破解蛋白结构为起点,探索蛋白-蛋白相互作用关系,构筑蛋白-蛋白相互作用网络、助力靶点发现,以及蛋白质设计、药物研发、个性化治疗等。

生物世界:TRFold将来的应用方向有哪些?

苗洪江:单蛋白质的结构模拟只是个开始,我们有许多方向可以进行深入研究探索,比如模拟蛋白质与其配体的相互作用(包括小分子、多肽、其他蛋白质等)。目前比较明确的研究方向是继续深入模拟蛋白与蛋白之间的相互作用,基于这些预测的相互作用,我们可以构建大规模的相互作用网络图谱。靶点发现、突变模拟、转录后修饰蛋白结构、GPCR、抗体模拟等都是非常有趣又有深远意义的课题。

接下来我们的工作重点将是利用目前的全蛋白质组协同进化分析,建立起蛋白质与蛋白质之间相互作用的精准链路。此外,AI还能提高蛋白质设计的精度和成功率,我们也将探索和研发蛋白质设计的新方法。

生物世界:现在AI制药非常火热,DeepMind也投身AI制药的浪潮中,天壤是否也有相关计划?

苗洪江:新药研发是人类发展中极具风险和复杂度、耗时最漫长的技术研究领域之ー。有数据显示,一个新药的研发成本平均高达 22 亿美元,耗时约 10 年,而成功率不到十分之一。随着 AI 的发展,部分应用了 AI 技术的新药研发减少了 35%的成本,临床前研发周期也缩短为 1-3 年。因此,全球范围内对 AI 制药投入了巨大的资金和热情。

近期,DeepMind 创始人 Demis Hassabis 最近成立了新公司 lsomorphic Labs ,通过 AI 建模生命的基本机制,用来重构药物发现过程。这个消息让我们很振奋,我们感受到了 AI 生物研究终于可以进入到下一阶段,我们很欣喜看到这门技术开始进行产业落地。我们对 lsomorphic Labs 也有着很强的好奇心,也期待看到他们做出更多激动人心的创新。

DeepMind 是个创新力非常强的团队,而且有着谷歌这样的巨头在背后支持,而天壤的团队规模还比较小,但坚持自研算法的研究和极致创新是我们赖以生存的基础。在这个基础上,将来的许多转化和应用也将是水到渠成的事情。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大谷翔平1600万美元被翻译偷走,FBI称球员3年没登录工资账户

大谷翔平1600万美元被翻译偷走,FBI称球员3年没登录工资账户

红星新闻
2024-04-17 15:38:34
美大使:中国不满美国TikTok禁令是双重标准,中国也封锁美国技术

美大使:中国不满美国TikTok禁令是双重标准,中国也封锁美国技术

绝密探照灯
2024-04-18 13:33:39
92户找到了?北京有贵人相助,柴桑透露两个好消息坚称真相必出

92户找到了?北京有贵人相助,柴桑透露两个好消息坚称真相必出

小鹿姐姐情感说
2024-04-18 10:36:11
辽宁一高校原党委书记,为升官花费巨资“搭天线”

辽宁一高校原党委书记,为升官花费巨资“搭天线”

中国青年报
2024-04-18 20:31:11
央媒发声!大学生反击醉汉事件再升级,知情人爆料内情,校方表态

央媒发声!大学生反击醉汉事件再升级,知情人爆料内情,校方表态

坦然风云
2024-04-17 13:27:00
广东G1半场压制广厦!周琦阿旺齐爆,双外双星低迷,广厦仅靠4将

广东G1半场压制广厦!周琦阿旺齐爆,双外双星低迷,广厦仅靠4将

邮轮摄影师阿嗵
2024-04-18 21:04:31
中方最新武器罕见亮相,新型火车航母成功下水,美国居然高价求购

中方最新武器罕见亮相,新型火车航母成功下水,美国居然高价求购

绝对军评
2024-04-18 14:14:05
飘了?“开封王婆”抵达江西,出场费惊人,河南人再背“黑锅”!

飘了?“开封王婆”抵达江西,出场费惊人,河南人再背“黑锅”!

酷小子玩体彩
2024-04-18 16:59:08
手上这个穴,每天按一按,血管通畅心情好、气色好!

手上这个穴,每天按一按,血管通畅心情好、气色好!

今日养生之道
2024-04-18 07:30:07
降息!又来了…

降息!又来了…

南京买房惠
2024-04-18 17:43:55
过来人告诉你,为了初中不熬夜,小学五六年级必须提前布局!

过来人告诉你,为了初中不熬夜,小学五六年级必须提前布局!

好爸育儿
2024-04-17 08:39:55
凯特威廉终于合体了!两人一起给孩子购买学习用品

凯特威廉终于合体了!两人一起给孩子购买学习用品

金牌娱乐
2024-04-17 09:52:59
马云真的没有说谎,从2024年开始,贫富交替的时代真的要来了

马云真的没有说谎,从2024年开始,贫富交替的时代真的要来了

拾叁生意经
2024-03-25 20:01:48
薛之谦演唱会撒谎美女后续!朋友圈曝光、身份被深挖,果然有情况

薛之谦演唱会撒谎美女后续!朋友圈曝光、身份被深挖,果然有情况

阳光情感shuo
2024-04-17 02:40:03
京沪冲突!点火的是刘铮,火苗却在更衣室,中场到底发生了什么

京沪冲突!点火的是刘铮,火苗却在更衣室,中场到底发生了什么

懂球哥评球
2024-04-18 08:02:38
一夜回到九年前,万科急了

一夜回到九年前,万科急了

市界
2024-04-18 14:30:11
魔兽世界:GM说漏嘴,意外泄露国服开放时间,怀旧服版本尚未确定

魔兽世界:GM说漏嘴,意外泄露国服开放时间,怀旧服版本尚未确定

胖哥游戏说
2024-04-18 19:48:49
飞天暴跌,茅台酒4月18日行情价

飞天暴跌,茅台酒4月18日行情价

小宇宙双色球
2024-04-18 12:15:49
万科跌破7元大关,价值投资者还能扛多久?

万科跌破7元大关,价值投资者还能扛多久?

股海风云大作手
2024-04-18 15:05:58
俗话说:“谷雨三不吃,疾祸不易兴”,3不吃指什么?早看早受益

俗话说:“谷雨三不吃,疾祸不易兴”,3不吃指什么?早看早受益

简食记工作号
2024-04-17 10:46:01
2024-04-18 22:20:49
生物世界
生物世界
最前沿、最有趣的生命科学研究
5854文章数 144068关注度
往期回顾 全部

科技要闻

车圈顶流雷军直播:现在每天提心吊胆

头条要闻

南昌祖孙被大风卷下楼 家人:孩子在电动车棚上被找到

头条要闻

南昌祖孙被大风卷下楼 家人:孩子在电动车棚上被找到

体育要闻

前国脚:年薪1000万和10万是一样的

娱乐要闻

《酱园弄》官宣!赵丽颖等配角上热搜

财经要闻

围猎三丰智能的神秘基金设骗局转移资产

汽车要闻

元UP中配130kW动力!比亚迪这次不抠门

态度原创

本地
健康
数码
教育
公开课

本地新闻

春色满城关不住|千阳春日限定美景上线了!

这2种水果可降低高血压死亡风险

数码要闻

长沙率先落地!本周末将迎家电以旧换新活动 补贴资金预计达3900万元

教育要闻

鸡兔共8只,鸡腿比兔腿少14条,求鸡兔各几只?

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版