网易首页 > 网易号 > 正文 申请入驻

登Nature子刊,中科院计算所团队开发CarbonDesign

0
分享至

编辑 |萝卜皮

蛋白质是生物体内执行生物功能的基础元件,在催化、免疫和信号传递等生物过程中起着重要作用。

一般认为,蛋白质序列设计是蛋白质结构预测的逆问题。具体地,是指从给定的蛋白质三维结构出发,设计出能够折叠成为目标蛋白结构、具有目标蛋白功能的序列。

它是从头蛋白质设计的关键一步,一旦主链结构被生成,为其设计最佳序列就变得至关重要。蛋白质序列设计在药物设计、酶工程等领域具有重要应用。

由于可能的蛋白质序列和结构比宇宙中的粒子数量还要多,当前实现准确且稳健的蛋白质序列设计,仍然是一个挑战。

中国科学院计算技术研究所张海仓、卜东波带领的蛋白质设计团队开发了蛋白质序列设计新方法 CarbonDesign。

CarbonDesign 是蛋白质序列设计版的 AlphaFold,它从用于蛋白质结构预测的 AlphaFold 模型中汲取灵感,并专门针对蛋白质序列设计进行了算法改进。

该工具能够准确且稳健的设计蛋白质序列,可以被广泛应用于不同蛋白质设计场景,并且可以预测蛋白质突变的功能影响。

该研究「Accurate and robust protein sequence design with CarbonDesign」于2024 年 5 月 23 日发布在《Nature Machine Intelligence》。

论文链接:https://www.nature.com/articles/s42256-024-00838-2

图示:CarbonDesign 整体模型架构。(来源:论文)

CarbonDesign 的核心是利用新颖的网络架构 Inverseformer 作为主链结构编码器,并利用马尔可夫随机场(MRF)模块作为序列解码器。Inverserformer 使用一系列节点更新和三角边更新学习蛋白质结构的单点表示和成对表示,并用这些表示参数化马尔可夫随机场的单体项和双体项。

直观上,与AlphaFold 的 Evoformer 相比,Inverseformer 反转了信息流:Evoformer 是学习从蛋白质序列到结的映射,而 Inverseformer 是学习从蛋白质结构到序列的映射。

论文还介绍了另外两个重要概念:

1. CarbonDesign 采用网络循环策略(network recycling),以端到端的方式引入蛋白质序列语言模型。在数以亿计的蛋白质序列上预训练的蛋白质语言模型,为 CarbonDesign 提供了有效的进化约束和设计序列的先验信息。

2. CarbonDesign 利用多任务学习策略,同时生成蛋白质序列和对应的侧链结构。

论文使用不同的数据集广泛评估了 CarbonDesign,包括CAMEO 数据集、CASP15 数据集以及 AlphaFold 的预测结构。更重要的是,论文也在蛋白质从头设计应用场景下(例如 RFDiffusion 和 FrameDiff)生成的主链结构上,评估了 CarbonDesign 的序列生成能力。

图示:在 RFdiffusion 生成的 de novo 主链结构上评估 CarbonDesign 的性能。(来源:论文)

结果表明,在晶体结构、预测结构和扩散模型生成的主链结构上,CarbonDesign 都显示出准确且稳健的序列生成能力,表明其在多种从头蛋白质设计场景中的实用性。

此外,CarbonDesign 支持以零样本学习的方式来预测序列变异的功能效应,证明了其捕获蛋白质序列及其功能之间内在关系的能力。这表明 CarbonDesgin 也可以作为蛋白质功能突变影响的零样本预测器。

图示:CarbonDesgin 在解释变异功能效应方面的评估。(来源:论文)

CarbonDesign 的论文作者包括任密龙、于春功、卜东波和张海仓;ScienceAI 之前曾报道过卜东波、杨怀义、叶盛老师共同通讯发表在Bioinformatcs 上的算法 ProDesign-LE,其核心思想是用神经网络刻画氨基酸的局部结构微环境进行蛋白质设计,可以点击链接跳转阅读。

图示:蛋白质AI设计平台-CarbonMatrix。(来源:CarbonMatrix团队提供)

另外,张海仓老师指出,CarbonDesign 是 CarbonMatrix-蛋白质 AI 设计平台的一部分。目前 CarbonMatrix 平台已包括:

1、CarbonDesign, 用于蛋白质序列设计。

2、CarbonNovo, 用于端到端的蛋白质从头结构和序列设计。

3、AbX, 用于抗体设计。

CarbonNovo 和AbX 也于近日发表在 AI 顶会 ICML 2024 上。

图示:CarbonNovo 端到端生成蛋白质结构和序列的模型图。(来源:论文)

CarbonNovo 是端到端的蛋白质结构和序列联合设计模型。之前的蛋白质从头设计算法都是两阶段法:1.主链结构生成;2.序列生成。

例如,领域内代表软件 RFdiffusion 等先利用扩散模型生成主链结构,再利用 ProteinMPNN 生成序列。两阶段法的主要问题在于,序列生成的误差不能反馈给结构生成模块。

基于此,CarbonNovo 融合了扩散模型和马尔可夫随机场模型,端到端地生成蛋白质结构和序列,保证了蛋白质序列和结构的一致性。CarbonNovo 能够在蛋白质可设计性等指标上超越了当前最有代表性的方法,如 RFdiffusion,Chroma,FrameDiff 等,显示了一阶段的端到端生成模型优于两阶段生成模型。

图示:AbX抗体设计模型图。(来源:论文)

AbX 是专门用于抗体设计的生成模型。当前 AI 抗体设计领域,面临的主要困难在于抗体-抗原复合物数据严重不足,难以训练大规模抗体生成模型。基于此,AbX 将蛋白质语言模型中的进化约束和Rosetta 能量函数中的几何和物理约束引入扩散模型,用于指导抗体生成过程,缩小结构和序列的可能搜索空间。

论文在两个抗原抗体独立测试集上进行评测, AbX 在所有指标上(例如抗体-抗原结合能)大幅度超越了当前主流 AI 方法如 DyMean,Diffab 等。CarbonMatrix 团队正在进行抗体设计方面的生物实验,以进一步验证 AbX 在抗体设计上的有效性。

目前,CarbonDesign 已经开源,CarbonNovo 和AbX 等软件也将会在近期全部开源。

github 地址:https://github.com/zhanghaicang/carbonmatrix_public

CarbonMatrix 团队将继续致力于 AI 蛋白质设计模型的开发,也欢迎业界人士使用其平台。

CarbonMatrix平台相关论文:

1、Accurate and robust protein sequence design with CarbonDesign. Milong Ren, Chungong Yu, Dongbo Bu, Haicang Zhang. Nature Machine Intelligence. 6, 536–547 (2024).

论文链接:https://doi.org/10.1038/s42256-024-00838-2

2、Antibody Design Usinga Score-based Diffusion Model Guided by Evolutionary, Physical and Geometric Constraints. Tian Zhu, Milong Ren, Haicang Zhang. ICML 2024.

论文链接:https://icml.cc/virtual/2024/poster/35143

3、CarbonNovo: Joint Design of Protein Structure and Sequence Using a Unified Energy-based Model. Milong Ren, Tian Zhu, Haicang Zhang. ICML 2024.

论文链接:https://icml.cc/virtual/2024/poster/34533

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
比真烟还好抽?中国最大的“假烟”制造县,横扫美国销量上千亿!

比真烟还好抽?中国最大的“假烟”制造县,横扫美国销量上千亿!

阅微札记
2026-02-02 22:49:05
全网被小玥儿惊艳!长发神似飘飘大S,这是大S派来人间替她复仇的吧

全网被小玥儿惊艳!长发神似飘飘大S,这是大S派来人间替她复仇的吧

八卦王者
2026-02-03 09:37:44
“中国只需静观其变,看着对手不断犯错”

“中国只需静观其变,看着对手不断犯错”

观察者网
2026-02-03 10:37:07
汪小菲根本不爱大S!大S周年祭,带两孩子广州游玩,缺席妈妈的仪式

汪小菲根本不爱大S!大S周年祭,带两孩子广州游玩,缺席妈妈的仪式

八卦王者
2026-02-03 10:14:03
春运大巴逆袭封神,干翻高铁的,是数亿打工人回家刚需

春运大巴逆袭封神,干翻高铁的,是数亿打工人回家刚需

老特有话说
2026-02-02 22:26:24
阿森纳欧冠八场全胜,奖金却不及利物浦曼城

阿森纳欧冠八场全胜,奖金却不及利物浦曼城

浮萍足球
2026-02-03 01:43:10
1949年,袁世凯后人在美国的罕见合影,个个文质彬彬,出类拔萃

1949年,袁世凯后人在美国的罕见合影,个个文质彬彬,出类拔萃

万物知识圈
2025-12-13 09:20:48
人不会无故大脑萎缩!医生提醒:大脑萎缩的人,多半有这些习惯

人不会无故大脑萎缩!医生提醒:大脑萎缩的人,多半有这些习惯

蜉蝣说
2026-01-29 15:15:16
1岁幼童喂兔子被咬断手指,家长为找断指将兔子开膛破肚……医生提醒→

1岁幼童喂兔子被咬断手指,家长为找断指将兔子开膛破肚……医生提醒→

纵相新闻
2026-02-01 15:09:04
200-400万存款家庭数量,超乎你想象!

200-400万存款家庭数量,超乎你想象!

这班我上够了
2026-01-08 17:30:03
别再聊戚薇金晨了!宋小宝600多刀微调真相才是真的绝

别再聊戚薇金晨了!宋小宝600多刀微调真相才是真的绝

乡野小珥
2026-02-03 01:22:50
苹果突然官宣:2月2日,新商店上线

苹果突然官宣:2月2日,新商店上线

3C毒物
2026-02-02 00:09:42
星光大赏:童瑶眼歪嘴斜,宋茜太呆板,70岁的她光是坐着就赢了

星光大赏:童瑶眼歪嘴斜,宋茜太呆板,70岁的她光是坐着就赢了

一娱三分地
2025-12-22 13:13:51
1949年蒋介石率部退守台湾,当时他手里到底还剩多少兵力?答案简直让人难以置信

1949年蒋介石率部退守台湾,当时他手里到底还剩多少兵力?答案简直让人难以置信

史海孤雁
2026-01-26 15:10:17
联合国崩?191国收到信函,古特雷斯下台前:阴了中国,帮了美国

联合国崩?191国收到信函,古特雷斯下台前:阴了中国,帮了美国

梦史
2026-02-02 10:56:33
太突然!山东一大公司破产了!

太突然!山东一大公司破产了!

莱芜福禧今日信息
2026-02-03 06:32:59
雄鹿为留住字母疯了!让29岁全明星签300万合同,鹈鹕或成大赢家

雄鹿为留住字母疯了!让29岁全明星签300万合同,鹈鹕或成大赢家

你的篮球频道
2026-02-02 15:01:00
黑色星期一!见证历史!

黑色星期一!见证历史!

中国基金报
2026-02-02 15:27:51
日本演员吃23年中国饭,娶中国妻子却发出辱华言论,如今怎么样了

日本演员吃23年中国饭,娶中国妻子却发出辱华言论,如今怎么样了

不写散文诗
2026-01-14 11:52:15
扎心了!原来只要失业,所有人都一样!网友分享越看越心凉 太难了

扎心了!原来只要失业,所有人都一样!网友分享越看越心凉 太难了

有趣的火烈鸟
2025-12-31 20:39:06
2026-02-03 11:12:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1224文章数 223关注度
往期回顾 全部

科技要闻

马斯克官宣,SpaceX并购xAI,打造天基算力

头条要闻

克林顿夫妇同意就爱泼斯坦案调查赴美众议院作证

头条要闻

克林顿夫妇同意就爱泼斯坦案调查赴美众议院作证

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

小S致词:感谢具俊晔陪伴大S的最后3年

财经要闻

“精准查人”黑产链条遭查

汽车要闻

全新宝马X5领衔 宝马2026巴黎车展阵容公布

态度原创

游戏
旅游
艺术
本地
公开课

毛味废土RPG新作《核爆RPG 2》公开 经典黑岛老辐射味

旅游要闻

颐和园冰场2月3日营业结束后关闭

艺术要闻

2026年,中国最值得期待的20个新建筑

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版