网易首页 > 网易号 > 正文 申请入驻

ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态

0
分享至

机器之心发布

机器之心编辑部

2024 年的诺贝尔化学奖颁发给了在结构生物学领域取得重大成就的 David Baker 团队和 AlphaFold 团队,激发了 AI for science 领域新的研究热潮。

近两年科学界一个饱受争议的命题是:“AlphaFold 是否终结了结构生物学?” 首先,AlphaFold 之类的结构预测模型的训练数据正是来自于以 X 射线、冷冻电镜(cryo-EM)等为代表的传统结构解析方法。其次,冷冻电镜技术非常擅长解析蛋白质的动态,而这正是 AlphaFold 所无法做到的。巧合的是,冷冻电镜这项技术于 2017 年也获得了诺贝尔化学奖。

那么,以 AlphaFold 为代表的 AI 技术能否辅助以 cryo-EM 为代表的传统方法?两个诺奖级技术的碰撞,能够擦出什么样的火花?

ByteDance Research 提出 AI for Science 模型被 Nature 子刊收录

近日,来自字节跳动 ByteDance Research 团队的研究人员提出了 CryoSTAR 方法,成功将来自原子模型的结构先验应用到冷冻电镜实验数据的动态解析中,为解决这一问题带来了新的思路和方法。该成果相关论文 “CryoSTAR: Leveraging Structural Prior and Constraints for Cryo-EM Heterogeneous Reconstruction” 已刊发于 Nature 旗下刊物 Nature Methods,李宜来、周奕、袁璟为共同一作,顾全全教授为通讯作者。

  • 论文链接:https://www.nature.com/articles/s41592-024-02486-1
  • 论文主页:https://bytedance.github.io/cryostar/
  • 开源链接:https://github.com/bytedance/cryostar

基于结构先验和约束的动态解析

CryoSTAR 是首个成功在冷冻电镜实验数据上应用蛋白质原子结构模态先验的方法,方法的主要特点有:

  1. 结合蛋白质结构先验知识:CryoSTAR 方法创新性地利用原子模型信息作为结构正则化来解决冷冻电镜数据中的构象动态问题,这与以往大多数仅从计算机视觉角度处理问题的方法不同。它要求一个初始原子模型作为参考,将其结构信息用于适当地约束模型解析出的构象动态,从而缩小搜索空间,避免错误的解析结果,实现更好更快的收敛。
  2. 输出两种模态的解析结果:该方法独特之处在于它能同时输出粗粒度的原子模型和密度图解析结果,这种多维度的结果输出有助于研究人员更全面地了解生物分子的结构和动态过程。同时,密度图的输出结果也可以验证原子模型结果的置信程度,检验粗粒度原子模型的动态是否能够充分被数据所支持。

该方法分为两个阶段:

  1. 第一阶段通过结构正则化约束的变分自动编码器(VAE)解析数据中的动态构象。CryoSTAR 通过 Encoder,将构象的动态压缩到一个潜在变量中;Decoder 将潜在变量解析成相应的先验粗粒度原子模型的变形来拟合数据。它在三个基本假设下进行基于结构正则化:一是同一链上的两个相邻残基应始终保持连接,通过连续损失函数来约束;二是预测变形后残基不应过于靠近,通过冲突损失函数来惩罚碰撞;三是局部结构应尽可能刚性,通过从先验原子结构模型构建弹性网络并使用弹性网络损失函数来鼓励这种刚性,同时还采用自适应松弛方法来选择弹性网络中的边进行正则化,以避免参考原子模型带来的过度偏差。
  2. 第二阶段通过训练一个密度图解码器来得到密度图模态的动态构象解析结果。在 VAE 训练完成后,提取所有图像对应的潜在变量并用于训练密度图解码器。密度图的细节优化由输入图像约束,不受结构先验和正则化的直接影响,从而最小化结构先验对输出密度图的 bias,使得生成的密度图可用于评估和验证粗粒度原子结构模型。

多种典型蛋白数据上的实验验证

图 3 EMPIAR-10180 结果

图 4 EMPIAR-10073 结果

大型复合物(残基数量约 10,000)

CryoSTAR 在多个公开数据集(EMPIAR)的冷冻电镜实验数据上得到了验证。对于酵母预催化 B 复合物剪接体(EMPIAR-10180),使用 PDB: 5NRL 作为先验结构,cryoSTAR 成功揭示了 SF3b 和解旋酶区域的构象变化,其结果与其他方法一致,并且生成的粗粒度模型在电子密度图中得到了充分验证,展现出合理的运动模式。对于 U4/U6.U5 三核糖核蛋白(EMPIAR-10073),以 PDB: 5GAN 为参考结构,cryoSTAR 同样解析了头部结构域的动态变化,结果与现有方法的发现一致。

图 5 EMPIAR-10059 结果

图 6 EMPIAR-10827 结果

膜蛋白(氨基酸数量约 2,000)

图 7 CryoSTAR 与 CryoDRGN 在 EMPIAR-10059 上的结果对比

对于 TRPV1 通道蛋白(EMPIAR-10059),使用 PDB: 7RQW 作为参考先验原子模型,cryoSTAR 发现了蛋白外周可溶结构域的微妙而平滑的运动,每个亚基的运动可通过不同主成分可视化。研究还表明结构正则化在揭示膜蛋白动力学方面具有关键作用,相比之下,没有结构先验的方法如 cryoDRGN 在膜蛋白的动态解析方面存在不足。

单链蛋白(氨基酸数量约 1,000)

图 8 CryoSTAR 与 CryoDRGN、3DFlex 在 EMPIAR-10059 上的结果对比

对于 毒素蛋白 α-LCT(EMPIAR-10827),cryoSTAR 揭示了两种类型的运动,与离散 3D 分类发现的两种构象相吻合,且生成的粗粒度原子模型合理,与密度图拟合良好。结构正则化在这个具有连续异质性的小蛋白中效果显著,相比其他方法如 cryoDRGN 和 3DFlex,cryoSTAR 生成的密度图更连续,能有效避免密度图中的伪影。

总结:利用跨模态数据解析自然现象

字节跳动 ByteDance Research 提出的新的结合结构先验的方法 (CryoSTAR) 显著提升了冷冻电镜(Cryo-EM)在动态构象解析中的应用潜力。通过利用原子结构模态先验作为约束,同时输出两种模态的解析结果,这一创新方法在技术上展示了其独特的优势,并为科学研究打开了新的大门。

该研究在冷冻电镜动态解析领域的重要意义不可忽视。传统的冷冻电镜方法由于其分辨率和解析能力的限制,常常难以捕捉到生物大分子复杂的动态变化。而此次引入结构先验的策略,极大地增强了动态构象解析的精度与可靠性,使我们能够更深入地理解生物大分子的动态行为及其机制。

这种方法的潜在价值在生命科学和制药领域尤为突出。生物大分子的动态解析是理解其功能机制的关键,如蛋白质的折叠、酶活性部位的变化、受体 - 配体的结合模式等。这些动态过程与众多生理与病理现象息息相关,例如细胞信号传导、代谢调控以及疾病发生机制等。因此,准确解析这些动态过程不仅能帮助揭示生物学基本问题,还能为发现新型药物靶点和优化药物设计提供重要依据。在制药领域,这一方法同样具有广泛的应用前景。通过更高精度地捕捉蛋白质和其他生物大分子的动态变化,研究人员可以更有效地筛选潜在药物、设计更具针对性的药物分子,进而提高药物研发的效率和成功率。例如,这一方法可以帮助解析癌症、神经退行性疾病等重大疾病相关蛋白质的动态构象变化,为开发新药物提供详细的分子级信息。

总而言之,ByteDance Research 的这一创新研究不仅代表了冷冻电镜动态解析技术的最新进展,更为生命科学和制药领域带来了巨大的潜在价值。期待未来该方法能在更多研究和实际应用中得到验证和推广,为生命科学研究以及药物研发带来新的突破和希望。

ByteDance Research AI 制药团队持续在 AI for Science 方向发力

ByteDance Research AI 制药团队致力于将人工智能技术应用于科学研究与药物开发。团队在生成式蛋白质设计、蛋白质构象预测以及冷冻电镜解析等领域取得了业界瞩目的成果。

  • 蛋白质设计:团队研发了基于大规模蛋白质语言模型的序列设计方法 LM-Design [1],大幅提高了蛋白质序列设计的准确度与效率;研发了结合扩散模型与语言模型的新一代蛋白质基础模型 DPLM 1/2 [2, 3],首次全面统一了蛋白质建模、理解与生成;研发了基于偏好优化的抗体设计方法 AbDPO [4],能够设计出同时满足多种性质和能量要求的抗体。
  • 蛋白质动态构象预测:团队研发了 ConfDiff [5] 等模型,准确预测了蛋白质的构象变化,加深了对蛋白质生物过程的理解,还为新药研发提供了可靠的理论基础。
  • 冷冻电镜解析:团队研发了 CryoSTAR [6] 电镜解析工具,结合人工智能技术和高分辨率成像,有助于揭示复杂生物分子体系的构象特征和动态变化;研发了第一个蛋白质密度基座模型 CryoFM [7],为下一代电镜解析算法奠定了基础。

团队的研究成果多次发表在 Nature 子刊、ICML、NeurIPS、ICLR 等顶级学术会议上,得到学术界和业界的广泛认可。

参考文献

[1] Zheng Z, Deng Y, Xue D, et al. Structure-informed language models are protein designers [C]//International conference on machine learning. PMLR, 2023: 42317-42338.

[2] Wang X, Zheng Z, Ye F, et al. Diffusion Language Models Are Versatile Protein Learners [C]. International Conference on Machine Learning, 2024.

[3] Wang X, Zheng Z, Ye F, et al. DPLM-2: A Multimodal Diffusion Protein Language Model [J]. arXiv preprint arXiv:2410.13782, 2024.

[4] Zhou X, Xue D, Chen R, et al. Antigen-Specific Antibody Design via Direct Energy-based Preference Optimization [C]. NeurIPS, 2024.

[5] Wang Y, Wang L, Shen Y, et al. Protein Conformation Generation via Force-Guided SE (3) Diffusion Models [C]. International Conference on Machine Learning, 2024.

[6] Li Y, Zhou Y, Yuan J, et al. CryoSTAR: leveraging structural priors and constraints for cryo-EM heterogeneous reconstruction [J]. Nature Methods, 2024: 1-9.

[7] Zhou Y, Li Y, Yuan J, et al. CryoFM: A Flow-based Foundation Model for Cryo-EM Densities. arXiv preprint arXiv:2410.08631, 2024.

文内视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650942721&idx=2&sn=46e92e291de4b4c2e84653daed604e43&chksm=84e7e97fb39060693788909e87ca5564198a19dede96165c35c3cb15d3f13ad720072bec07af&token=1483518759&lang=zh_CN#rd

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
饥荒饿死1/3人口、2.5万精英被处决:5月31日哈萨克在纪念什么

饥荒饿死1/3人口、2.5万精英被处决:5月31日哈萨克在纪念什么

卷史
2026-06-01 11:19:40
稻城亚丁“省道”,车票收入超1亿元

稻城亚丁“省道”,车票收入超1亿元

中国新闻周刊
2026-06-01 20:10:11
云南一博士生实名举报导师,对话录音曝光,导师声称:我只有一项国自然,你得自己掏钱做实验

云南一博士生实名举报导师,对话录音曝光,导师声称:我只有一项国自然,你得自己掏钱做实验

生物学霸
2026-06-01 17:18:39
给5岁女儿买11200元连衣裙,明明打对折,结果专柜收了全款!销售求原谅:工资低也可怜;爸爸怒了:他们道德绑架!

给5岁女儿买11200元连衣裙,明明打对折,结果专柜收了全款!销售求原谅:工资低也可怜;爸爸怒了:他们道德绑架!

扬子晚报
2026-06-01 12:26:28
“民警猥亵女子事件”苦主发声:我遇到了一匹贪得无厌的色狼!

“民警猥亵女子事件”苦主发声:我遇到了一匹贪得无厌的色狼!

兵叔评说
2026-06-01 15:23:37
台海观澜 | 马英九不能不服老,郑丽文还须明大局

台海观澜 | 马英九不能不服老,郑丽文还须明大局

经济观察报
2026-06-01 16:56:29
全球股市,全线跳水!原油狂飙,伊朗突然宣布:暂停谈判!

全球股市,全线跳水!原油狂飙,伊朗突然宣布:暂停谈判!

中国基金报
2026-06-01 22:23:04
编剧汪海林再炮轰:中国电视剧里,为什么再也见不到一个正常男人

编剧汪海林再炮轰:中国电视剧里,为什么再也见不到一个正常男人

橙星文娱
2026-06-01 11:08:30
53岁任泉近况曝光!被曝与黄绮雯隐婚17年,身价几十亿成人生赢家

53岁任泉近况曝光!被曝与黄绮雯隐婚17年,身价几十亿成人生赢家

观史搜寻着
2026-06-01 10:57:12
7月1日起!投资美股不报备,就要没收违法所得...

7月1日起!投资美股不报备,就要没收违法所得...

玛丽姬丝
2026-06-01 15:29:35
“消失”10年后,任泉被曝与黄绮雯隐婚17年,原来他已是人生赢家

“消失”10年后,任泉被曝与黄绮雯隐婚17年,原来他已是人生赢家

喜欢历史的阿繁
2026-06-02 00:49:16
基辅议会大厅内,298张赞成票落下,他拿到了欧盟900亿欧元的贷款

基辅议会大厅内,298张赞成票落下,他拿到了欧盟900亿欧元的贷款

空想之喵
2026-06-01 03:39:32
独家:原中国航天科工集团董事长曾是著名导弹专家   其妻子曾在宾馆工作? 照顾了他半生

独家:原中国航天科工集团董事长曾是著名导弹专家  其妻子曾在宾馆工作? 照顾了他半生

新浪财经
2026-05-31 15:40:03
释永信判24年!向太曾开玩笑说李连杰:释永信被抓全是你害的

释永信判24年!向太曾开玩笑说李连杰:释永信被抓全是你害的

生活魔术专家
2026-06-02 00:10:59
同学聚会,发现一个扎心现象,年过40岁的女同学,1/3没工作,1/3做着低薪没前途的工作...

同学聚会,发现一个扎心现象,年过40岁的女同学,1/3没工作,1/3做着低薪没前途的工作...

背包旅行
2026-06-01 17:39:34
女员工嘲讽顾客“穷逛”后续:本人火到香港已社死,商场也被坑惨

女员工嘲讽顾客“穷逛”后续:本人火到香港已社死,商场也被坑惨

哄动一时啊
2026-06-01 19:30:38
距世界杯仅11天,名记:欧冠决赛加重萨利巴伤势,球员或伤缺数周

距世界杯仅11天,名记:欧冠决赛加重萨利巴伤势,球员或伤缺数周

懂球帝
2026-06-01 18:48:25
北京楼市开始离谱了!朝阳区北四环板块房价从14.3万变成7.5万

北京楼市开始离谱了!朝阳区北四环板块房价从14.3万变成7.5万

靓仔情感
2026-06-02 00:56:37
26年来以色列向黎巴嫩最深推进,插旗战略城堡“南方之眼”!法国怒批:不可接受

26年来以色列向黎巴嫩最深推进,插旗战略城堡“南方之眼”!法国怒批:不可接受

红星新闻
2026-06-01 16:40:13
这跟不穿有啥区别!北京这一夜,31岁徐璐穿透视礼服,属实辣眼睛

这跟不穿有啥区别!北京这一夜,31岁徐璐穿透视礼服,属实辣眼睛

八斗小先生
2026-05-29 19:24:16
2026-06-02 03:48:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1316文章数 227关注度
往期回顾 全部

科技要闻

黄仁勋演讲实录|40年来PC首次重设计!

头条要闻

伊朗计划彻底封锁霍尔木兹海峡 特朗普回应

头条要闻

伊朗计划彻底封锁霍尔木兹海峡 特朗普回应

体育要闻

杰威:如果我没受伤,我们能击败马刺

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

宇树过会,杭州赢麻了

汽车要闻

奇瑞集团5月销量24.8万辆 同比增长20.5% 出口18.2万辆再创新高

态度原创

教育
手机
数码
时尚
艺术

教育要闻

我给她钱 换来的不是感激 而是她的谩骂

手机要闻

华为nova 16系列支持5A速度!传输、流畅度领先友商17 Pro

数码要闻

惠普推OmniDesk迷你主机:配英特尔新U支持AI加速

夏天裤子不用多买,阔腿裤一整个夏天都能穿,日常出行好打理

艺术要闻

吴镇写竹,清清爽爽

无障碍浏览 进入关怀版