网易首页 > 网易号 > 正文 申请入驻

Science重磅:AI完成定向蛋白质进化,特性提升100倍

0
分享至

大自然擅长设计蛋白质。科学家甚至更擅长,人工智能(AI)有望帮助人类多次实现定向蛋白质进化。

来自哈佛医学院、麻省理工学院等多家顶尖学术机构联合组成的研究团队在这一领域带来了新的突破,他们开发了一个人工智能(AI)平台 EVOLVEpro,将蛋白质设计精准度推向新高度——

EVOLVEpro 平台基于少样本主动学习框架,结合蛋白质语言模型(PLMs)和回归模型,无需依赖结构信息、专家经验或其他先验数据,仅通过蛋白质序列进行高效优化,实现了快速预测高活性蛋白突变体。

更重要的是,EVOLVEpro 在 RNA 生产、基因编辑及抗体结合等应用中展示出了优越的性能,能使所需特性提升 100 倍。研究结果显示,平台在癌细胞中大幅优化了基因编辑工具的活性,同时也改良了抗体的结合能力和表达水平。

此外,针对新型脂质纳米颗粒(LNP)的优化实验表明,EVOLVEpro 几乎完全消除了基因编辑工具的脱靶效应,为精准医疗的应用提供了坚实基础。

相关研究论文以 “Rapid in silico directed evolution by a protein languagemodel with EVOLVEpro” 为题,已发表在权威科学期刊 Science 上。

这种创新方法为跨领域应用提供了全新可能性,从抗体优化到基因编辑工具改良,都展现出了优异性能。

攻克蛋白质优化与基因编辑难题

在生物医学领域,如何优化蛋白质以提高其特定活性始终是极具挑战的任务。这种优化对于抗体研发、基因编辑工具改良以及疫苗设计等领域至关重要。

然而,传统技术如深度突变扫描(DMS)或定向进化,往往需要大量实验验证,不仅耗时费力,还容易陷入局部最优解。

基因编辑技术也面临类似难题。例如,CRISPR-Cas9 技术尽管显著推动了基因编辑的进展,却在精准性和递送效率上面临瓶颈。一方面,脱靶效应使得编辑可能产生非预期突变,带来副作用风险;另一方面,现有的 mRNA 递送系统在目标细胞中表现出较低的稳定性,限制了基因治疗的效果。

近年来,深度学习技术的发展为蛋白质优化领域注入了新动能。蛋白质语言模型通过大规模序列数据库训练,能够捕捉蛋白质序列与其结构和功能之间的复杂关系。

然而,这些模型在优化蛋白质活性时表现有限,在优化蛋白质活性时,它们难以精准捕捉复杂适应度景观,特别是在涉及蛋白质非结合特征的任务中。

为突破这一困境,研究团队开发了 EVOLVEpro。该平台结合深度学习与主动学习策略,不仅降低了对实验数据的依赖,还通过智能选择最优突变体进行实验验证,大幅减少了实验次数。

图|开发用于蛋白质语言模型引导工程的 EVOLVEpro 并进行基准测试

与传统的定向进化和现有 AI 方法相比,EVOLVEpro 显现出三大优势:

  • 突破数据依赖:无需蛋白质结构信息、专家知识或复杂实验数据,完全基于少量蛋白质序列实现高效优化。

  • 高效主动学习:通过主动学习框架,EVOLVEpro 能够智能选择最优突变体进行实验验证,大幅减少实验次数。

  • 跨领域应用潜力:在 mRNA 递送、基因编辑工具改良等多个领域表现出卓越的性能。

研究团队通过 12 个深度突变扫描数据集,优化了 EVOLVEpro 参数,采用网格搜索选择最佳蛋白质语言模型(如 ESM2),并测试了不同回归模型(如随机森林、k 近邻回归器)对性能的影响。

全方位突破:从抗体优化到基因编辑工具

为了验证 EVOLVEpro 的实际性能,研究团队以 C143 抗体和抗人转铁蛋白受体的 aCD71 抗体为目标,评估了它在抗体结合能力优化中的表现。

研究结果显示,经过四轮优化后,C143 抗体的最佳轻链突变体 N28R 显著提升了结合亲和力,其结合半数抑制浓度(IC50)降至 60 pM,多突变体结合亲和力提高至野生型的 35 倍。

图|利用 EVOLVEpro 对高活性微型 CRISPR 核酸酶进行改造

在针对 aCD71 抗体优化实验中,则发现最佳重链突变体 S92A 结合 IC50 达到 29 pM,进一步设计的多突变体结合 IC50 效率达到 19 pM,同时提升了抗体的表达水平和亲和力。

而在与多种蛋白质语言模型比较中,ESM-2 15B 参数模型作为 EVOLVEpro 的潜在空间模型,在多数数据集上表现优于其他模型,返回的高活性突变体比例最高,且只有少数蛋白质语言模型的预测准确性明显高于独热编码,突出了基础层模型对 EVOLVEpro 性能的关键重要性。

在基因编辑工具方面,研究团队将目标锁定在微型 CRISPR 核酸酶 PsaCas12f 和 Bxb1 整合酶的活性改良上。通过四轮单突变体优化,PsaCas12f 在多个靶点的插入缺失效率显著提高。

图|用 EVOLVEpro 对 prime editor 进行进化

研究发现,最佳变体 PsaCas12f K333V 在 RNF2 基因位点的插入缺失效率提高至 40%,进一步组合的多突变体则将效率提升至约 50%。组合多突变体的平均编辑活性提高 2.2 至 44 倍,相较其他 Cas12f 效应子表现优异。

类似地,在 Bxb1 整合酶进化实验中,经过多轮进化得到的突变体活性提升至野生型的 2.6 倍以上,在基因组中基因货物的整合效率提高多达 4 倍,为基因组编辑和大基因货物整合提供了更强的工具。

此外,针对 mRNA 生产中的 T7 RNA 聚合酶,EVOLVEpro 通过多轮进化显著提升 T7 RNA 聚合酶性能。

在 T7 RNA 聚合酶进化实验中,经过四轮优化,最佳突变体 E643G 产生的荧光素酶 mRNA 较野生型的翻译效率提升 34 倍,免疫原性比野生型降低 98%。

在临床相关的 IVT 环境下,与野生型和之前工程改造的突变体比较,优化版 epT7 酶生产的 mRNA 在体外转录实验中,翻译效率较野生型高 120 倍,免疫原性低 256 倍。

图|为高产且低免疫原性的 mRNA 生产对 RNA 聚合酶进行工程改造

此外,研究人员还进行了多维度性能验证与机制解析,不仅验证了 EVOLVEpro 的优越性能,也揭示了突变提升活性的机制。

通过 AlphaFold3 对不同蛋白质的结构预测以及对模型关注残基的分析,研究团队发现,PsaCas12f 中的 K333V 突变通过稳定结构和调节模板结合增强了活性,而 T7 RNA 聚合酶中的 E643G 突变则显著减少了免疫反应。

图|epT7 在环状 RNA 生产及体内生物发光方面的应用

不足与展望

尽管 EVOLVEpro 展现了极大的潜力,但研究团队也指出了一些存在的挑战。

EVOLVEpro 在一定程度上克服了蛋白质语言模型的一些问题,但蛋白质语言模型固有的局限性依然存在影响。例如,蛋白质语言模型是通过学习掩码序列重建任务训练的,自然序列不一定选择最优蛋白质活性,导致其学习的活性景观与实际蛋白质活性景观常不相关,即使增加蛋白质语言模型的参数也未必能更好地预测蛋白质活性及其他下游任务。

其次,在一些蛋白质的研究中,如不同蛋白质的适应度与活性之间的关系虽然通过分析有了一定的了解,但整体上这种关系还不够明确和稳定,不同蛋白质呈现出不同的相关性情况,给准确预测和优化带来一定难度。

为此,研究团队计划,随着自回归蛋白质语言模型或下一代表示模型的出现,将继续改进 EVOLVEpro 模型,利用其模块化设计将新的模型优势整合进来,进一步提高模型的性能和预测准确性。

他们表示,将把 EVOLVEpro 应用到更多类型的蛋白质和生物医学相关领域,进一步探索其在不同蛋白质特性优化、不同应用场景下的表现,深入研究蛋白质活性提升的各种机制以及不同突变之间的复杂相互作用,以更好地实现蛋白质工程的目标,满足生物医学等领域对高性能蛋白质的需求。

研究人员还将尝试基于生物物理的模型与 EVOLVEpro 建立的回归顶层方法相结合,进一步提高预测准确性,并实现对功能获得性突变体的更快速准确识别,从而更高效地优化蛋白质的各种特性。

EVOLVEpro 的问世为蛋白质优化与基因编辑工具的研发提供了全新视角。从抗体设计到精准基因编辑,再到高效 mRNA 生产,EVOLVEpro 通过 AI 驱动的高效突变体筛选,正在重新定义生物医学的研发效率与可能性

随着技术的持续迭代与优化,未来生命科学或将迎来更多突破性发现,为癌症治疗、基因疗法以及新药研发提供新的可能

作者:田小婷

如需转载或投稿,请直接在公众号内留言

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
每天7点起床画眉贴胡子,驱车1小时赶到临安衣锦城!山西00后小伙过年不回家,留在杭州当“吴越钱王”

每天7点起床画眉贴胡子,驱车1小时赶到临安衣锦城!山西00后小伙过年不回家,留在杭州当“吴越钱王”

都市快报橙柿互动
2026-02-20 00:37:22
谷爱凌又逆风翻盘:失误后从第20冲上第5,中国队4人参赛全进决赛

谷爱凌又逆风翻盘:失误后从第20冲上第5,中国队4人参赛全进决赛

侃球熊弟
2026-02-20 05:28:14
“空气香甜女”杨舒平,已被美国驱逐出境,如今回国下场大快人心

“空气香甜女”杨舒平,已被美国驱逐出境,如今回国下场大快人心

哄动一时啊
2026-02-19 19:18:33
美国向联合国支付1.6亿美元部分欠款

美国向联合国支付1.6亿美元部分欠款

界面新闻
2026-02-20 07:15:02
太真实!河南舅舅锁门躲拜年,一看门口礼物,戳中无数人的痛点…

太真实!河南舅舅锁门躲拜年,一看门口礼物,戳中无数人的痛点…

火山詩话
2026-02-20 16:02:51
美国华裔选手夺金登上热搜第2 仅次于宁忠岩 美媒借她恶评谷爱凌

美国华裔选手夺金登上热搜第2 仅次于宁忠岩 美媒借她恶评谷爱凌

念洲
2026-02-20 11:19:15
消防车坠崖后续!当地人曝更多 都是二十来岁小伙,原因曝光太痛心

消防车坠崖后续!当地人曝更多 都是二十来岁小伙,原因曝光太痛心

天气观察站
2026-02-20 12:39:37
突发!集体拉升!变天了?

突发!集体拉升!变天了?

魏家东
2026-02-20 09:28:27
发生了啥?港股大跳水、恒生科技大跌2.53%,“假期大涨”规律失效了

发生了啥?港股大跳水、恒生科技大跌2.53%,“假期大涨”规律失效了

看财经show
2026-02-20 17:13:23
美国拟开发一个网站帮其他国家用户“翻墙”

美国拟开发一个网站帮其他国家用户“翻墙”

辇毂
2026-02-20 10:12:47
被称为“中国最大忽悠”的贾跃亭,似乎要翻身了。

被称为“中国最大忽悠”的贾跃亭,似乎要翻身了。

流苏晚晴
2026-02-19 16:19:47
金牌数3-5!冬奥会最后3天,中国还有3个夺金点,日本保不住前十

金牌数3-5!冬奥会最后3天,中国还有3个夺金点,日本保不住前十

侃球熊弟
2026-02-20 15:55:24
震惊!茂名一女子哭诉超市老板年初一到家炒她“鱿鱼”,原因不明

震惊!茂名一女子哭诉超市老板年初一到家炒她“鱿鱼”,原因不明

火山詩话
2026-02-19 14:07:55
安德鲁被警方逮捕,英国国王发声

安德鲁被警方逮捕,英国国王发声

环球网资讯
2026-02-19 20:46:06
湖北烟花店爆炸进展:老板林某身亡,家人受牵连,面临巨大赔偿

湖北烟花店爆炸进展:老板林某身亡,家人受牵连,面临巨大赔偿

一盅情怀
2026-02-20 16:24:28
1978年,胡耀邦找宋任穷谈话:你接替我任中央组织部长,别犹豫了

1978年,胡耀邦找宋任穷谈话:你接替我任中央组织部长,别犹豫了

春秋砚
2026-02-20 14:55:03
2018年,张扣扣向王家复仇,唯独不杀王自新妻子:她有不死的理由

2018年,张扣扣向王家复仇,唯独不杀王自新妻子:她有不死的理由

米果说识
2026-02-19 09:32:34
人民币在朝鲜的购买力,到底有多强?一位中国游客的震撼之旅

人民币在朝鲜的购买力,到底有多强?一位中国游客的震撼之旅

番外行
2026-02-11 14:19:41
摔倒被扶反索赔22万后续:律师发声,案件焦点已明,赔偿跑不掉了

摔倒被扶反索赔22万后续:律师发声,案件焦点已明,赔偿跑不掉了

离离言几许
2026-02-20 10:16:46
“茶几”正在退出中国家庭,学广东人这样做,实用性让人大开眼界

“茶几”正在退出中国家庭,学广东人这样做,实用性让人大开眼界

室内设计师有料儿
2026-02-19 11:17:18
2026-02-20 19:07:00
学术头条
学术头条
致力于学术传播和科学普及,重点关注AI4Science、大模型等前沿科学进展。
1430文章数 5081关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

歌曲被王菲春晚选中 原唱感激:王菲让这首歌充满神性

头条要闻

歌曲被王菲春晚选中 原唱感激:王菲让这首歌充满神性

体育要闻

宁忠岩:我拿过那么多银牌和铜牌 现在终于赢了

娱乐要闻

苏翊鸣夺金朱易示爱,两人默契引热议

财经要闻

太疯狂!“顾客不问价直接出手”

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

艺术
亲子
健康
数码
房产

艺术要闻

李白若在世,诺贝尔文学奖会是他的囊中物吗?

亲子要闻

宝蓝用新鲜水果和牛奶做了冰淇淋,好玩又好吃~

转头就晕的耳石症,能开车上班吗?

数码要闻

苹果M5 Pro/Max迎来封装革命,针对此前过热降频问题

房产要闻

春节三亚楼市再放大招!千亿巨头,重磅推出超性价比海景现房

无障碍浏览 进入关怀版