网易首页 > 网易号 > 正文 申请入驻

AI+蛋白质设计,开启生物工程黄金时代

0
分享至

蛋白质作为生命的基本构建块,其结构和功能决定了生物过程的复杂性,从细胞信号传导到酶催化反应,再到免疫响应,一切都依赖于这些分子机器的精确运作。传统蛋白质设计方法主要依赖于实验生物学的手段,例如通过随机突变、定向进化或理性设计来修改现有蛋白质的序列,以实现特定的功能改进。这种方法虽然在过去几十年中取得了显著成就,比如在开发新型酶或抗体方面,但它面临着巨大的挑战:耗时长、成本高、成功率低。通常,一个新的蛋白质设计项目可能需要数月甚至数年的实验迭代,而且由于蛋白质序列空间的巨大规模,传统方法往往只能探索其中极小的一部分。

图片来源:摄图网

随着人工智能的快速发展,特别是深度学习、生成模型和强化学习等技术的兴起,蛋白质设计领域正迎来一场革命性的变革。这些AI技术不仅仅是辅助工具,而是从根本上改变了设计范式,使科学家能够从头设计全新的蛋白质,而非仅仅修改现有的模板。例如西湖大学原发杰研究员主导开发的Pinal模型,仅需通过输入简单的功能描述,比如“设计一个能高效降解塑料的酶”或“创建一个针对特定癌症靶点的抑制剂”,AI模型就能生成潜在的蛋白质序列,并在计算机模拟中验证其可行性。这种转变不仅加速了创新的速度,还降低了实验门槛,让更多研究者能够参与其中。更重要的是,AI的介入使得蛋白质设计变得更具预测性和可控性,减少了实验失败的风险。举例来说,在药物开发中,传统方法可能需要筛选数百万化合物,而AI可以直接设计出与靶点蛋白质高度匹配的配体蛋白质,从而缩短开发周期从几年到几个月,近期在

Science
上三篇背靠背发表的AI辅助的T 细胞受体(TCR)设计文章就大大加速了TCR的优化过程。此外,AI还促进了多学科融合,将计算生物学、机器学习和合成生物学结合在一起,形成了一个全新的生态系统。在这个系统中,数据驱动的方法成为核心,大型蛋白质数据库如PDB(Protein Data Bank)和UniProt被用于训练模型,这些模型学习了蛋白质序列、结构和功能之间的复杂关系,从而能够生成具有新型功能的蛋白质,如经典的蛋白质大语言模型ESM3。

我们先回顾一下AI在蛋白质设计中的基本原理。蛋白质设计的核心问题是逆向工程:给定一个期望的功能,如何找到对应的序列和结构。传统方法依赖于物理化学原理,如能量最小化,但AI引入了数据驱动的模式识别,通过学习海量数据来推断规则。这类似于自然语言处理中的序列建模,蛋白质氨基酸序列被视为“句子”,功能被视为“含义”。模型如蛋白质BERT或ProtGPT使用自监督学习,从无标签数据中提取特征,然后在下游任务中微调用于设计。最新模型甚至整合了多模态数据,包括序列、结构图和功能注释,实现端到端的生成。更进一步,强化学习被用于优化设计过程,其中AI代理通过模拟环境中的“奖励”函数来迭代序列,提高功能分数。这种方法在酶设计中特别有效。总之,AI的介入不仅仅是技术升级,更是范式转变,它将蛋白质设计从艺术提升到科学工程的水平。

生成式AI的基本原理是使用机器学习模型来采样潜在空间,生成符合特定分布的新样本。在蛋白质设计中,这意味着从氨基酸序列的巨大空间中抽取那些具有期望功能的序列。举例来说,在癌症治疗中,科学家使用生成式AI可以构建了类似于“GPS”系统的免疫细胞导向蛋白质TCR,这些蛋白质能够帮助T细胞精确锁定肿瘤细胞,避免对健康组织的损伤。这种设计过程可以从抗原结构,甚至自然语言提示开始,比如“生成一个针对PD-1受体的抑制蛋白质”,模型则输出多个候选序列,随后通过高通量筛选验证。

生成式AI的优势在于其巨大的规模,尤其在蛋白质设计领域:传统药物筛选可能需要物理合成数千化合物,而AI可以在虚拟环境中生成并评估数百万序列,节省时间和资源,如近期的

Science
蛋白设计文章采用Alphafold2的iPTM打分评估复合物的合理程度。进一步地,生成式AI允许将一个领域迁移知识到另一个,例如从酶设计中学习到的折叠模式应用于抗体工程或荧光蛋白设计中。生成式AI还促进了小分子与蛋白质的协同设计,通过生成蛋白质-配体复合物来优化药物分子,确保高特异性和低毒性,如LigandMPNN算法可以实现针对小分子的binder设计。

AI与生物物理建模深度融合同样是近期的一大进展。生物物理学提供蛋白质行为的基础原理,如热力学稳定性和动力学折叠路径,而AI通过机器学习增强这些模型的预测与实验匹配的程度。例如,AI模型现在能够模拟蛋白质在不同环境下的构象变化,预测序列修改对折叠能量的影响,避免设计出不稳定的蛋白质。这种融合的核心是多尺度建模。关键创新包括物理信息神经网络(PINNs),这些模型在计算时嵌入物理方程,确保生成的蛋白质遵守自然法则。这种融合还考虑了蛋白质的动态变化,模拟蛋白的运动模式,设计时考虑蛋白的复杂构象集。总体上,生物物理和生成式AI的融合标志着蛋白质设计从经验向精确科学的转变,进一步推动了从医疗到工业的广泛应用。

生成式AI的早期模型倾向于生成相似的序列,但通过引入扩散模型和提高设计温度,AI现在能探索更广阔的设计空间,生成创新结构。这些创新在化学中也有应用,比如说在2025年6月的

Nature
文章中,研究者可以设计出新型的肯普消除反应酶,它相比天然蛋白质有超过140个突变,能催化天然蛋白质无法完成的化学反应,标志着“按需定制”高效化学反应酶的新阶段即将来临。

生成式AI将蛋白质设计从试错转向智能优化,推动制药行业向AI驱动的未来转型。我们可以看到生成式AI如何整合多源数据,并形成一个闭环系统。模型如ProtDiff或EvoDiff使用扩散过程逐步添加噪声然后去噪,生成从随机序列到功能蛋白质的路径。结合多目标优化方法,生成式AI可以同时考虑稳定性、溶解度和活性,通过帕累托最优方法来选择最佳候选蛋白。在未来,生成式AI将与实验自动化结合,形成机器人实验室,其中AI设计序列,机器人合成并测试,实现全自动化循环。这将进一步加速药物发现,潜在地解决如阿尔茨海默病这样的顽疾。

尽管成就显著,AI在蛋白质设计中仍面临挑战,如模型泛化性差,无法处理未出现过的功能等。同时,实验验证的瓶颈仍是一大考验。未来,AI将进一步整合多模态数据,包括动态模拟数据和实验的实时反馈,实现更稳健精准的设计。展望2025年后,AI将驱动个性化医学和合成生物学革命,重塑药物发现和蛋白质工程,开启生物工程的黄金时代。

本文作者:何欣恒

作者简介:何欣恒,博士,临港国家实验室,研究方向为计算生物学与结构生物学。

内容为【科技导报】公众号原创,欢迎转载
白名单回复后台「转载」

《科技导报》创刊于1980年,中国科协学术会刊,主要刊登科学前沿和技术热点领域突破性的研究成果、权威性的科学评论、引领性的高端综述,发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、科技新闻、科技评论、专稿专题、综述、论文、政策建议、科技人文等。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
皇马再遭暴击!两人赛季报销,居莱尔训练受伤,米利唐再度伤缺

皇马再遭暴击!两人赛季报销,居莱尔训练受伤,米利唐再度伤缺

奥拜尔
2026-04-23 19:05:14
警报拉响!英超降级格局初定,热刺和西汉姆联谁能逃过最后一劫?

警报拉响!英超降级格局初定,热刺和西汉姆联谁能逃过最后一劫?

田先生篮球
2026-04-23 10:07:58
央视小尼离婚后单身至今,原因曝光:不是放不下前妻,是放不下她

央视小尼离婚后单身至今,原因曝光:不是放不下前妻,是放不下她

翰飞观事
2026-04-10 14:59:12
你家最讨人厌的亲戚有多恶心?我买一辆新车,亲妹妹气出了抑郁症

你家最讨人厌的亲戚有多恶心?我买一辆新车,亲妹妹气出了抑郁症

游戏收藏指南
2026-04-22 20:39:57
“雌激素旺盛!莱昂诺尔公主姐妹脂肪集中在大腿臀部,不像少女身材

“雌激素旺盛!莱昂诺尔公主姐妹脂肪集中在大腿臀部,不像少女身材

小鱼爱鱼乐
2026-04-22 15:56:58
WTA战报:2-0横扫!萨巴伦卡独孤求败狂揽13连胜,郑钦文5点首秀

WTA战报:2-0横扫!萨巴伦卡独孤求败狂揽13连胜,郑钦文5点首秀

大秦壁虎白话体育
2026-04-23 23:24:05
狄龙:季后赛应该像乔丹、詹姆斯一样强硬,亚历山大有点脆弱

狄龙:季后赛应该像乔丹、詹姆斯一样强硬,亚历山大有点脆弱

懂球帝
2026-04-23 13:41:07
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
瘦骨嶙峋现身灵堂,二十年不见人影,他却没病也没穷

瘦骨嶙峋现身灵堂,二十年不见人影,他却没病也没穷

手工制作阿歼
2026-04-23 12:23:38
87年帮村长家晒粮睡偏房,夜里我竟摸到条粗黑辫子,一道女声响起

87年帮村长家晒粮睡偏房,夜里我竟摸到条粗黑辫子,一道女声响起

卡西莫多的故事
2026-04-20 14:44:05
战火再升级:以色列斩首行动,300据点全毁,大国参战

战火再升级:以色列斩首行动,300据点全毁,大国参战

琨玉秋霜
2026-04-23 18:20:23
水平不够:皇家马德里公开抛售首发门将

水平不够:皇家马德里公开抛售首发门将

本泽体育
2026-04-23 12:32:27
死了这条心!人民日报摊牌:中国不会救菲律宾,马科斯投机到头了

死了这条心!人民日报摊牌:中国不会救菲律宾,马科斯投机到头了

黑翼天使
2026-04-23 19:51:23
不露面不知道,一露面吓一跳,这些明星怎么都老成这个样子了

不露面不知道,一露面吓一跳,这些明星怎么都老成这个样子了

孤城落日
2026-04-20 19:26:14
15岁少年跳楼坠亡,事前曾购处方药服用 父母索赔,一审判药店及公寓物业共赔42万

15岁少年跳楼坠亡,事前曾购处方药服用 父母索赔,一审判药店及公寓物业共赔42万

红星新闻
2026-04-23 13:42:31
CPO风向变了!新龙头上位,老玩家退居二线

CPO风向变了!新龙头上位,老玩家退居二线

记录生活日常阿蜴
2026-04-23 05:46:00
215斤!宁波渔民东海捕获1条巨型龙趸,体长超1.8米!老渔民:头一回见到这么大的龙趸

215斤!宁波渔民东海捕获1条巨型龙趸,体长超1.8米!老渔民:头一回见到这么大的龙趸

环球网资讯
2026-04-23 15:04:09
“性侵工伤认定”当事人崔丽丽诉前司劳动争议案开庭:崔丽丽身着职业装、佩戴女儿送的项链出庭,提到网友鼓励落泪

“性侵工伤认定”当事人崔丽丽诉前司劳动争议案开庭:崔丽丽身着职业装、佩戴女儿送的项链出庭,提到网友鼓励落泪

极目新闻
2026-04-23 15:05:28
曝科尔引球队内部不满!他可以离开勇士 但他舍得离开库里吗?

曝科尔引球队内部不满!他可以离开勇士 但他舍得离开库里吗?

罗说NBA
2026-04-23 19:17:36
用了16年的学位证校方称从未授予,当事人自我举报求证真伪 炒作还是确有其事?

用了16年的学位证校方称从未授予,当事人自我举报求证真伪 炒作还是确有其事?

红星新闻
2026-04-22 19:10:31
2026-04-24 06:39:00
科技导报 incentive-icons
科技导报
中国科协学术会刊
5294文章数 8359关注度
往期回顾 全部

科技要闻

马斯克喊出"史上最大产品",但量产难预测

头条要闻

特朗普:不急于结束与伊朗战争 可伊朗没时间了

头条要闻

特朗普:不急于结束与伊朗战争 可伊朗没时间了

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

普华永道赔偿10亿 恒大股东见到"回头钱"

汽车要闻

预售30.29万起 岚图泰山X8配896线激光雷达

态度原创

本地
艺术
家居
健康
公开课

本地新闻

SAGA GIRLS 2026女团选秀

艺术要闻

罕见曝光!毛泽东 36 幅经典对联,每一幅都是绝品!

家居要闻

浪漫协奏 法式风格

干细胞如何让烧烫伤皮肤"再生"?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版