网易首页 > 网易号 > 正文 申请入驻

全球首个肽分子设计大模型平台问世:可无结构输入直接读取结合子

0
分享至



看病就医,医生会先进行诊断,在了解病症的基础上,给出治疗建议。传统药物设计也遵循类似的逻辑——建立在对病原体或疾病机制的了解之上。

现在,AI 带来了一种出乎意料的突破:就像无需看病直接吃药一样,它能够设计出粘附并分解体内有害蛋白质的小分子,即使科学家完全不清楚这些蛋白质的结构与形态。

这是一个很直观的想法:如果把目标蛋白序列末端的「肽结合段」掩蔽起来,微调模型以重构结合区,或许就能直接根据目标序列条件生成能结合该靶点的肽,而无需结构输入。美国宾夕法尼亚大学(University of Pennsylvania)与杜克大学(Duke University)等据此提出了一种基于靶序列设计的全新线性肽配体设计模型 PepMLM。

他们的研究成果以「Target sequence-conditioned design of peptide binders using masked language modeling」为题,于 2025 年 8 月 13 日刊登在《Nature Biotechnology》。



论文链接:https://www.nature.com/articles/s41587-025-02761-2

从序列直接设计结合子

在过去的几年里,深度学习通过注意力机制的应用,彻底改变了自然语言处理(NLP),特别是在蛋白质等其他语言模型中的应用。研究团队之前所开发的 PepPrCLIP 模型首先从潜在空间中采样自然肽候选者,然后通过对比模型进行筛选以确定目标序列特异性。

但很遗憾的是,一种纯粹从头开始、基于目标序列的结合基序设计算法还尚未开发出来。

为了实现这一目标,团队引入了 PepMLM 算法,基于掩码语言模型,建立在 ESM-2 的基础上。他们把目标蛋白序列与其已知肽结合段拼接,在训练时把肽段全部掩码,任务就是重构这部分序列。

通过专注于肽区域的完整重建,PepMLM 成为一种完全基于序列、条件于靶标的从头设计结合剂工具,为开发更有效的、针对构象多样的蛋白质的治疗性结合剂铺平了道路。



图 1:PepMLM 模型的概述与评估。

训练数据经聚类与去冗余后,构成了约10,000 条训练样本与 203 条测试样本(binder 长度 ≤ 50,目标序列 ≤ 500),并用 pseudo-perplexity(PPL)作为对候选肽的置信度评分。生成时采用greedy或 top-k(最终选 k=3)采样以平衡多样性与置信度。该做法把「目标条件化 + 掩码重构」作为设计策略的核心。

分布分析显示,PepMLM 在低 PPL 区域与真实结合剂的分布非常接近,ESM-2 模型本身和随机设计的结合剂所观察到的分布偏移表明,PepMLM 可以通过 PPL 评分区分结合剂和非结合剂。

基准测试与实验对比

在 203 个测试目标上,PepMLM 的 PPL 分布与真实已知结合肽更为一致,能把「可信」结合子集中在低 PPL 区域,这一点通过与 AlphaFold-Multimer 的联合评估得到支持。

在氨基酸组成水平上,PepMLM 设计的序列与测试结合体的氨基酸分布高度一致,而 ESM-2 则表现出强烈的偏向丝氨酸(S)、亮氨酸(L)等。这些都表明在微调后,PepMLM 更好地捕捉了蛋白质-肽相互作用中的天然氨基酸偏好。

对于测试结合体中的每个位置,团队分析了 100 个设计结合体中相应位置的氨基酸类型,在所有位置和接触位置观察到 69.2% 和 68.4% 的氨基酸特异性变化。除了这些,在在训练分布之外的泛化中,PepMLM 并没有表现出对高同源性的依赖,而且能够很好地泛化到未见过的蛋白质底物上,激励对多种与疾病相关的靶标进行实验表征。

接下来,团队把 PepMLM 生成的肽嵌入到uAb等可诱导降解构架中进行细胞实验验证,展示了两个方向的证据链:



图 2:体外 PepMLM 设计的肽结合子的实验验证。

在体外/细胞结合与降解实验中,PepMLM 生成的肽针对多种靶点(包括 NCAM1、AMHR2,以及 Huntington 相关靶点 HTT 等)表现出序列特异性结合并能诱导蛋白水平下降。PepMLM 仅从目标序列生成有前景的结合体候选物,并且成功率高于当前最先进的结合体设计模型。



图 3:体外筛选源自 PepMLM 的抗病毒 uAb。

另一方面,针对三种高危病毒(NiV、HeV、HMPV)磷蛋白的筛选,实验里通过 PepMLM 设计了 20 款 uAb,后续的筛查显示约37 个 降解剂 在 20%–49% 的范围内降低目标蛋白表达(总体命中率 ~63%),并有若干在感染模型中将磷蛋白近乎完全清除的候选。

整体而言,实验命中率与计算层面的 hit rate 呈一致趋势,证明 PepMLM 的设计可转化为生物功能。

小结

PepMLM 是 ESM-2 的微调版本,采用简单的掩码-解掩码方案,提供了一种设计线性肽结合物的简便框架。研究团队表示,PepMLM 不是标准的生成序列模型,与传统的自回归或离散扩散和流匹配模型相比有所不同。

尽管使用的表述更为简约,但团队依旧有力地证明了 PepMLM 在体外、体内以及治疗相关的情境下都能生成强大的结合物设计。 它把「掩码式语言建模」应用到目标条件化肽设计上,做到无需结构输入即可生成、优先排序并在细胞中验证候选肽。

总体来看,这是一条「从序列到候选再到功能验证」的可行路径,尤其适合那些结构不可得或高度可变的难以设计药物靶点群体。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
震惊!泰国人民党57%支持率,击溃他信家族出局!

震惊!泰国人民党57%支持率,击溃他信家族出局!

丹徒生
2026-01-27 08:10:07
外交部和中国驻日本使领馆提醒:中国公民春节期间避免前往日本;49条中日航线取消全部航班

外交部和中国驻日本使领馆提醒:中国公民春节期间避免前往日本;49条中日航线取消全部航班

每日经济新闻
2026-01-26 19:13:15
哈里王子全家福曝光:阿奇帅气不输乔治路易,莉莉贝特神似夏洛特

哈里王子全家福曝光:阿奇帅气不输乔治路易,莉莉贝特神似夏洛特

笑傲春秋
2026-01-27 13:56:58
李家超:曾国卫以健康理由辞任;曾国卫:前列腺癌指数上升,治疗后未改善

李家超:曾国卫以健康理由辞任;曾国卫:前列腺癌指数上升,治疗后未改善

星岛记事
2026-01-27 10:04:46
庾澄庆牵老婆看演唱会,张嘉欣皱纹多,瘦又矮,却被夸完胜伊能静

庾澄庆牵老婆看演唱会,张嘉欣皱纹多,瘦又矮,却被夸完胜伊能静

白面书誏
2026-01-26 16:24:56
追梦:在芝加哥乔丹都比不上罗斯,后者甚至可以阻止犯罪

追梦:在芝加哥乔丹都比不上罗斯,后者甚至可以阻止犯罪

懂球帝
2026-01-27 11:33:15
湖南第一庸官,好面子导致政府负债1000亿,为政绩骗刘强东100亿

湖南第一庸官,好面子导致政府负债1000亿,为政绩骗刘强东100亿

芊芊子吟
2026-01-15 10:20:03
3500万卖出22岁希望之星:瓜帅前锋人手太多,只好放弃培养他

3500万卖出22岁希望之星:瓜帅前锋人手太多,只好放弃培养他

里芃芃体育
2026-01-27 05:00:03
大龄剩女崩溃的瞬间是什么时候?网友:多年的舔狗突然结婚

大龄剩女崩溃的瞬间是什么时候?网友:多年的舔狗突然结婚

夜深爱杂谈
2026-01-20 18:56:34
贝克汉姆14岁女儿家庭风波首发声:大布被曝,声称只想和妹妹联系

贝克汉姆14岁女儿家庭风波首发声:大布被曝,声称只想和妹妹联系

老吴教育课堂
2026-01-27 09:07:03
火葬场烧尸人:见惯了生离死别,最喜欢年轻漂亮的女尸

火葬场烧尸人:见惯了生离死别,最喜欢年轻漂亮的女尸

吴学华看天下
2024-06-26 12:43:21
女生要主动起来跟想象中完全不一样!网友:让我递毛巾 瞬间开窍了

女生要主动起来跟想象中完全不一样!网友:让我递毛巾 瞬间开窍了

另子维爱读史
2026-01-26 18:39:06
医生忠告:胃癌早期不是反胃,而是频繁出现这5症状,千万别忽视

医生忠告:胃癌早期不是反胃,而是频繁出现这5症状,千万别忽视

新时代的两性情感
2026-01-27 11:49:37
首架MC-55A“游隼”电子侦察机飞抵澳大利亚 为“五眼联盟”效力

首架MC-55A“游隼”电子侦察机飞抵澳大利亚 为“五眼联盟”效力

hawk26讲武堂
2026-01-26 12:58:03
达沃斯爆猛料!布达诺夫证实大国未向俄罗斯供武器

达沃斯爆猛料!布达诺夫证实大国未向俄罗斯供武器

老马拉车莫少装
2026-01-23 00:05:42
男性在喝酒时,尽量少吃这3种下酒菜,尤其是第一种,一定要忍住

男性在喝酒时,尽量少吃这3种下酒菜,尤其是第一种,一定要忍住

熊猫医学社
2026-01-07 11:30:03
官宣分手?陈幸同发声,做最好选择,分手原因找到,周启豪看懂

官宣分手?陈幸同发声,做最好选择,分手原因找到,周启豪看懂

懂球社
2026-01-27 12:08:33
连胜文、连胜武两兄弟的老婆,一位是豪门千金,另一位是小家碧玉

连胜文、连胜武两兄弟的老婆,一位是豪门千金,另一位是小家碧玉

顾史
2026-01-25 19:32:37
张不开嘴就别尬演!黄晓明“吃泡面”,戳穿了多少演员最后的体面

张不开嘴就别尬演!黄晓明“吃泡面”,戳穿了多少演员最后的体面

十里电影
2026-01-18 10:07:37
全新iPhone17Pro Max新套路!中招就大亏好几千!

全新iPhone17Pro Max新套路!中招就大亏好几千!

果粉使用技巧
2026-01-27 14:11:31
2026-01-27 14:52:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1218文章数 223关注度
往期回顾 全部

科技要闻

理想开始关店“过冬”,否认“百家”规模

头条要闻

特朗普突然宣布对韩关税升至25% 青瓦台紧急派人赴美

头条要闻

特朗普突然宣布对韩关税升至25% 青瓦台紧急派人赴美

体育要闻

带着母亲遗愿战斗12年,交易添头成了队魂

娱乐要闻

张雨绮被曝代孕,春晚被拒,代言跑路

财经要闻

金价狂飙 “牛市神话”未完待续

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

房产
本地
时尚
手机
数码

房产要闻

实景兑现在即!绿城,在海棠湾重新定义终极旅居想象!

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

降温了!羽绒服这样穿显瘦又时髦

手机要闻

消失的G99方案:小米REDMI Note 12 Pro 4G手机立项配置曝光

数码要闻

苹果M3 Mac现已成功启动Asahi Linux 但暂不具备实际可用性

无障碍浏览 进入关怀版