网易首页 > 网易号 > 正文 申请入驻

全球首个肽分子设计大模型平台问世:可无结构输入直接读取结合子

0
分享至



看病就医,医生会先进行诊断,在了解病症的基础上,给出治疗建议。传统药物设计也遵循类似的逻辑——建立在对病原体或疾病机制的了解之上。

现在,AI 带来了一种出乎意料的突破:就像无需看病直接吃药一样,它能够设计出粘附并分解体内有害蛋白质的小分子,即使科学家完全不清楚这些蛋白质的结构与形态。

这是一个很直观的想法:如果把目标蛋白序列末端的「肽结合段」掩蔽起来,微调模型以重构结合区,或许就能直接根据目标序列条件生成能结合该靶点的肽,而无需结构输入。美国宾夕法尼亚大学(University of Pennsylvania)与杜克大学(Duke University)等据此提出了一种基于靶序列设计的全新线性肽配体设计模型 PepMLM。

他们的研究成果以「Target sequence-conditioned design of peptide binders using masked language modeling」为题,于 2025 年 8 月 13 日刊登在《Nature Biotechnology》。



论文链接:https://www.nature.com/articles/s41587-025-02761-2

从序列直接设计结合子

在过去的几年里,深度学习通过注意力机制的应用,彻底改变了自然语言处理(NLP),特别是在蛋白质等其他语言模型中的应用。研究团队之前所开发的 PepPrCLIP 模型首先从潜在空间中采样自然肽候选者,然后通过对比模型进行筛选以确定目标序列特异性。

但很遗憾的是,一种纯粹从头开始、基于目标序列的结合基序设计算法还尚未开发出来。

为了实现这一目标,团队引入了 PepMLM 算法,基于掩码语言模型,建立在 ESM-2 的基础上。他们把目标蛋白序列与其已知肽结合段拼接,在训练时把肽段全部掩码,任务就是重构这部分序列。

通过专注于肽区域的完整重建,PepMLM 成为一种完全基于序列、条件于靶标的从头设计结合剂工具,为开发更有效的、针对构象多样的蛋白质的治疗性结合剂铺平了道路。



图 1:PepMLM 模型的概述与评估。

训练数据经聚类与去冗余后,构成了约10,000 条训练样本与 203 条测试样本(binder 长度 ≤ 50,目标序列 ≤ 500),并用 pseudo-perplexity(PPL)作为对候选肽的置信度评分。生成时采用greedy或 top-k(最终选 k=3)采样以平衡多样性与置信度。该做法把「目标条件化 + 掩码重构」作为设计策略的核心。

分布分析显示,PepMLM 在低 PPL 区域与真实结合剂的分布非常接近,ESM-2 模型本身和随机设计的结合剂所观察到的分布偏移表明,PepMLM 可以通过 PPL 评分区分结合剂和非结合剂。

基准测试与实验对比

在 203 个测试目标上,PepMLM 的 PPL 分布与真实已知结合肽更为一致,能把「可信」结合子集中在低 PPL 区域,这一点通过与 AlphaFold-Multimer 的联合评估得到支持。

在氨基酸组成水平上,PepMLM 设计的序列与测试结合体的氨基酸分布高度一致,而 ESM-2 则表现出强烈的偏向丝氨酸(S)、亮氨酸(L)等。这些都表明在微调后,PepMLM 更好地捕捉了蛋白质-肽相互作用中的天然氨基酸偏好。

对于测试结合体中的每个位置,团队分析了 100 个设计结合体中相应位置的氨基酸类型,在所有位置和接触位置观察到 69.2% 和 68.4% 的氨基酸特异性变化。除了这些,在在训练分布之外的泛化中,PepMLM 并没有表现出对高同源性的依赖,而且能够很好地泛化到未见过的蛋白质底物上,激励对多种与疾病相关的靶标进行实验表征。

接下来,团队把 PepMLM 生成的肽嵌入到uAb等可诱导降解构架中进行细胞实验验证,展示了两个方向的证据链:



图 2:体外 PepMLM 设计的肽结合子的实验验证。

在体外/细胞结合与降解实验中,PepMLM 生成的肽针对多种靶点(包括 NCAM1、AMHR2,以及 Huntington 相关靶点 HTT 等)表现出序列特异性结合并能诱导蛋白水平下降。PepMLM 仅从目标序列生成有前景的结合体候选物,并且成功率高于当前最先进的结合体设计模型。



图 3:体外筛选源自 PepMLM 的抗病毒 uAb。

另一方面,针对三种高危病毒(NiV、HeV、HMPV)磷蛋白的筛选,实验里通过 PepMLM 设计了 20 款 uAb,后续的筛查显示约37 个 降解剂 在 20%–49% 的范围内降低目标蛋白表达(总体命中率 ~63%),并有若干在感染模型中将磷蛋白近乎完全清除的候选。

整体而言,实验命中率与计算层面的 hit rate 呈一致趋势,证明 PepMLM 的设计可转化为生物功能。

小结

PepMLM 是 ESM-2 的微调版本,采用简单的掩码-解掩码方案,提供了一种设计线性肽结合物的简便框架。研究团队表示,PepMLM 不是标准的生成序列模型,与传统的自回归或离散扩散和流匹配模型相比有所不同。

尽管使用的表述更为简约,但团队依旧有力地证明了 PepMLM 在体外、体内以及治疗相关的情境下都能生成强大的结合物设计。 它把「掩码式语言建模」应用到目标条件化肽设计上,做到无需结构输入即可生成、优先排序并在细胞中验证候选肽。

总体来看,这是一条「从序列到候选再到功能验证」的可行路径,尤其适合那些结构不可得或高度可变的难以设计药物靶点群体。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海,八旬独居老人独居无靠,居委会联系送养儿子,儿子:凭什么

上海,八旬独居老人独居无靠,居委会联系送养儿子,儿子:凭什么

街声巷闻
2025-11-17 14:36:54
惊天大瓜!原来川普和希拉里不止是政敌,同时还是情敌。

惊天大瓜!原来川普和希拉里不止是政敌,同时还是情敌。

电动猫
2025-11-18 00:18:26
聚焦“十五五”规划建议|保持制造业合理比重

聚焦“十五五”规划建议|保持制造业合理比重

新华社
2025-11-17 15:54:02
王欣瑜耗时2小时47分钟2-1艰难战胜王曦雨,晋级全运会四强

王欣瑜耗时2小时47分钟2-1艰难战胜王曦雨,晋级全运会四强

懂球帝
2025-11-18 17:17:31
张家界荒野求生赛宣布14名选手全部进入决赛:气温骤降,不再按原计划淘汰4人

张家界荒野求生赛宣布14名选手全部进入决赛:气温骤降,不再按原计划淘汰4人

极目新闻
2025-11-18 15:19:03
捷克“炮弹计划”或终止!斯洛伐克法院关键裁决,援乌战斗机合法

捷克“炮弹计划”或终止!斯洛伐克法院关键裁决,援乌战斗机合法

鹰眼Defence
2025-11-18 17:53:12
捅完琉球窝!中国再掀北海道老底,日本80年前埋的雷,炸了

捅完琉球窝!中国再掀北海道老底,日本80年前埋的雷,炸了

南宫一二
2025-11-17 07:17:39
全运乒乓男团四强巅峰对决:马龙樊振东领衔,四大豪门谁主沉浮?

全运乒乓男团四强巅峰对决:马龙樊振东领衔,四大豪门谁主沉浮?

带你逛体坛
2025-11-18 18:34:10
罗伯逊:距离世界杯只差90分钟,我相信我们能战胜丹麦

罗伯逊:距离世界杯只差90分钟,我相信我们能战胜丹麦

懂球帝
2025-11-18 14:25:08
日韩股市,开盘暴跌!

日韩股市,开盘暴跌!

证券时报
2025-11-18 09:47:04
湖人最不需要担心的人!里夫斯:GOAT詹皇回归将有4打3优势

湖人最不需要担心的人!里夫斯:GOAT詹皇回归将有4打3优势

体育妞世界
2025-11-18 14:08:30
乡镇编制膨胀:从12人到100人,时代变了乡镇变了,初心还在吗?

乡镇编制膨胀:从12人到100人,时代变了乡镇变了,初心还在吗?

君好伴读
2025-10-27 10:33:08
付某梅(女),已被大连警方抓获归案!

付某梅(女),已被大连警方抓获归案!

半岛晨报
2025-11-18 12:40:05
因文件问题无法靠港,3000头奶牛被困土耳其海上58天,船只恶臭弥漫、尸体堆积

因文件问题无法靠港,3000头奶牛被困土耳其海上58天,船只恶臭弥漫、尸体堆积

起喜电影
2025-11-18 15:29:35
赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

火山诗话
2025-11-18 18:36:08
华为Mate 80系列备货比例曝光 标准版和Pro Max成主力

华为Mate 80系列备货比例曝光 标准版和Pro Max成主力

手机中国
2025-11-18 16:50:44
钟丽缇168cm的大块头,一般男人征服不了她吧?

钟丽缇168cm的大块头,一般男人征服不了她吧?

小椰的奶奶
2025-11-18 13:14:26
毛主席视察天津时想见李银桥,得知他已经入狱,伟人只说了2个字

毛主席视察天津时想见李银桥,得知他已经入狱,伟人只说了2个字

南书房
2025-09-28 23:01:03
日本天下第一香木,传为隋炀帝所赐,仅有三位人物切下小块使用

日本天下第一香木,传为隋炀帝所赐,仅有三位人物切下小块使用

收藏大视界
2025-11-09 20:38:12
只待2天!全红婵火速从北京飞回广州,去医院看望梁小静,姐妹情深

只待2天!全红婵火速从北京飞回广州,去医院看望梁小静,姐妹情深

乡野小珥
2025-11-18 07:31:38
2025-11-18 19:39:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1155文章数 218关注度
往期回顾 全部

科技要闻

小米:汽车及AI等业务首次单季度经营盈利

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

搭载1.5T增程动力 吉利银河V900官图发布

态度原创

时尚
手机
家居
数码
公开课

从百元到大牌,《新闻女王2》的职场穿搭,每种预算都能找到参考

手机要闻

努比亚海外推P9 Pro手机,搭载紫光展锐T8300处理器

家居要闻

彰显奢华 意式经典风格

数码要闻

天马全球首发真610Hz无极电竞屏,还有108英寸4K巨幕Micro LED

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版