网易首页 > 网易号 > 正文 申请入驻

疫苗设计新思路!耶鲁等首次挖掘「免疫」可解释结构

0
分享至


新智元报道

编辑:LRST

【新智元导读】免疫系统通过识别抗原的特定片段(表位)来判断是否启动免疫反应,但准确预测表位的免疫原性极具挑战。耶鲁大学等将免疫原性预测拓展为多模态建模,整合序列、三维结构和生化属性,显著提升预测性能并增强可解释性。该方法还针对癌症免疫的特殊性设计对比学习策略,有效利用稀缺数据,为疫苗设计和免疫治疗提供新思路。

当抗原进入人体或在体内产生时,免疫系统需要通过一套复杂机制判断其是否为「敌人」,并据此激活免疫反应,这一可被识别并触发反应的特性被称为免疫原性

然而,免疫系统并不会对所有抗原片段作出反应,它真正「看到」的往往只是少数关键片段,即表位(epitopes)。

疫苗设计正是利用这一机制,试图通过人工方式呈递特定表位来诱导免疫反应。表位是否具有免疫原性并非由单一因素决定,而是一个多阶段、强依赖上下文的过程。

因此,即便序列高度相似的表位,其免疫原性也可能截然不同,使得免疫原性的准确预测本身极具挑战。

现有主流方法往往将抗原简化为一维氨基酸序列,并基于卷积神经网络或语言模型进行建模,这类方法在一定程度上有效,但忽略了蛋白质在三维空间中的真实结构形态以及由此产生的空间相互作用,从而在预测精度和结果可解释性上存在天然局限。

近日,针对这些局限,耶鲁大学与霍华德·休斯医学研究所的研究团队提出ImmunoStruct,其核心思想是免疫原性不仅取决于序列本身,还受到空间构型、表面暴露特性以及多种生化相互作用的共同影响,ImmunoStruct将免疫原性预测从一维序列建模拓展为多模态建模问题


论文链接:https://www.nature.com/articles/s42256-025-01163-y

代码链接:https://github.com/KrishnaswamyLab/ImmunoStruct

从「一维序列」到「多模态结构」

ImmunoStruct的核心思想

具体而言,ImmunoStruct同时整合了三类互补信息:序列信息、由AlphaFold2预测得到的三维结构信息,以及使用物理模型从结构与序列中计算出的生化属性(图1)。


图1:ImmunoStruct的框架概览

模型通过变分自编码器学习紧凑而连续的序列表示,通过等变图神经网络刻画三维结构空间关系与相互作用,并通过多层感知机建模生化特征。

在此基础上,它采用多模态注意力机制对不同模态的信息进行协同融合,使模型能够根据具体样本动态关注对免疫原性最具判别力的结构、序列或生化特征。

这种从「序列」走向「结构–序列–生化属性」联合建模的策略,使ImmunoStruct不仅在预测性能上显著优于现有方法,也首次实现了对免疫原性结构决定因素的可解释建模,为表位疫苗设计中免疫原性筛选提供了更符合生物学机制的计算框架。

另外,针对癌症免疫数据稀缺、有效免疫信号更难获取的问题,研究团队进一步从癌症免疫的基本特性出发进行了建模设计。

与感染性抗原不同,癌症相关的突变往往源自人体自身蛋白,免疫系统在发育过程中已对「正常版本」形成耐受,因此大多数突变并不会引发免疫反应;只有当突变显著改变了免疫系统「看到」的关键特征时,才可能被识别为异常并触发反应。

基于这一差异性,ImmunoStruct引入了基于突变型与对应野生型序列的对比学习策略(图2):当突变不具备免疫原性时,模型学习将二者在表示空间中拉近;而当突变产生免疫原性时,则学习将二者明确区分开来,从而直接围绕「突变是否带来有效变化」这一核心问题组织表示学习。


图2:针对癌症数据的「突变型/野生型」对比学习策略

同时,该对比目标还鼓励不同特征维度捕捉互补信息,减少表示退化,使有限的癌症免疫数据能够被更高效地利用,并显著提升下游预测性能。

研究团队在多类免疫相关数据集上对ImmunoStruct进行了系统评估,涵盖传染病(IEDB数据集)与癌症(CEDAR数据集)的免疫原性预测任务。

实验结果显示,相较于主要依赖序列信息的既有方法,ImmunoStruct在免疫原性预测性能上取得了稳定提升。


图3: 在传染病数据集IEDB上的表现

模型为什么会这么判断?

结构层面的线索开始显现

为了理解ImmunoStruct的预测依据,研究团队进一步分析了模型中的结构注意力机制。

结果显示,模型并非平均利用所有输入信息,而是学会将注意力集中到少数具有判别力的空间位置。在高免疫原性样本中,注意力显著富集于抗原分子中部且更容易向外暴露的区域,而非主要承担结构锚定作用的位置(图4)。


图4: 一些模型可解释性的分析

进一步分析发现,这些被重点关注的位置在免疫原性样本中呈现出更高的一致性,暗示模型捕捉到的是稳定的结构特征而非偶然的序列差异。将注意力模式映射回已知的三维结构后可以看到,模型关注的区域与真实分子识别界面高度一致,为预测结果提供了直观的结构解释。

这种结构感知能力也使ImmunoStruct能够区分极其细微的突变差异,在癌症新抗原的案例中,即便仅相差一个氨基酸,模型仍能通过捕捉局部空间构型的变化给出不同的免疫原性预测,表明其判断是建立在可解释的结构线索之上的。

在更接近真实生物医学场景中的进一步验证

为了检验模型在真实生物医学任务中的有效性,研究团队进一步在实验数据和临床数据上对ImmunoStruct进行了独立验证(图5)。


图5: 一些在实验数据和临床数据上的验证结果

在实验层面,作者针对一组来源于 SARS-CoV-2 的候选表位开展了体外免疫实验。结果显示,ImmunoStruct 在未参与实验设计的情况下,能够准确预测大多数实验测得的免疫反应,整体表现与实验结果高度一致,表明模型学到的信号具有可转移的生物学意义。

更进一步,研究团队将ImmunoStruct应用于接受免疫治疗的癌症患者队列,并基于模型预测的免疫原性水平对患者进行分组。在无需任何再训练的情况下,ImmunoStruct的预测结果能够有效区分患者的生存期,且表现优于常用的突变负荷等指标。这表明,模型不仅能够在受控实验条件下做出合理判断,也能够在高度复杂、异质性极强的临床数据中捕捉与治疗结局相关的免疫信号,展现出潜在的临床转化价值。

意义与展望

总体而言,ImmunoStruct展示了一种从「一维序列建模」迈向「多模态结构感知学习」的新范式:通过联合利用序列、空间结构与生化特征,并引入可解释的注意力机制与对比学习策略,模型不仅提升了免疫原性预测性能,也揭示了哪些结构线索真正驱动模型决策。

这一工作表明,在复杂生物问题中,将深度学习与结构信息和领域知识相结合,能够在有限数据条件下同时获得更强的泛化能力与更高的可解释性,为精准疫苗设计、蛋白功能预测以及更广泛的结构感知机器学习任务提供了可推广的思路。

参考资料:

https://www.nature.com/articles/s42256-025-01163-y

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
揭穿行业谎言!电车辐射并不大?实测:脚底辐射远超手机吹风机等

揭穿行业谎言!电车辐射并不大?实测:脚底辐射远超手机吹风机等

车见
2026-07-03 11:28:13
世界杯梗最多的男人来了!哈兰德浑身长满了笑点

世界杯梗最多的男人来了!哈兰德浑身长满了笑点

广告案例精选
2026-07-04 19:18:25
佛得角队本次世界杯总收入1350万美元,离开美国前感谢中国球迷:感谢每一个支持我们的中国人,如果有机会去中国,将非常高兴

佛得角队本次世界杯总收入1350万美元,离开美国前感谢中国球迷:感谢每一个支持我们的中国人,如果有机会去中国,将非常高兴

大风新闻
2026-07-05 12:11:03
男篮惨败后迎来1大利好?中国队或死里逃生晋级:郭士强因祸得福

男篮惨败后迎来1大利好?中国队或死里逃生晋级:郭士强因祸得福

篮球快餐车
2026-07-05 07:53:34
2026旅游业现状:“奄奄一息”的商户,甚至没有最后的力气去哀嚎

2026旅游业现状:“奄奄一息”的商户,甚至没有最后的力气去哀嚎

混沌录
2026-07-03 19:56:08
中国经济面面观|年中观经济:产业向新、消费提质

中国经济面面观|年中观经济:产业向新、消费提质

新华社
2026-07-04 16:03:21
“挂了快一年,从200多万降到160万,心一横,卖了。”房东割肉离场,杭州“老破小”价格回到十年前

“挂了快一年,从200多万降到160万,心一横,卖了。”房东割肉离场,杭州“老破小”价格回到十年前

都市快报橙柿互动
2026-07-04 09:57:12
机票价格何时回落?业内:别指望暴跌

机票价格何时回落?业内:别指望暴跌

我是一个养虾人
2026-07-04 03:10:52
西媒:维尼修斯训练迟到,队友掌声嘘声齐送

西媒:维尼修斯训练迟到,队友掌声嘘声齐送

懂球帝
2026-07-05 00:38:14
28-23!这就是八村塁和库明加的区别,湖人被曝不想让他回来

28-23!这就是八村塁和库明加的区别,湖人被曝不想让他回来

奕辰说球
2026-07-05 11:18:49
真动手了,锆石砸穿基辅!俄最后通牒送达:不撤军就无差别打击

真动手了,锆石砸穿基辅!俄最后通牒送达:不撤军就无差别打击

楠楠自语
2026-07-05 02:44:24
郭士强就算赢了也可能下课?篮协这一次,是真的急了

郭士强就算赢了也可能下课?篮协这一次,是真的急了

爱体育的小悠悠
2026-07-05 11:34:47
一秒葬送全队努力!巴拉圭头号罪人致命失误,毁了世界杯黑马奇迹

一秒葬送全队努力!巴拉圭头号罪人致命失误,毁了世界杯黑马奇迹

奶盖熊本熊
2026-07-05 07:30:35
新一轮事业单位改革后,基层事业编专业技术岗不要轻易转为管理岗

新一轮事业单位改革后,基层事业编专业技术岗不要轻易转为管理岗

细说职场
2026-07-05 12:03:36
董卿当年那句话含金量还在上升:韩红的厚度,从不是嘴上说说而已

董卿当年那句话含金量还在上升:韩红的厚度,从不是嘴上说说而已

子芫伴你成长
2026-07-02 23:04:56
WTT美国大满贯:男单4强赛全部诞生,张本惨败,勒布伦渔翁得利

WTT美国大满贯:男单4强赛全部诞生,张本惨败,勒布伦渔翁得利

童叔不飙车
2026-07-05 00:26:41
章泽天谈死亡:完成3件事,我可以安心地走

章泽天谈死亡:完成3件事,我可以安心地走

李东阳朋友圈
2026-07-05 14:46:11
与张小斐闹掰真相大白,销声匿迹又胖回来的贾玲,早已被冯巩看透

与张小斐闹掰真相大白,销声匿迹又胖回来的贾玲,早已被冯巩看透

我是李小七23
2026-07-05 11:24:43
比导弹便宜万倍!中国 LW30 一出场,无人机当场变废铁

比导弹便宜万倍!中国 LW30 一出场,无人机当场变废铁

小兰聊历史
2026-04-18 14:25:14
蒋方舟再回应“清华教授实名举报论文造假”:逐项澄清肖鹰23项指控中涉及的问题,学术打假是珍贵的公器,它的力量来自公正

蒋方舟再回应“清华教授实名举报论文造假”:逐项澄清肖鹰23项指控中涉及的问题,学术打假是珍贵的公器,它的力量来自公正

极目新闻
2026-07-05 10:12:41
2026-07-05 15:07:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15610文章数 66948关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

日本史上最年轻民选女市长因休16周产假遭全国围攻

头条要闻

日本史上最年轻民选女市长因休16周产假遭全国围攻

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

王力宏成都舞台受伤 仍然坚持三小时

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

房产
健康
艺术
亲子
教育

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

听说少吃点能抗衰老?专家讲解!

艺术要闻

24幅 当代画家静物油画

亲子要闻

在@我是机灵姐家里,我看到有爱的家庭养出了孩子最好的模样。

教育要闻

暑假想废掉一个孩子,就让他长期宅在恒温26度的家里

无障碍浏览 进入关怀版