网易首页 > 网易号 > 正文 申请入驻

用MoE打造DNA基础模型更强范式!人大实现seq2func全新突破

0
分享至

新智元报道

编辑:LRST

【新智元导读】中国人民大学高瓴人工智能学院的研究团队提出通过创新模型架构来提升性能,其SPACE模型引入新架构,提升了DNA基础模型的性能与泛化能力,在多项测试中表现优异。

Sequence-to-function模型是一类强大的基因组模型,能够直接从DNA序列预测对应的功能特征,如染色质开放性、基因表达量、DNA剪切位点等。其中最具代表性的工作是2021年发表在Nature Methods的Enformer[1]。

近日,谷歌DeepMind发布的AlphaGenome[2]模型取得了重要突破,将前身Enformer的输入序列长度扩展至1Mb,引入了剪切强度、DNA三维接触图等一系列新的训练任务,并实现了单碱基精度预测。

AlphaGenome在众多基因组预测任务上达到了当前SOTA性能,再次证明了数据扩展在基因组学建模中的巨大潜力,同时也证明了sequence-to-function model这种有监督训练范式学习到的表征的巨大潜力。

然而,单纯的数据扩展并非提升模型能力的唯一路径。

来自中国人民大学高瓴人工智能学院的研究团队提出了一个重要的替代思路:通过对模型架构进行符合生物学原理的系统性创新,可以更高效地提升DNA基础模型的性能与泛化能力。

论文链接:https://arxiv.org/abs/2506.01833

Github链接:https://github.com/ZhuJiwei111/space

Huggingface链接: https://huggingface.co/yangyz1230/space

自适应协作专家

Enformer和AlphaGenome设计范式存在两个内在的架构性制约:

1. 物种共享编码器的局限性

这种「一视同仁」的编码器难以有效区分并建模不同物种间基因调控的特有模式(species-specific characteristics)与进化上的保守机制 。

2. 独立预测头的知识割裂

基因组的功能图谱,如染色质可及性、组蛋白修饰和转录因子结合,在生物学上是高度关联和协同作用的。

独立的预测头无法捕捉这些图谱间的内在依赖关系,从而限制了模型对复杂基因调控网络的深层理解 。

图1:SPACE模型架构总览。 模型包含三个核心阶段:(1) 基于CNN的局部上下文聚合模块;(2) 引入物种感知混合专家(MoE)的Transformer编码器;(3) 引入谱系分组和双层门控机制的增强型解码器

为了应对上述挑战,SPACE模型引入了两项关键的架构革新:

物种感知编码器 (Species-aware Encoder)

在Transformer编码器中部署了稀疏混合专家(MoE)层,以替代标准的前馈网络 。

该模块由一个共享的「专家」网络池和多个物种特异性的「门控网络」组成,对于来自特定物种的DNA序列,其对应的门控网络会动态地选择并加权激活一部分专家网络进行计算 。

这种设计使得模型能自适应地为不同物种分配不同的计算资源和参数路径,从而有效解耦并学习物种间的特有及共享调控特征。

此外,还引入了专家-物种互信息损失函数,以鼓励专家网络向物种特异化的方向分化 。

谱系分组增强解码器 (Profile-grouped Enhancement Decoder)

在解码阶段,依据生物学先验知识将功能相关的基因组图谱(如测量染色质可及性的DNase-seq和ATAC-seq)进行分组。

在此基础上,一个新颖的双层门控专家加权聚合模块被用于增强初始预测 。

第一层门控根据物种和序列的全局信息,动态选择最相关的「专家组」,以捕捉进化上的保守调控模式 。

第二层门控则在选定的专家组内部,根据各图谱的初步预测特征,为每个图谱精确选择并加权最合适的专家,从而建模图谱间的功能依赖性 。

最终,增强后的预测结果通过残差连接与初始预测融合,确保了训练的稳定性和预测的精确性 。

实验结果

在多个公认的基因组学基准上,对SPACE模型的性能进行了全面和严格的评估。

下游基因组任务基准测试

研究人员在Nucleotide Transformer (NT) 论文提出的一套包含18项下游分类任务的基准上,将SPACE与多个主流DNA基础模型进行了比较。

这些任务涵盖了染色质谱系预测、调控元件注释和剪接位点识别三大类别 。

实验结果表明,SPACE模型在18项任务中的11项上取得了当前最佳(SOTA)性能,显著优于包括DNABERT-2、HyenaDNA以及NT系列在内的无监督预训练模型,也一致性地超越了其监督学习的基线模型Enformer。

这一结果强有力地支持了核心论点:一个架构设计优良的监督式预测模型,其学到的序列表示(representation)具有强大的泛化能力,可以作为一个高效的DNA基础模型。

图2:在Nucleotide Transformer下游任务中的性能比较(MCC分数)。 表格展示了SPACE与多个基准模型在18项任务上的表现。加粗字体表示该任务上的最优性能。SPACE在11项任务中达到SOTA

跨物种泛化能力评估

为了直接评估SPACE架构改进对模型跨物种泛化能力的影响,研究人员在GUE基准上进行了测试,特意选择了与模型训练物种(人、鼠)进化距离较远的酵母(10项表观遗传标记预测任务)和病毒(COVID变种分类任务)进行评估。

图3:在GUE基准上与Enformer的跨物种泛化能力比较。 SPACE在所有酵母和病毒预测任务上的性能(MCC或F1分数)均显著高于Enformer,向上箭头(↑)后的数值表示SPACE的绝对性能提升点数

与同样使用人鼠数据进行预训练的Enformer相比,SPACE在所有11项跨物种预测任务上均取得了显著的性能提升。

尤其是在酵母的H3K4me3标记预测任务上,SPACE的性能相较于Enformer提升了27.28个百分点,充分证明提出物种感知MoE编码器等架构在捕捉和迁移进化上保守的调控特征方面的有效性 。

总结

AlphaGenome展示了「数据规模为王」的强大潜力之际,SPACE模型提供了另一条同样富有前景的技术路径:通过引入符合生物学原理的、动态自适应的先进架构,可以更深刻、更高效地捕捉DNA序列中的复杂调控语言。

有理由相信,这种将架构设计与生物学洞见深度融合的研究范式,将为未来构建更强大、更具解释性的基因组学AI模型铺平道路。

参考资料:

[1] Avsec, Žiga, et al. "Effective gene expression prediction from sequence by integrating long-range interactions." Nature methods 18.10 (2021): 1196-1203.

[2] Avsec, Žiga et al. "AlphaGenome: advancing regulatory variant effect prediction with a unified DNA sequence model." DeepMind (2025).

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026反腐新规:12领域严查,行贿受贿一起查

2026反腐新规:12领域严查,行贿受贿一起查

细说职场
2026-05-24 20:33:32
被裁后的第3个月,面试官问我空窗期在干嘛。我说:“跑外卖。”他愣住了。我接着说:“送了1278单,超时率0.3%,差评0条。

被裁后的第3个月,面试官问我空窗期在干嘛。我说:“跑外卖。”他愣住了。我接着说:“送了1278单,超时率0.3%,差评0条。

不二大叔
2026-05-24 21:24:04
“沉重打击”,美国通知日本:大幅延期

“沉重打击”,美国通知日本:大幅延期

观察者网
2026-05-24 18:17:24
婚外关系发展到这两个阶段,就要结束了

婚外关系发展到这两个阶段,就要结束了

心理观察局
2026-05-25 06:17:14
俄罗斯让中国心凉?真正恐怖的并非西方围堵,而是我们低估了自己

俄罗斯让中国心凉?真正恐怖的并非西方围堵,而是我们低估了自己

混沌录
2026-04-09 16:27:09
5月23日起!深圳中小学大变革,高等教育开放报名

5月23日起!深圳中小学大变革,高等教育开放报名

户外阿毽
2026-05-25 00:44:33
伊朗“最大内鬼”,原来是他?

伊朗“最大内鬼”,原来是他?

中国新闻周刊
2026-05-22 21:03:52
克雷桑2球,难救韩鹏昏招!山东泰山郁闷1战,战蓉城:又要惨败?

克雷桑2球,难救韩鹏昏招!山东泰山郁闷1战,战蓉城:又要惨败?

话体坛
2026-05-24 22:20:38
公交集团正式员工已经躺平不了了,想要混到退休不太可能

公交集团正式员工已经躺平不了了,想要混到退休不太可能

娱乐圈见解说
2026-05-09 00:23:44
家里这个“最脏电器”,正悄悄把人送进ICU,你可能天天都在用

家里这个“最脏电器”,正悄悄把人送进ICU,你可能天天都在用

奇妙的本草
2026-05-21 11:57:45
4-2背后藏着多少内斗?姆巴佩破门,贝林厄姆建功,皇马拿了胜利却输掉了未来

4-2背后藏着多少内斗?姆巴佩破门,贝林厄姆建功,皇马拿了胜利却输掉了未来

林子说事
2026-05-24 08:19:30
法网首轮爆大冷!首位前10号种子出局,连续2年遭遇一轮游

法网首轮爆大冷!首位前10号种子出局,连续2年遭遇一轮游

全景体育V
2026-05-25 06:06:49
不满美方弃台,赖清德另寻靠山?日媒:麻烦制造者,东京倍感头疼

不满美方弃台,赖清德另寻靠山?日媒:麻烦制造者,东京倍感头疼

起喜电影
2026-05-25 03:13:41
印尼华人年轻一代:因中国的强大,开始自学中文并以中文姓名自豪

印尼华人年轻一代:因中国的强大,开始自学中文并以中文姓名自豪

鹤羽说个事
2026-05-23 23:07:10
爱德华兹谈文班亚马被驱逐:希望他继续被禁赛

爱德华兹谈文班亚马被驱逐:希望他继续被禁赛

甜份超标的我
2026-05-25 01:37:47
帕利尼亚:赛后主教练哭了,俱乐部每个人都配得上今天这一刻

帕利尼亚:赛后主教练哭了,俱乐部每个人都配得上今天这一刻

懂球帝
2026-05-25 04:47:16
海外巨头集体反水!重仓研发内燃机,纯电神话彻底破灭?

海外巨头集体反水!重仓研发内燃机,纯电神话彻底破灭?

三农老历
2026-05-25 00:25:04
四川6市(州)发布干部任前公示

四川6市(州)发布干部任前公示

人民资讯
2026-05-24 13:00:16
手举6个蛋暗讽樊振东,前国手刘丁硕引发热议,现已关闭社媒评论

手举6个蛋暗讽樊振东,前国手刘丁硕引发热议,现已关闭社媒评论

兵鉴史
2026-05-22 10:55:13
欧尔班离任后,毛焦尔想了想,对乌克兰:照旧!

欧尔班离任后,毛焦尔想了想,对乌克兰:照旧!

新民周刊
2026-05-24 09:07:11
2026-05-25 06:47:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15296文章数 66884关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

王鹤棣掉粉超20万!代言和作品遭抵制

财经要闻

什么情况下,本轮AI大行情会结束?

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

教育
时尚
房产
本地
军事航空

教育要闻

女教师"幼态字体"走红,被家长建议停职, 学校:停职,接受调查

《低智商犯罪》一半惊喜,一半可惜

房产要闻

疯狂周末,海口楼市突然爆了!

本地新闻

用云锦的方式,打开江苏南京

军事要闻

深夜美伊谈判传来大消息 特朗普最新表态

无障碍浏览 进入关怀版