
近日,中国农业科学院作物科学研究所路则府团队在国际著名期刊Genome Biology发表题为DeepWheat: predicting the effects of genomic variants on gene expression and regulatory activities across tissues and varieties in wheat using deep learning的研究论文。该研究提出了创新性的深度学习框架——DeepWheat,通过融合小麦基因组序列与多维表观组学特征,实现了跨组织、跨品种的基因表达精准预测,系统揭示了关键调控序列及其变异对基因表达的影响机制,为作物基因编辑和分子设计育种提供了全新的人工智能工具。
![]()
DeepWheat:融合序列与表观组的深度学习框架
基因的时空特异性表达决定了作物的生长发育与农艺性状,而顺式调控元件(cis-regulatory elements, CREs)在其中发挥核心作用。然而,在基因组庞大、冗余度高的小麦中,准确预测组织特异性表达并解析CRE变异效应仍是一大挑战。为解决这一问题,研究团队整合了小麦多组织、多发育阶段的染色质开放性、组蛋白修饰及RNA-seq数据,开发出双模型协同的深度学习框架---DeepWheat(图1)。该框架包含两个互补模块:
1)DeepEXP:整合DNA序列与表观遗传特征,实现组织特异性基因表达的高精度预测;
2)DeepEPI:从序列直接预测表观遗传图谱,并支持跨品种迁移。
DeepWheat 不仅能够预测基因表达水平,还可通过归因分析识别关键调控序列及变异效应,为基于CRE的靶向基因编辑与作物分子设计育种提供新思路。
![]()
图1. DeepWheat 框架示意图
整合表观信息显著提升表达预测准确性
在多组织、多发育时期的训练数据下,DeepEXP 将序列与表观组特征高效融合,实现了显著优于传统序列模型的预测精度。该模型不仅在小麦中表现出色,在拟南芥、水稻和玉米中的迁移预测中也表现良好。尤其对于组织特异性表达基因,表观组信号能够捕捉动态染色质状态,使预测结果更具生物学意义(图2)。
![]()
图2. 表观特征整合显著提高基因表达预测精度
DeepEPI:低成本获得高精度表观图谱
由于表观组实验成本高昂,研究团队在 Basenji2 框架基础上构建了 DeepEPI模型,用于从序列预测小麦多组织的染色质修饰信号。DeepEPI 能精准刻画远端可及区(distal accessible regions),辅助增强子挖掘,并在多组织间保持高稳定性。将 DeepEPI 的预测表观信号与序列特征联合用于基因表达预测后,模型准确率显著提升,优于仅使用序列信息的模型(图3)。
![]()
图3. 基于序列预测表观信号与表达水平
跨品种迁移验证模型的强泛化能力
DeepWheat 在5个不同小麦品种上的迁移测试中,无论在表观信号还是表达预测层面,均保持了较高精度和鲁棒性。即使在结构变异(SV/CNV)区域,性能下降也不显著,显示出其对复杂基因组结构的良好适应性(图4)。
![]()
图4. DeepWheat 在不同小麦品种上的预测性能
变异效应解析与实验验证
DeepWheat 可通过归因分析定位影响表达的关键motif,并定量评估近端调控区内的SNP与INDEL效应。研究发现,INDEL对表达的影响显著强于SNP,且预测到的有效变异与已报道的cis-eQTL高度重叠,验证了模型的生物学可靠性。有趣的是,预测到的有效变异不仅分布于启动子区域,还富集于内含子、UTR与外显子区域,提示基因体结构在表达调控中具有重要作用。在 TaSNAC8-6A 启动子等位变异及两基因启动子的荧光素酶实验中,DeepWheat 的预测结果均获得实验证实,显示其在指导作物调控元件精准编辑与功能验证方面的应用潜力(图5)。
![]()
图5. 变异对调控序列活性与表达的影响验证
DeepWheat 的建立为小麦等复杂作物的基因调控研究提供了新的技术路径。通过融合基因组序列与表观特征的深度学习策略,该研究不仅突破了传统模型在时空表达预测上的瓶颈,也为实现基因“适时、适地、适量”表达的精准控制提供了有力工具。未来,DeepWheat 有望在基因调控区精准编辑、作物功能变异解析、基因网络重构及智能育种设计中发挥重要作用。
该研究由中国农业科学院作物科学研究所小麦基因资源发掘与利用创新团队完成。路则府研究员为通讯作者,博士生马志岗、张家梓和助理研究员裴洪翠为共同第一作者。刘衍宏博士后在数据分析方面提供了重要支持。研究还得到了童红宁研究员、王磊研究员的帮助,以及贾继增研究员、高丽锋副研究员、赵光耀研究员、刘盼助理研究员和李婷老师的支持。研究获得国家重点研发计划、国家自然科学基金和中国农业科学院创新工程等项目资助。
https://doi.org/10.1186/s13059-025-03809-x
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.