撰文 |Sure
真核生物中转录因子(Transcription factors,TFs)往往识别非常短且退化的基序(motif),比如E-box识别6bp的motif,这种motif在整个基因组中极其常见【1】。 理论上TF应当绑定这些motif,但实际上只绑定其中少数,说明motif本身不足以解释TF结合特异性。bHLH家族成员多达100多个,它们共享一个低信息的E-box motif,却能调控完全不同的发育通路,如NGN2导向神经分化,MyoD1导向肌肉分化【2-4】。这说明,即使识别的是相同的motif,TF之间的功能差异与结合特异性仍然显著,意味着或许有其他层级的信息调控机制参与进来。
2025年8月7 日, 来自 瑞士 Friedrich Miescher 生物医学研究所 的 Dirk Sch ü beler 课题组 在 Molecular Cell 上 发表了论文 Chromatin-dependent motif syntax defines differentiation trajectories 。 在本研究中, 作者发现 TF结合的特异性来源于多层次 调控 :DNA序列本身 + 染色质状态 + 其他因子合作 + 时间维度的动态演化 。
目前有两种主流模型解释这个问题:(1)直接蛋白互作模型: TF之间通过蛋白-蛋白互作协同绑定,形成组合调控 ;(2)先导因子(pioneer factors)模型: 一些特殊TF可以结合到包装紧密的核小体上, 解除核小体占位,为其他TF提供可接触位点。但是这两个模型都有各自的问题,都无法完全解释为何识别短、低信息motif的TFs在基因组中仅结合极少部分位点,却能精准调控细胞命运。为了揭示这个长期悬而未解的中心问题,作者构建了一个可控的小鼠胚胎干细胞模型,精确诱导两个bHLH家族的TF,NGN2和MyoD1,以此对比它们对相似DNA motif的选择性结合机制、染色质调控行为及功能输出差异。利用这一模型,作者发现TF结合行为由motif和染色质状态共同决定。 NGN2 和 MyoD1 在诱导6小时内分别结合约1.3–1.4万个位点,其中>95%含有特定motif变体(E-box类) 。motif结合概率 随染色质开放程度显著升高 , 例如NGN2在最开放区域的结合率为61%,封闭区域仅为0.4% 。 但大量motif出现在开放区域却未被结合,提示motif和 染色质 可及性之外仍有信息缺失。
接下来,作者利用机器学习建模,构建基于motif与染色质开放区域结合的预测模型,深入探讨序列语法(motif syntax)的影响机制。该模型揭示TF结合受motif syntax调控:(1) 不同TF对E-box变体具有不同亲和性 , 如NGN2偏好GA/TA型,MyoD1偏好GG/GC型; (2) 在 关闭的染色质 中,多motif并列是 结合 的强化因子; (3) 预测显示10–12 bp(一个DNA螺旋周期)内的motif对 结合 最有利; (4) 邻近碱基可调节motif的 结合 潜力,且不同TF对相同邻近碱基的响应不同; (5) 结合位点更倾向于位于 核小体 linker区域而非核心,符合bHLH无法结合核小体核心DNA的 结果。
随后,作者利用ATAC-seq研究发现,TF结合染色质后想要输出功能取决于是否能够激活染色质开放,即使 TF绑定成功,也不总是导致染色质开放或基因激活 。 某些motif变体绑定较强,但不引起开放;另一些则可激活H3K27ac、RNA Pol II 等转录相关信号。 这些结果表明,结合只是第一步,发挥功能仍需要额外机制。由于 NGN2可与TCF3/TCF4/TCF12异源二聚化 ,因此作者探究了TF复合物对motif变体的结合偏好影响。研究表明, 不同复合体对motif变体具有不同结合偏好 , 如NGN2-TCF3更偏好CAGATG;体内敲低TCF后,NGN2对特定motif结合显著下降,并影响神经分化过程 。 说明TF复合体构象影响其序列选择性,是motif语法的延伸。 在系统激活后期,作者还发现初始结合不仅激活目标基因,还引发次级TF表达,这些TF进一步改变染色质结构,而 NGN2/MyoD1再反馈性地占据这些新开放区域,形成 结合 位点的时空扩展与分化 。这说明 TF调控不是静态单点事件,而是一个递进演化的动态网络。
文章的最后,作者将其构建的预测模型应用在其他细胞系中,发现同样能较好的预测结合,说明他们发现的TF运作规则具有跨细胞类型的扩展性。应用其他bHLH家族成员也能有效预测。此外 模型可预测motif变体的结合力变化,如在DISP3基因增强子上的rs58130172变异与脑组织表达增强高度一致 , 提示该模型在解释GWAS位点、功能性SNP与转录调控失调方面具有广泛潜力。
总的来说, 该研究通过系统诱导实验、组学数据与深度神经网络建模,构建出一个将DNA序列信息(motif及其语法)与染色质背景整合在内的 结合 预测模型。 该模型 不仅解释了稀有的pioneering 结合 ,也能解释更常见的、依赖染色质开放状态的结合 。
https://doi.org/10.1016/j.molcel.2025.07.005
制版人: 十一
参考文献
1. Wunderlich, Z., and Mirny, L.A. (2009). Different gene regulation strategies revealed by analysis of binding motifs.Trends Genet.25, 434–440.
2. Ephrussi, A., Church, G.M., Tonegawa, S., and Gilbert, W. (1985). B lineage–specific interactions of an immunoglobulin enhancer with cellular factors in vivo.Science227, 134–140.
3. Longo, A., Guanga, G.P., and Rose, R.B. (2008). Crystal structure of E47NeuroD1/beta2 bHLH domain-DNA complex: heterodimer selectivity and DNA recognition.Biochemistry47, 218–229.
4. de Martin, X., Sodaei, R., and Santpere, G. (2021). Mechanisms of Binding Specificity among bHLH Transcription Factors.Int. J. Mol. Sci.22, 9150.
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
点击主页推荐活动
关注更多最新活动!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.