
撰文|李淡宁
序列特异性的转录因子(transcription factor,TF)与 DNA 的结合,是实现真核基因表达时空调控的关键。然而,驱动 TF 结合以及可及染色质建立的分子细节,尚无法从第一性原理得到理解——包括 TF 如何在 DNA 上进行搜索、局部序列背景如何调节结合亲和力、TF 结合的动力学特征,以及基序文法(motif grammar)如何建立 TF 占据、核小体缺失的区域以调控基因表达。近期研究文献中报道的结果表明,传统试验方法所得出的结论需要被从新评估,尤其是在活细胞中定量 TF 结合 DNA 的各种细节,如体 外与体内 TF–DNA 结合动力学差异,亲和力与 基序 识别差异以及基序侧翼的碱基对数量等 ,都需要建立一个定量的、微观层面的真核 TF 搜索与基序识别模型,进行深度学习。
近日, 来自美国斯坦福大学 William J. Greenleaf 团队在Cell杂 志上发表了题为Thermodynamic principles link in vitro transcription factor affinities to single-molecule chromatin states in cells的文章,报道通过高通量手段定量比较了体外转录因子结合速率和亲和力、体内单分子水平的转录因子与核小体占据情况,基于体内数据构建的深度学习模型;以及基于该模型的研究成果,包括侧翼序列可引起高达 40 倍的亲和力变化;亲和力变化主要由基序识别概率驱动,而非转录因子在结合状态下的停留时间;体外测量与细胞核内测量均显示转录因子的驻留时间为分钟量级,且高度一致;体外获得的生物物理参数能够预测未见过的基序文法在体内的序列偏好以及单分子水平的染色质状态。
![]()
为了对 TF 结合 DNA 进行深度理解,本文研究人员利用红细胞 Krüppel 样因子 1 ( KLF1/eKLF )作为 TF 研究对象 。 KLF1 是 C2H2 锌指蛋白,其三指 DNA 结合结构域在 KLF 家族中高度保守。研究人员首先,设计了一个包含 11,812 条 DNA 序列的文库,这些序列在一致性的 9 bp KLF 基序(CCMCRCCCN) 内含有不同变体。该文库覆盖了一个高亲和力基序 CCACGCCCA(定义为共识基序)的所有单点突变、所有双点突变以及部分三点突变,同时还包含对基序侧翼序列的广泛程序化变异,以及不含该基序的阴性对照;以便在体外测量 KLF1 的结合亲和力。结果表明,结合能(ΔG)与生物层干涉技术(Octet)在侧翼和基序突变上的测量结果呈线性相关;结合与解离速率之比所得到的相对亲和 力 与在不同 KLF1 浓度下通过平衡测量获得的解离常数一致;基于基序突变构建的 KLF1 位置权重矩阵 (PWM) 呈现出 CACCC-box经典基序,第 1 指对整体亲和力的贡献最小。更进一步试验结果表明,KLF1 的结合亲和力主要由基序识别概率(即向特异性结合状态转变的概率)所决定,而非其在完全结合构象中的停留时间(微观驻留时间)。
为确定侧翼碱基在多大距离范围内仍可影响基序结合,研究人员检测了 KLF1 与嵌入于准随机序列中的基序的结合情况,同时逐步增加恒定侧翼序列的长度。结果证明在不固定侧翼序列的情况下,结合动力学的变异性最大;随着越来越多的侧翼碱基被固定,这种变异性逐渐降低。在没有恒定侧翼序列时,亲和力存在约 40 倍 的变化范围。当固定 3 个 侧翼碱基时,这种变异性衰减至约 2 倍;而即便在固定 15 个 侧翼碱基的情况下,该效应仍然存在。随后研究人员进行更加深入的分析,结果显示:在所有侧翼位置中,靠近基序的碱基对亲和力贡献最大:在 5′ 侧翼(靠近 KLF1 N 端锌指结合位置)中,对鸟嘌呤(G)表现出强烈偏好;而在 3′ 侧翼(靠近 C 端锌指结合位置)中,则表现出较弱的 排斥 GC 含量 的趋势。KLF1结合对序列背景具有显著依赖性,这种依赖性可由线性能量模型有效刻画,而−1和−2位点的直接接触很可能是驱动近端侧翼效应的主要机制。
最后,研究人员测试了多种可能性对结合亲和力的影响。结果包括但不限于:远离基序的 GC 富集序列在 DNA 螺旋周期尺度上降低 KLF1 亲和力,基序 5 ′ 端相邻的两个碱基( −1 和 −2 位点)在由侧翼序列驱动的 KLF1 亲和力变异中占据主导地位;然而,其余侧翼碱基的合并能量贡献与这两个近端碱基大致相当。远端侧翼通过调节 TF 搜索过程中的“跳跃”概率来影响亲和力,尽管 KLF1 对 5′ 端两个侧翼碱基的偏好很可能源于直接接触,其对远离基序的 AT 富集序列的偏好,则与序列成分在 TF 搜索过程中调控 KLF1 跳跃速率这一机制高度一致(更多详情请参阅原文)。
![]()
综上所述,本文研究人员紧随时代潮流,利用深度学习模型,对转录因子与DNA结合进行了详细分析;对转录因子与DNA结合亲和力的影响因素,如基序识别差异,基序侧翼碱基对数量,以及他们与亲和力之间的关系进行了深度学习。方法新颖,结论较传统研究分析方法更为准确。
https://www.cell.com/cell/fulltext/S0092-8674(25)01300-5
制版人: 十一
学术合作组织
(*排名不分先后)
![]()
战略合作伙伴
(*排名不分先后)
![]()
![]()
转载须知
【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐

点击主页推荐活动
关注更多最新活动!
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.