同样的DNA说明书,心脏细胞和皮肤细胞是怎么读出完全不同的结果的?这个问题困扰生物学家几十年。最近MIT的研究团队拿出了一套新工具,试图破译细胞里的"剪辑规则"。
这套叫KATMAP的模型,核心思路是把基因剪接这件事从"黑箱"变成可预测的计算问题。它的名字很长——Knockdown Activity and Target Models from Additive regression Predictions——但逻辑其实挺直接:先打乱某个剪接因子的表达量,看哪些基因的剪接方式跟着变了,再结合这个因子喜欢结合的DNA序列特征,反过来推断它平时在调控什么目标。
![]()
说人话就是:细胞里有种分子机器专门负责"剪辑"基因信息。DNA先被抄成RNA草稿,然后这台机器把没用的片段(内含子)剪掉,把有用的片段(外显子)拼起来,最后才能翻译成蛋白质。而"剪接因子"就是控制剪辑风格的导演——同一个剧本,不同导演能剪出完全不同的版本。
这种剪辑的灵活性让细胞可以用同一套基因库造出千变万化的蛋白质,但也埋下了隐患。剪接出错——不管是被剪的基因有问题,还是剪接因子本身突变——都可能导致癌症等疾病,因为错误的剪辑会产生异常蛋白。理解这些规则,对开发相关疗法很关键。
MIT团队的第一作者Michael P. McGurk提到,以前的方法能给出一个"平均画面",但没法精确预测某个特定基因上的某个特定外显子会被怎么剪。KATMAP想填补这个空白。它依赖的是扰动实验:人为地让某个剪接因子过量表达或表达量骤降,然后用RNA测序捕捉下游变化。这些变化反过来训练模型,让它学会从序列特征预测调控关系。
论文还提到一个潜在应用方向:预测合成核酸药物会不会干扰剪接。这类药物在治疗某些肌萎缩和癫痫相关疾病上已有前景,但它们的脱靶效应一直是个未知数。KATMAP或许能帮研究人员提前评估风险。
不过模型能走多远,还得看它在不同细胞类型、甚至不同物种之间的迁移能力。MIT团队强调KATMAP的设计目标之一就是跨场景适用,但这部分的具体验证数据,论文里没展开。
基因调控的研究向来在"知道它重要"和"知道它怎么工作"之间隔着巨大鸿沟。KATMAP算是往后者迈了一步,但距离真正预测任意细胞里的任意剪接事件,可能还有相当距离。科学界目前还没定论的部分,或许比已经搞清楚的部分更值得持续关注。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.