网易首页 > 网易号 > 正文 申请入驻

首个基于Al和MD的CRISPR脱靶效应预测和sgRNA优化模型CRISOT

0
分享至

CRISPR 基因编辑技术已经被广泛应用于生命科学的各个领域,但美中不足的是其存在脱靶效应,限制了该技术在临床上的应用。而且由于对 CRISPR 分子机制的理解不够深入,现有的计算工具在全基因组脱靶预测方面也不甚理想。

为了解决该问题,同济大学生命科学与技术学院生物信息学系、同济大学-上海自主智能无人系统科学中心刘琦教授课题组,联合之江实验室、罗氏上海创新中心和中国农业科学院等团队在最新的一项研究中,提出将分子动力学(MD)模拟整合到 CRISPR 系统的计算分析中。他们开发了一个名为 CRISOT 的综合工具套件,其中包含四个相互关联的模块:CRISOT-FP、CRISOT-Score、CRISOT-Spec 和 CRISOT-Opti。这些模块分别用于 RNA-DNA 分子相互作用指纹生成、全基因组 CRISPR 脱靶预测、sgRNA 靶向特异性评估以及 Cas9 系统的 sgRNA 优化。全面的计算和实验测试表明 CRISOT 在计算机验证和概念验证实验中的表现优于现有的工具。

日前,该研究以“Genome-wide CRISPR off-target prediction and optimization using RNA-DNA interaction fingerprints”为题,发表在《自然·通讯》上。

克服脱靶效应

像 CRISPR-Cas9 系统这样的由 RNA 指导的基因组编辑系统,在生物学和医学等领域有着广泛的应用。虽然它能够进行精确的基因组编辑,但如何避免脱靶效应却成为了一个巨大的挑战。研究表明,Cas9 酶能够容忍一定数量的碱基对错配,这意味着在基因组中可能存在一些与 sgRNA 不完全互补的位点,这些位点成为了潜在的脱靶位点。脱靶效应可能会导致潜在的副作用,从而阻碍 CRISPR 系统的进一步发展和临床应用。因此,对于研究人员来说,开发出更加精确、高效的基因组编辑方法是非常重要的。

为了设计出能够避免脱靶效应的 sgRNA,目前已经有不少计算机模拟工具被开发出来。这些工具大致分为由假设驱动的工具和基于机器学习的工具这两类。由假设驱动的工具使用经验规则评估脱靶效应,而基于机器学习的工具则利用机器学习模型进行预测。尽管它们有所差异,但这些工具的全基因组脱靶预测性能有限,这主要是因为对 CRISPR 分子机制的理解不够深入。Cas9 的分子机制主要包括两个基本过程:与靶序列结合形成稳定的复合物,以及两个核酸酶域的别构激活来剪切 DNA。这两个过程由 Cas9-sgRNA-DNA 复合物中的一系列分子间和分子内相互作用驱动。这些分子相互作用也可以预测 CRISPR 编辑过程,但相关研究还不多。已有研究表明,通过 Cas9-sgRNA-DNA 复合物的结合能可以更精确地预测 CRISPR 脱靶效应,但这些分子相互作用还有待进一步阐明,以改进全基因组 CRISPR 脱靶预测。

而本研究提出的 CRISOT 是一个基于 CRISPR 系统 RNA-DNA 分子相互作用的综合计算框架,用于全基因组 CRISPR 脱靶预测、评估和优化。通过分子动力学模拟,他们推导出 RNA-DNA 分子相互作用指纹,以表征 CRISPR 系统中 RNA-DNA 的底层相互作用机制。该方法可提高 CRISPR 基因组编辑的靶向特异性。

CRISOT 的概念框架

CRISOT 最初是为 CRISPR-Cas9 系统而设计,但也拓展到其他 RNA 引导的 CRISPR 系统。它利用 MD 模拟获取 RNA-DNA 杂合体的分子相互作用,并将其开发成分子互作指纹,用于开展全基因组CRISPR脱靶预测、评估和优化。CRISOT 包括四个模块:融合 AI 和分子互作指纹进行脱靶效应预测的 CRISOT-FP,快速计算脱靶打分的 CRISOT-Score,计算 sgRNA 靶向特异性得分的 CRISOT-Spec,以及进行 sgRNA 优化的 CRISOT-Opti。对于编辑效率高但靶向特异性差的 sgRNA,CRISOT-Opti 通过引入单核苷酸突变,在保持一定的靶向效应的同时,降低该 sgRNA 的脱靶效应,达到优化目的。

CRISOT-FP 归纳了 Cas9 系统中 RNA-DNA 杂合体的分子互作指纹

在 CRISOT-FP 的设计中,作者们认为 RNA-DNA 杂合体包含关于 Cas9 激活的分子相互作用信息。因此,他们设计了一系列 RNA-DNA 杂合体并进行了 MD 模拟,开发了 RNA-DNA 分子相互作用特征,并筛选了 193 个特征来编码 sgRNA-DNA 杂合体。CRISOT-FP 将每个 sgRNA 和 DNA 核苷酸对编码为 193 个分子相互作用特征,形成了位置依赖的分子互作指纹。该方法可与各种机器学习模型结合,通过捕捉 Cas9 系统中 RNA-DNA 杂合体的本质特征提高模型预测能力。

为了评估 CRISOT-FP 的性能,他们使用了来自体外全基因组脱靶检测技术的 Group I 基准数据集。并比较了 CRISOT-FP 和其他三种特征编码方法(Crista_feat、One-hot 和 Two-hot 编码)在 CRISPR 脱靶预测中的性能。CRISOT-FP 无论是在 LGO 还是 LSO 测试中都表现出色。相比之下,其他编码方法在预测脱靶效应方面表现较差。

CRISOT-FP 与 SOTA 预测方法的比较

为了进一步评估 CRISOT-FP 在独立测试数据集上的脱靶预测能力,并与当前最先进的脱靶预测方法进行比较,作者们构建了与训练数据集相互独立的 Group II 数据集,将 CRISOT-FP 与四种假设驱动的脱靶打分工具和四种基于学习的脱靶预测工具进行比较。CRISOT-FP 的打分值是前述基准研究中描述的 Group I 数据集上得到的模型的平均值。他们进行了三项基准测试,以评估 CRISOT-FP 在预测全基因组脱靶效应方面的性能。

在第一项基准测试评估中,测试了模型在预测体外实验数据集上的性能。虽然 MOFF 模型在 guideseq_listgarten 数据集上性能上与 CRISOT-FP 相当,但 CRISOT-FP 在其他数据集上均表现优异。CRISOT-FP 平均 PR-AUC 为 0.46(p < 0.05),优于其他方法。

在第二项评估中,测试了模型在细胞实验数据集上的性能。CRISOT-FP 在 PR-AUC 结果上优于所有基于学习模型和假设驱动方法(p < 0.05),可见,CRISOT-FP 在预测基因组脱靶效应方面表现出色。

在第三项评估中,测试了模型在不同灵敏度下的性能。作者将 6 个检测灵敏度应用于脱靶数据集,以获得 6 个具有不同灵敏度的数据集。结果 CRISOT-FP 在不同灵敏度的脱靶数据集方面,都优于其他方法。其性能随检测灵敏度的变化而略微提升。在上述各种比较方法中,CRISOT-FP 的 PR-AUC 结果最佳。总体上来说,CRISOT-FP 展现出强大的泛化能力,优于现有的基于机器学习的模型和假设驱动方法,能更精准预测 Cas9 的脱靶效应。

CRISOT-Score 能够提供 Cas9 系统的有效脱靶打分

通过使用 XGB 模型与 SHAP 算法,作者分析了 CRISOT-FP 中的特征重要性,发现近 PAM 端位置比远 PAM 端位置更重要,其中位置 5、8 和 9 在远 PAM 端位置中较为重要。这与之前关于 Cas9 分子机制的研究一致。他们分析了 CRISOT-FP 的关键互作特征,发现与结合稳定性相关的特征如 E_surf、resA@N1 resB@N1 和 hbond_bp5 最为重要。RNA-DNA 杂合体的曲率对 Cas9 的结合亲和力也有影响,而原子位置和结合自由能特征对模型贡献最大。此外,一些关键原子位置可能影响 Cas9 的切割活性。

随后,作者利用关键互作特征设计了一个灵活的脱靶打分函数 CRISOT-Score,使用关键互作特征对每个位置的不同碱基类型进行打分,从而得到给定 sgRNA 和 DNA 序列的脱靶打分值 CRISOT-Score。他们在 Group I 数据集上评估了选择前 1-30 个关键互作特征时 CRISOT-Score 的脱靶打分性能变化,并最终选择前 24 个关键互作特征用于开发 CRISOT-Score。

作者接下来全面评估了 CRISOT-Score 的有效性,发现其在预测脱靶现象方面优于 7 种先进的假设驱动的脱靶打分方法,包括 KinPred、CRISPRoff 等。CRISOT-Score 不仅考虑了结合自由能特征,还纳入了原子位置、氢键和碱基的几何特征,更系统地反映了 Cas9-sgRNA-DNA 复合体的相互作用。而且 CRISOT-Score 能很好地区分活性和非活性的脱靶位点。对于被实验验证的脱靶位点,其 CRISOT-Score 打分值的分布与非活性的脱靶位点具有明显的不同。最后,作者发现随着 CRISOT-Score 的增加,活性脱靶位点的频率也增加。当 CRISOT-Score 大于 0.8 时,活性脱靶位点的频率高于 0.9;而当 CRISOT-Score 低于 0.5 时,活性脱靶位点的频率几乎为 0。因此,使用 CRISOT-Score 能有效地预测脱靶位点的活性。

CRISOT-Spec 提供有效的 sgRNA 靶向特异性评估

靶向特异性打分工具根据 sgRNA 在全基因组范围内的脱靶情况评估 sgRNA 的靶向特异性。已有靶向特异性打分方法通常将所有位点的打分结果进行简单叠加,然而,作者认为更需要关注脱靶效应打分较高的位点,因为它们更有可能导致严重的脱靶效应。为了解决这个问题,他们开发了一种特异性打分方法,即 CRISOT-Spec。对于给定的 sgRNA,CRISOT-Spec 搜索其全基因组脱靶位点并计算它们的 CRISOT-Score 值。然后计算不同 CRISOT-Score 值范围内的潜在脱靶位点的数量,并将其乘以该范围内活性脱靶位点的概率。由于 CRISOT-Score 值低于 0.5 的脱靶概率几乎为零,CRISOT-Spec 主要关注 CRISOT-Score 值高于 0.5 的脱靶位点,这些是最有可能的活性脱靶位点。脱靶位点的错误编辑,即使切割效率很低,都会在临床治疗中带来很大的问题。

测试结果表明 CRISOT-Spec 在预测 sgRNA 的靶向特异性方面表现出色,并在预测 Site-seq 数据集上表现最佳,Spearman 相关系数达到 −0.853。与其它靶向特异性打分方法相比,CRISOT-Spec 显著优于 CRISPRspec、MIT 和 CFD 特异性打分,并与唯一的基于学习的方法即 MOFF-aggregate 表现相当。

CRISOT-Opti 优化 sgRNA 以减少脱靶效应

对于靶向特异性较差的 sgRNA,CRISOT-Opti 方法引入突变,并计算 CRISOT-Score 和 CRISOT-Spec 打分,根据打分情况挑选优化的 sgRNA。这样在保证目标 DNA 切割效率的同时,降低脱靶效应的风险。该方法可有效优化 sgRNA,提高 CRISPR 系统的靶向特异性和准确性。

以人类 EXM1 基因的 GAGTCCGAGCAGAAGAAGAAGGG 序列为例,使用 CRISOT-Opti 方法优化该 sgRNA。通过突变 sgRNA 并计算 CRISOT-Score 和 CRISOT-Spec 打分,可以找到具有更好靶向特异性的 A11 > C(11 位点的 A 突变为了 C)突变 sgRNA,由于 A11 > C 突变 sgRNA 的 CRISOT-Score 较高,该突变 sgRNA 仍将对其目标 DNA 保持有效的切割效率。此方法有助于在保持较高的目标 DNA 切割效率的同时降低脱靶效应的风险。

为了验证优化结果,作者进行了 Guide-seq 实验检测 WT 和 A11 > C sgRNA 的全基因组脱靶位点。结果表明,使用突变 sgRNA 降低了目标 DNA 的切割活性,但仍保持足够效率,这与之前的研究一致。同时,A11 > C sgRNA 显著减少了脱靶编辑,能够减少约 50 倍的脱靶读数和 5 倍的活性脱靶位点。优化后的 sgRNA 保护基因免受攻击,减轻 CRISPR-Cas9 系统的副作用。随后,他们使用 CRISOT-Opti 对两个重要的治疗基因 PCSK9 和 BCL11A 的 sgRNA 进行优化,并进行了 WGS 实验验证,结果表明 CRISOT-Opti 可用于优化 sgRNA,可以提高基因编辑安全性。

CRISOT 可促进碱基编辑器和碱基编辑器全基因组脱靶预测

CRISOT 是一种基于 RNA-DNA 的相互作用开发的用于预测 CRISPR 脱靶效应和优化 sgRNA 的工具,可用于提高基因编辑的安全性,同时保持 CRISPR 治疗的有效性。碱基编辑器(BEs)和先导编辑器(PEs)允许在不引发 DNA 双链断裂的情况下,对目标序列进行精确编辑,但它们也涉及 RNA-DNA 的相互作用。故 Cas9 的脱靶预测方法通常也被用于评估 BEs 和 PEs 的脱靶效应。因此,作者制作了一个独立的脱靶数据集,用于评估 CRISOT 在预测 BEs 和 PEs 的脱靶效应和目标特异性方面的性能。结果显示,CRISOT 在预测这些编辑器的脱靶效应方面优于其他方法,并且在预测靶向特异性方面也表现出色。

下一步的研究

尽管 CRISOT 取得了成功,但仍有改进空间。

首先,本研究仅考虑了具有 NGG PAMs 且无 DNA/RNA 突起的脱靶。除了典型的 NGG PAM,Cas9 也能切割具有替代 PAM 序列的脱靶,但切割速率较低。未来应考虑各种 PAM 序列和 DNA/RNA 突起导致的脱靶效应。

其次,RNA-DNA 分子相互作用特征和 CRISOT-FP 提供了对 Cas9 分子机制的深入理解,但变构和切割机制可能涉及其他分子相互作用。未来应对这些过程涉及的互作进行更全面的模拟研究。

第三,DNA 可及性特征(如染色质开放信息和 DNA 甲基化信息)可能会增强性能,但这些信息并不总是可以获取的。因此,CRISOT 工具未在此版本中考虑这些信息。

第四,作者训练了 XGB 模型,因为它们简单强大且易于训练表列数据。未来可以更灵活地整合复杂机器学习算法,特别是深度学习算法。最后,当前主要在计算上进行验证,未来进行更大规模的实验验证将使结果更具说服力。

声明:本文仅供科研分享,助力科学传播,不做盈利使用,如有侵权,请联系后台删除。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“想停火?先签协议” 特朗普打起新算盘

“想停火?先签协议” 特朗普打起新算盘

上游新闻
2026-05-26 14:19:02
尼克斯重返总决赛!布伦森1999年总决赛萌照曝光,冥冥自有天意

尼克斯重返总决赛!布伦森1999年总决赛萌照曝光,冥冥自有天意

仰卧撑FTUer
2026-05-26 14:34:08
一只私募产品净值亏到仅剩0.002元,怎么做到的?

一只私募产品净值亏到仅剩0.002元,怎么做到的?

财联社
2026-05-26 15:56:19
奶茶店施暴女子已被行拘:正脸曝光,身份被扒是老师,工作恐不保

奶茶店施暴女子已被行拘:正脸曝光,身份被扒是老师,工作恐不保

奇思妙想草叶君
2026-05-25 23:22:54
韬定律掀的是台积电们的桌子

韬定律掀的是台积电们的桌子

智远同学
2026-05-25 21:23:45
弘一法师:永远不要去责怪你生命里的任何人,好的人给你快乐,坏的人给你经历,别人怎么对你,是过往,你怎么对别人,是修行

弘一法师:永远不要去责怪你生命里的任何人,好的人给你快乐,坏的人给你经历,别人怎么对你,是过往,你怎么对别人,是修行

每日一首古诗词
2026-05-26 12:07:58
稻城亚丁景区截断收费省道日常由地方财政出资维护?财政局回应:属实

稻城亚丁景区截断收费省道日常由地方财政出资维护?财政局回应:属实

上游新闻
2026-05-26 15:32:23
毒性堪比砒霜!正大量上市,一旦发苦赶紧吐掉!医生:煮熟也有毒

毒性堪比砒霜!正大量上市,一旦发苦赶紧吐掉!医生:煮熟也有毒

中吴网
2026-05-25 22:42:39
53岁袁立病房照曝光!钱再多有什么用?她给所有中年女人提了个醒

53岁袁立病房照曝光!钱再多有什么用?她给所有中年女人提了个醒

文刀贰
2026-05-24 21:21:45
突发:伊朗发生大规模爆炸

突发:伊朗发生大规模爆炸

扬子晚报
2026-05-26 07:46:02
央视三胎宣传片翻车惹争议:看似温情劝生,为何吓退无数年轻人?

央视三胎宣传片翻车惹争议:看似温情劝生,为何吓退无数年轻人?

大稻网络科技
2026-05-25 15:23:25
矿难赔偿真相:2026年这个新标准,每个矿工家庭都该知道

矿难赔偿真相:2026年这个新标准,每个矿工家庭都该知道

黑翼天使
2026-05-26 16:48:55
血债惊全球!47条人命炸穿底线!中方怒斥:这事没完!

血债惊全球!47条人命炸穿底线!中方怒斥:这事没完!

达文西看世界
2026-05-26 15:42:43
猖狂一幕!美日刚拉印度“制华”!日本就登门挑衅,中方一招破局

猖狂一幕!美日刚拉印度“制华”!日本就登门挑衅,中方一招破局

健身狂人
2026-05-26 15:55:47
中国AI落地“最后一公里”,联想打造“智能价值网”

中国AI落地“最后一公里”,联想打造“智能价值网”

一点财经
2026-05-25 18:12:51
黄仁勋陪父母普通小店吃饭,曾回忆:我的英文是不懂英语的母亲用字典教的

黄仁勋陪父母普通小店吃饭,曾回忆:我的英文是不懂英语的母亲用字典教的

爆角追踪
2026-05-26 09:37:26
卫健委已将左氧氟沙星列为重点监控药物!提醒:服用千万注意

卫健委已将左氧氟沙星列为重点监控药物!提醒:服用千万注意

健康科普365
2026-05-25 22:15:03
热!广东高“炎”值闷热天还要多久?

热!广东高“炎”值闷热天还要多久?

广东天气
2026-05-26 14:31:22
不用3nm照样封神!麒麟9050性能超越A18:3D堆叠绕开制程封锁

不用3nm照样封神!麒麟9050性能超越A18:3D堆叠绕开制程封锁

快科技
2026-05-26 11:37:30
五个副省级城市政府主要领导调整,“70后”杜旭亮任杭州市代市长

五个副省级城市政府主要领导调整,“70后”杜旭亮任杭州市代市长

上观新闻
2026-05-26 10:21:18
2026-05-26 19:07:00
络绎科学 incentive-icons
络绎科学
专业的科研成果转化社区
105文章数 3关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

25岁海归男恋上32岁离异女 因88.8万彩礼闹掰追讨12万

头条要闻

25岁海归男恋上32岁离异女 因88.8万彩礼闹掰追讨12万

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

艺术
教育
时尚
数码
本地

艺术要闻

中国之美,美到极致!

教育要闻

工科三巨头:电子信息、计算机、电气,普通家庭到底怎么选才不亏

全网刷屏,华语乐坛“嫡长女”终于来了!

数码要闻

618消费观察:当“情价比”取代性价比,怎样的电视正在被买走?

本地新闻

用云锦的方式,打开江苏南京

无障碍浏览 进入关怀版