Crispr/Cas9介导的遗传学筛选 (Genetic Screens)已成为肿瘤表型与鉴定癌症进展驱动基因的核心工具。标准流程是将慢病毒 sgRNA 文库导入细胞或动物模型,经功能性压力(增殖、转移、药物处理)富集或耗竭特定 sgRNA,再通过高通量测序量化丰度变化,即可在无偏好前提下找出与表型相关的必需基因或耐药基因。
![]()
在Crispr screen技术进步同时,如何分析和发掘Crispr screen得到的数据也是一个巨大的挑战。与传统转录组、蛋白组数据相比,CRISPR 筛选产生的计数矩阵维度更低、噪声来源更多(如慢病毒滴度、编辑效率、细胞倍增速率等),且需同时估计 sgRNA 水平与基因水平的竞争适应度,这对统计模型提出迥异的要求。一般至少并行 2–3 种互补策略对Crispr screen数据进行分析,通过一致性评分或投票机制降低假阳性。
![]()
Cancer CRISPR Screening Data Analysis Platform (OncoCRISPRDB)可用于肿瘤Crispr数据再挖掘和分析肿瘤的各种表型下基因功能及通路情况。OncoCRISPRDB整合了多种肿瘤模型及实验条件下Crispr Screen数据,可以实现多种算法下功能基因筛选、通路分析、通路下基因相互作用分析和跨表型基因和通路的研究,同时支持客制化的分析参数以及可视化方式。
![]()
OncoCRISPRDB有三个核心步骤:数据收集,数据分析和可视化工具。该数据库整合161个数据集,涵盖1082个样本,精心筛选并适配 7 种针对CRISPR Screen数据的算法,实现对数据的基因,通路,表型层面的探索。
![]()
OncoCRISPRDB平台的数据源自GEO数据库,涵盖从2016年2月至2024年9月期间收集的肿瘤基因在CRISPR Screen中的数据。数据经过严格的筛选,以确保其质量和相关性。再经过临床信息分组,基因名的转化及数据清洗,我们得到了涉及92种细胞系、32种肿瘤类型,50种药敏相关表型和21种与肿瘤转移相关表型的肿瘤基因数据。
![]()
在 Crispr Screen 模块,用户可以自由选择3种算法。每种算法均有至少80个数据集可供探索,并提供气泡图,火山图,Rank图。
![]()
![]()
![]()
通路分析模块使用了clusterProfiler包中的GSEA算法进行通路得分计算,支持从The Molecular Signatures Database (MSigDB)数据库中手动挑选的 8691 条常用的肿瘤相关基因集。数据结果可视化支持 GSEA Plot,Ridge Plot,Pathway correlation Plot和Dot Plot 4种形式。
![]()
![]()
相互作用分析模块,DCE (Differential Causal Effects)算法用于通过比较正常细胞和癌细胞的基因表达数据来检测信号通路中的异常调控。该方法基于因果推断的统计框架,能够 识别在癌症细胞中异常调控的特定基因相互作用(即通路中的边),同时考虑混杂因素的影响跨表型基因。该模块支持KEGG数据库中 220条KEGG通路下的基因相互作用分析 (注:部分数据部分通路缺失不支持)
![]()
表型相似度分析模块 使用GSEA算法模拟各类表型之间的相似度。将 各表型下基因得分进行排序,在汇总所有表型的基因集后, 使用GSEA算法对每种表型计算富集得分ES (Enrichment Score)。高ES得分表明该基因集与该表型之间的关联性较强。该模块的分析结果以GSEA图,Ridge图以及Bar图的形式呈现。
![]()
跨表型基因分析模块实现深入探索 不同表型或类似表型下不同实验组中 功能基因的表现。其对 任意两个数据集进行Z-score标准化处理,确保数据处于同一尺度,从而消除不同数据集之间的量纲和量级差异。
![]()
通过CRISPR Screen数据分析,挖掘关键基因和通路,为肿瘤研究提供新的策略。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.