![]()
掌握单细胞的环境搭建和分析套路后,接下来主要是单细胞数据分析。单细胞数据与单细胞测序平台密切相关。早期单细胞测序基于荧光分子或者细胞形态筛选细胞,再扩增和测序,往往通量较低,以SMART-seq最具代表性,其数据由三部分组成,可以分别获取。比如肝癌数据集GSE144028。
![]()
min.features = 200)非特异性细胞分选比较成熟的单细胞高通量测序技术,主要包括Fluidigm的C1平台,BD Rhapsody平台和目前使用最广泛的 10xGenomics 平台。 上传到GEO的数据并没有经过平台归一化处理 ,其中无论是芯片数据、二代测序数据还是单细胞数据的格式差异较大,而不像TCGA数据那么归整。这就导致GEO单细胞数据及其读取的多样性。
min.features = 200)GEO数据库提供的单细胞数据大致分为三类,①原始数据:fastq格式的测序数据;②经过Cellranger标准化后的10X数据;③counts数据。前面分享的主要是第二种数据。对于fastq数据的处理,需要用到Linux和shell ,我们以后再做分享。关于counts数据,仍然属于下游数据分析,值得尝试分析。
save(scRNA_all, file = "scRNA_all.Rdata")此外,还有 h5格式等存储的单细胞数据文件,在很多公众号上都有详细的代码,这里不再赘述。掌握上述代码,我们基本上能应付GEO数据库80%左右的单细胞数据了。如果还有其他格式或情况的单细胞数据,我们用到时候再学习也不迟。
参考资料
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.