单细胞转录组测序


简介:

单细胞转录组测序(single cell RNA-seq, scRNA-seq),是在单个细胞水平对 mRNA 进行高通量测序的一项新技术,其能够以高通量和单分子分辨率研究单个细胞表达谱,揭示复杂细胞群体的异质性,避免单个细胞的基因表达信号被群体的平均化所掩盖。目前常用的测序平台有10x Genomics以及BD Rhapsody,这两种方法一次能检测几万个细胞,单个细胞只能检测到几百到几千的基因。除此以外,还有Smart-Seq,这种方法单细胞获取方法比较麻烦,但是一次能检测的基因数目较多。不同的实验方式要求的数据处理方式也有所不同。


分析内容:

基本数据分析

1.  数据预处理

各个样本测序数据基本质控(reads数、测序饱和度等)、各个样本数据比对(细胞数目统计、reads基因组比对率等)、基因表达定量。

2.  细胞过滤和数据标化

利用基因组比对结果以及表达量结果对测序检测到的细胞进行过滤,去除细胞中基因检测数少、线粒体基因占比大的细胞,统计过滤后的细胞数量并得到对应的表达量矩阵表。采用数据标准化方法对不同样本中细胞基因表达量进行标准化,得到标准化后的表达量矩阵表。



3.  单细胞亚群分类注释与分类结果可视化


心脏CD45+细胞的单细胞测序反映出20种免疫细胞类群的存在

Elisa Martini et al. Circulation(2019)

注:(B)通过二维的t-SNE,经过非监督的聚类后将17853个心脏CD45+细胞可视化并分成20个类群。每个点代表一个单细胞,不同特征的类群用颜色区分。

通过少数marker对细胞进行注释的方法存在主观误差,我司在这方面做了改进


4.  功能分析(GO Analysis)和信号通路分析(Pathway Analysis

以GO以及KEGG数据库,对Marker基因或组间差异基因进行功能分析和信号通路分析,从而得到这些基因群体所显著性富集的GO条目和Pathway条目。


XuemeiXie et al. Nat Immunol (2020)

注:不同处理状态下细胞差异基因显著富集的GO条目


5.  标记基因/差异基因筛选


Elisa Martini et al. Circulation(2019)

注:通过heatmap展示了20个不同细胞类群中表达差异最显著的基因。


6.  maker基因的表达分布


Dmitry Velmeshevetal.Science(2019)

注:(D)兴奋性神经元亚型marker基因在不同细胞类群中的表达分布;(E)中间神经元亚型marker基因在不同细胞类群中的表达分布



高级生物信息分析

1.拟时序分析

以细胞的表达量数据为研究对象,采用monocle等算法,对细胞进行拟时序分析,模拟重建细胞的动态变化过程,获得细胞间的状态转换关系,以及不同状态细胞间差异基因的表达情况。


XuemeiXie et al. Nat Immunol (2020)

注:细胞间状态转换的pesudotime轨迹图


2.RNA velocity分析

采用velocyto算法,预测单个细胞的变化方向,得到细胞间的转变过程。



XuemeiXie et al. Nat Immunol (2020)

注:该图为RNA velocity分析结果图,图中箭头方向代表算法预测的细胞演化方向

3.其它分析内容(结合数据的特定双方沟通决定)



参考文献:

[1] Elisa Martini et al. Single-Cell Sequencing of Mouse Heart Immune Infiltrate in Pressure Overload–Driven Heart Failure Reveals Extent of Immune ActivationCirculation. 2019;140:2089–2107

[2]Dmitry Velmeshev et al. Single-cell genomics identifies cell type–specific molecular changes in autism Science 364, 685–689 (2019)

[3]XuemeiXie et al.Single-cell transcriptome profiling reveals neutrophil heterogeneity in homeostasis and infectionNat Immunol. 2020 Sep; 21(9): 1119–1133.