时间点转录组分析



简介:该分析内容主要针对样本是多时间点(或者药物不同剂量)的实验产出的转录组数据。这类数据跟常规转录组数据的分析不一样的点主要体现在:1)随时间点或剂量变化而呈现一定基因表达变化趋势的基因群的识别;2)样本中是否存在转折的时间点或状态(比如药物的剂量)3)随时间点或剂量变化基因的调控网络


分析内容:以时间点的数据为例

1. 数据做归一化处理

目的是让数据在同一变化范围内。然后通过PCA等方法看是否有离群样本及样本间的递进关系



上图是PCA及样本聚类结果



2. 差异表达筛选

计算组间基因差异的pvalue值及差异的倍数,按一定的阈值筛选差异表达基因。由于是时间点的数据,同组数据比较的时候分别采取后面时间点对比前一个时间点,或者是后面的时间点对比0点



上图是差异基因数目统计结果


3. 差异表达基因功能注释

将所有的差异基因向GO分类或KEGG Pathway的节点映射,计算富集在该节点的差异基因的数目,并通过统计检验计算该节点富集度的P值。这步分析主要是为了看这些差异表达的基因主要参与的生物学功能或pathway。



4. 基因表达趋势分析

基因表达趋势就是根据基因表达量随时间点变化呈现一定的pattern。目前有多种方法可以实现这个目的,比如各种聚类方法以及WGCNA(Weighted correlation networkanalysis)。以WGCNA为例:



Hongmei Duan et al. PNAS(2015)
上图展示的是WGCNA识别的模块及特定模块对应基因表达的热图。

              基因表达趋势分析是时间点数据分析的关键所在,针对不同的数据需要选择不同的方法或多种方式结合。我司在这方面做了改进


5. 随时间点或剂量变化基因的调控网络


Ashwini PatilKenta Nakai,BMC Syst Biol(2014)

·         上图分别标注了对应时间点的基因及对应下游的基因




参考文献:

[1]Hongmei Duan et al. Transcriptome analyses reveal molecular mechanismsunderlying functional recovery after spinal cord injury PNAS October 27, 2015 112 (43) 13360-13365

[2] Ashwini PatilKenta Nakai. TimeXNet: identifying active gene sub-networks using time-course gene expression profiles BMC Syst Biol Dec 8,2014