mRNA 测序分析



简介mRNA测序分析主要是指对高通量测序获得的编码基因的表达进行分析。主要目的是看这些编码基因表达的差异情况、差异基因参与的生物学功能及信号通路以及课题相关的特定分析内容。

分析内容

基础分析:

1. 测序质量评估与原始数据过滤,去除接头序列及低质量reads

2. 比对参考基因组或参考基因序列

3. 测序与比对评估(数据比对统计,测序饱和度分析,测序随机性分析)

4. 基因表达统计(基因覆盖度,表达量,表达量丰度分布)

5. 新基因的转录本预测及注释(需有参考基因组,限动植物)

6. 样本相关性分析(主成分分析(PCA)、相关性检验、样本聚类图)


高级分析:

7. 差异表达基因分析(两个或两个以上样品)

7.1 差异表达基因筛选

以特定的 pvalue 阈值和 foldchange倍数来筛选差异基因。

差异筛选时计算方式有几种可选,需要根据数据的特征进行选择

7.2 差异基因火山图

Yilong Miao etal. Cell Reports(2020)

注:火山图展示了年老个体卵母细胞与年轻个体卵母细胞相比的差异表达基因。蓝色为下调基因,红色为上调基因


7.3 差异基因表达模式聚类分析(热图)


Yilong Miao etal. Cell Reports(2020)

注:通过热图展示年轻个体、年老个体以及注射NMN年老个体卵母细胞的基因表达模式。




7.4 差异基因GO功能显著性富集分析


Yilong Miao etal. Cell Reports(2020)

注:(F)年老个体与年轻个体卵巢差异表达基因的功能富集分析;(G)注射NMN年老个体与年老个体卵巢差异表达基因的功能富集分析

GO富集的结果往往很多是重复的Term,也就是很多富集的GO Term 实际上是同一类生物学功能,我司在这方面做了改进。



7.5 差异基因Pathway显著性富集分析


Yilong Miao etal. Cell Reports(2020)


注:(D)年老个体与年轻个体卵巢差异表达基因的KEGG富集分析;(E)注射NMN年老个体与年老个体卵巢差异表达基因的KEGG富集分析


7.6 差异基因Reactome显著性富集分析(限部分物种)

7.7 差异基因DO显著性富集分析(限人)


图中显示按pvalue 从小到大排列Top20disease









7.8互作网络分析

从主流的蛋白蛋白互作数据库中筛选差异基因间的互作关系,并用cytoscape软件做网络图


                                                                              由于常规通过数据库筛选基因间的互作,存在一定比例的假阳性,通常获得的网络较为复杂,                                                                                            另外获得的hub 基因更多是些明星分子而不一定是我们实验实际相关的。我司在这方面做了改进。



7.9 GSEA分析(GO/KEGG/Reactome/DO

GSEA分析目的是为了判断基因集(比如某条pathway)的基因是随机分布于排序后的基因列表(L),还是聚集分布在L的顶部或者底部。





图中:红色代表EnrichScore>0 pathway,蓝色代表EnrichScore<0 pathway



8.基因可变剪切鉴定

可变剪切是指mRNA前体转录所产生的RNA的外显子以多种方式通过RNA剪切进行重连。由此产生的不同的mRNA可能被翻译成不同的蛋白质构体。



上图是各种可变剪切形式

                                                                                  差异可变剪切筛选时计算方式有几种可选,需要根据数据的特征进行选择


参考文献:

[1]Yilong Miao etal.Nicotinamide Mononucleotide Supplementation Reverses the Declining Quality of Maternally Aged Oocytes2020, Cell Reports 32, 107987