简介:
WGCNA主要运用于在大样本基因表达数据,从中挖掘出具有相似表达谱的基因,接着将这些基因聚集在一起,并归于同一模块(module)中。该算法认为具有相同表达趋势的基因,在一些生物学功能上可能也有一定的相关性。然后通过模块特征值(module eigengene)或者hub gene对模块进行区分,接着计算模块与模块之间的相关性以及模块与样本性状之间的相关性,从而筛选有与性状高度相关的模型,并对模块中的基因进行分析,从而找到跟研究相关的模块及基因。
WGCNA demo
Genetic programs in human and mouse early embryos revealed by single-cell RNA sequencing
结果解读:
图a 是识别的基因模块及对应的树形图;图b 是特定模块内基因表达热图及模块内基因显著富集的信号通路;图c 是模块内基因表达变化的箱线图。
分析关键
1. 该算法有一定的适用条件,比如样本数量,样本间基因表达的变异度等
2. 是否有效的识别出一群生物学功能上相关的共表达基因集群
-END-