富集分析是一种广泛应用的组学统计方法,旨在识别在特定条件或类别下,某些特征(例如蛋白质)是否在样本中显著富集。通过深入挖掘组学数据集,帮助研究人员揭示潜在的生物学意义。在富集分析中,我们采用Fisher精确检验方法来评估待测功能集在差异蛋白中的富集显著性。这些功能集涵盖了多种类型,如Gene Ontology(GO)功能、KEGG通路、以及蛋白结构域(PFam Domain)等。富集分析的结果通常由两个关键指标来描述:富集程度(Fold enrichment)和富集显著性(p value)。当 p value<0.05 时认为该富集是具有统计学意义的。
注:显著富集KEGG通路气泡图。横轴代表经过log2转换的富集倍数;纵轴列出了不同的KEGG通路描述。图中的点代表各个KEGG通路。点的颜色越红,代表该通路的富集显著性越强。点越大,说明该通路中的差异蛋白越多。
注:显著富集蛋白结构域气泡图。横轴代表经log2转换的富集倍数;纵轴详细列出了各种蛋白结构域的描述。图中的每一个点都代表了一个特定的蛋白结构域。点的颜色越红表示该结构域中的差异蛋白富集越显著。点越大意味着该结构域中包含的差异蛋白越多,进一步强调了其在数据集中的重要性。
注:差异表达蛋白显著富集KEGG通路图。红色代表差异上调蛋白,蓝色代表差异下调蛋白。