富集分析
富集分析

富集分析是一种广泛应用的组学统计方法,旨在识别在特定条件或类别下,某些特征(例如蛋白质)是否在样本中显著富集。通过深入挖掘组学数据集,帮助研究人员揭示潜在的生物学意义。在富集分析中,我们采用Fisher精确检验方法来评估待测功能集在差异蛋白中的富集显著性。这些功能集涵盖了多种类型,如Gene Ontology(GO)功能、KEGG通路、以及蛋白结构域(PFam Domain)等。富集分析的结果通常由两个关键指标来描述:富集程度(Fold enrichment)和富集显著性(p value)。当 p value<0.05 时认为该富集是具有统计学意义的。

一、GO富集分析
基因本体(Gene Ontology,简称GO)是一个标准化的基因功能描述体系,包括分子功能(Molecular Function)、细胞组分(Cellular Component)和生物过程(Biological Process)三个方面。GO富集分析通过确定某一基因集是否在某一GO类别中显著富集,从而揭示这些基因在特定生物学过程中的潜在作用。
描述
注:显著富集GO功能气泡图。横轴代表经过log2转换的富集倍数;纵轴详细列出了不同的GO功能描述。图中的点代表了各个GO功能分类。这些点的颜色深浅反映了富集的显著性水平,颜色越红,意味着该GO功能分类中的差异蛋白富集越显著。此外,点的大小与GO功能分类中差异蛋白的数量直接相关,点越大,说明该功能分类中包含的差异蛋白越多。
描述

注:显著富集KEGG通路气泡图。横轴代表经过log2转换的富集倍数;纵轴列出了不同的KEGG通路描述。图中的点代表各个KEGG通路。点的颜色越红,代表该通路的富集显著性越强。点越大,说明该通路中的差异蛋白越多。


三、PFam结构域富集分析
PFam结构域(Domain)是蛋白质中具有特异结构和独立功能的区域,也是蛋白质结构、功能和进化的基本单位。通过结构域的富集分析,可以深入了解目标蛋白的生物学功能和进化历程,并从中筛选出具有潜在研究价值的结构域。这种分析有助于揭示蛋白质在细胞中的相互作用和调控机制,为药物研发和疾病治疗提供新的视角和策略。
描述

注:显著富集蛋白结构域气泡图。横轴代表经log2转换的富集倍数;纵轴详细列出了各种蛋白结构域的描述。图中的每一个点都代表了一个特定的蛋白结构域。点的颜色越红表示该结构域中的差异蛋白富集越显著。点越大意味着该结构域中包含的差异蛋白越多,进一步强调了其在数据集中的重要性。














注:差异表达蛋白显著富集KEGG通路图。红色代表差异上调蛋白,蓝色代表差异下调蛋白。



描述
KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析是用于分析基因或蛋白在KEGG通路中的富集情况的一种常见的生物信息学分析方法。其中,KEGG Pathway可以用来反映分子间相互作用、反应及关系网络,主要包含代谢(Metabolism)、遗传信息处理(Genetic Information Processing)、环境信息处理(Environmental Information Processing)、细胞过程(Cellular Processes)、有机系统(Organismal Systems)、人类疾病(Human Diseases)、药物开发(Drug Development)七个方面的内容。
二、KEGG通路富集分析