重复性分析
重复性分析

对于生物重复或技术重复样本,需要检验其定量结果是否符合统计学上的一致性。相对标准差(Relative Standard Deviation,RSD)、主成分分析(Principal Component Analysis,PCA)、皮尔森相关性(Pearson Correlation Coefficient,PCC)这三种统计分析方法常用来评估样本的重复性。

一、相对标准差分析
相对标准差(RSD)也被称为变异系数(Coefficient of Variation,CV)是衡量数据离散程度的一个标准,适用于评估重复测量的一致性。较低的RSD值意味着重复样本间的定量结果波动小,即重复性良好;而较高的RSD值则可能指示实验操作的不稳定、仪器误差或生物样本本身的异质性较大。
描述
注:RSD箱线图。该图用以展示重复样本间蛋白质或修饰位点定量结果的相对标准偏差(CV)分布情况。横轴代表不同的样本分组,纵轴则代表在多次重复测定中,蛋白质或修饰位点定量CV值。箱线图部分提供了关于CV值分布的五数概要(最小值、第一四分位数、中位数、第三四分位数和最大值),有助于快速识别数据的中心趋势、离散程度和异常值。
主成分分析(PCA)是一种降维技术,通过识别数据中的主要变异方向(即主成分),将复杂的多维数据简化为少数几个关键变量。在重复样本的评估中,PCA能够帮助我们识别样本间的群体结构,以及哪些变量(可能是特定的蛋白质或修饰位点)对样本间的差异贡献最大。PCA图上的样本点分布紧密程度,反映了重复样本间的一致性水平。
二、主成分分析
描述

注:主成分分析(PCA)散点图。图中各样本点间的距离是衡量它们相关性紧密程度的一个指标,距离越近意味着样本间的相似度越高,相反,距离越远则显示出样本间的差异性越大。横坐标与纵坐标分别对应于PCA分析中最重要的两个主成分,这两个主成分对整体数据集信息的解释能力越强,其对应的坐标轴数值便越大。

三、相关性分析
皮尔森相关性系数(PCC)通过计算两组数据之间的线性关系强度,直观反映了重复样本间定量数据的相似程度。当PCC值接近1时,表明样本间高度正相关,即定量结果一致性高;反之,接近0的值则暗示样本间关联性弱,可能存在较大的实验误差或生物变异。
描述

注:两两样品间蛋白质定量的皮尔森相关系数热图。皮尔森相关系数是衡量两组数据线性相关程度的一个指标,用于评估样本间的相关性关系。当相关系数值越趋近于1时,表示两组样本之间的相关性越强;反之,若相关系数值越接近0,则意味着两组样本之间的关联性越弱,趋向于相互独立。