重复测量方差分析 (Repeated Measures ANOVA)
重复测量方差分析(Repeated Measures ANOVA)是一种统计方法,用于分析在相同实验单位上进行的多次观测之间的差异。该方法主要用于研究时间、条件或处理对实验单位的影响。重复测量方差分析可以考虑实验单位内的差异,并对此进行控制,以更准确地检测因素的作用。
使用场景:
研究某种干预或处理在不同时间点的效果。
比较多个实验条件下的实验单位表现。
研究时间与处理之间的交互作用。
例子1:临床上重复测量空腹血糖值,比较不同时间点血糖值的差异 在这个例子中,我们关注单一治疗组的患者在不同时间点的空腹血糖水平。例如,我们可以在开始治疗前、治疗后1个月、治疗后3个月和治疗后6个月测量空腹血糖值。通过使用重复测量方差分析,我们可以检测不同时间点空腹血糖值之间的差异,以便了解患者的血糖控制情况。
例子2:重复测量空腹血糖值,有三个治疗组,比较三组之间疗效的差异 在这个例子中,我们关注三个不同治疗组的患者在不同时间点的空腹血糖水平。例如,治疗组A接受药物1,治疗组B接受药物2,治疗组C接受药物3。我们可以在开始治疗前、治疗后1个月、治疗后3个月和治疗后6个月的时间点测量空腹血糖值。通过使用重复测量方差分析,我们可以检测三组之间的疗效差异(治疗组效应),不同时间点的血糖值差异(时间效应)以及时间与治疗组之间的交互作用。这有助于我们了解哪种药物对血糖控制的效果最好。
MSTATA 医学科研统计机器人提供了一站式的重复测量差分析步骤:
- 数据是否适合做重复测量方差分析:提供球形度检验、QQ图、方差齐性检验;
- 进行重复测量方差分析,设置重复测量单元和感兴趣的因子,可选交互作用或不选交互作用,设置要调整的协变量;
- 事后检验:对各水平亚组进行两两比较,可以调整多重比较的P值,可选Tukey法,Scheffe法,Bonferroni法和Holm法
- 计算效应量(effect size)
- 计算和比较各水平亚组的估计边际平均值(Estimated marginal means)和置信区间,生成统计表,绘制统计图
准备数据
首先务必按照下面的格式准备数据(网站上可下载,下载后在此基础上修改):
打开如下图:
Week.0, Week.6, Week.12, Week.24 是一组重复测量的数据,为基线、6周、12周、24周的血糖值。
treatment是代表治疗组别的变量,这里有三个组Treatment A,Treatment B 和Control组。需要把变量属性设置成factor
sex是性别,也是我们感兴趣的组别变量, 要设为factor
Age是需要调整的协变量,为连续性变量,要设为numeric
开始重复测量方差分析
设置重复测量单元:
本例中0~24周的血糖测量,一共四个变量,值都是血糖水平,变量名用了Week.X 这样易于理解的时间标签。
把这几个变量点选中,即可组合成一个重复测量单元,注意点选的顺序需要按照事情发生的顺序来选,不可打乱。
给重复测量单元敲入一个易于展示的名称,这里我们命名为 Times,表示时间或次数。另外给指标也起一个名字,这里我们敲入”血糖值”,这两个名称都会在后面生成的统计图表中出现:
选择代表感兴趣的组别的因子,这里我们选treatment和sex,如果菜单里没有,则返回去把你想要的组别变量设置为factor
选择交互作用,每点击一次”增加交互作用项”按钮,就可以增加一个交互作用项菜单,在菜单里选两个以上的变量,就能将其合成交互作用项。这个例子中我们不设置交互作用。如果选错了要修改,可以点击”重置清零”按钮。
选择不感兴趣,用来做调整的协变量:这里age可能对结局有影响,但不是我们研究感兴趣的研究变量,因此勾选用来做协变量调整。
使用条件判断:
这里可以勾选球形度检验和方差齐性检验等。
球形度检验结果如下:
球形度检验(Tests of Sphericity)是在重复测量方差分析(Repeated Measures ANOVA)中用来检验数据是否满足球形假设(sphericity assumption)的方法。球形假设要求各水平之间的协方差相等,即各水平之间的方差和协方差矩阵是球形的。违反球形假设会导致重复测量方差分析的结果失真。
Mauchly’s W、Greenhouse-Geisser ε和Huynh-Feldt ε是常用的球形度检验方法:
Mauchly’s W:Mauchly’s W检验是最常用的球形度检验方法。它检验了协方差矩阵是否与恒等矩阵的充分接近。如果Mauchly’s W检验的p值小于预定的显著性水平(如0.05),则拒绝球形假设,认为数据违反了球形假设。
Greenhouse-Geisser ε:Greenhouse-Geisser修正是一种用于调整自由度的方法,以弥补违反球形假设所带来的影响。在使用Greenhouse-Geisser ε修正之后,可以通过比较调整后的F值与F分布的临界值来判断球形度。Greenhouse-Geisser ε的值介于0和1之间,当ε趋近于1时,说明球形假设趋于成立;反之,趋近于0则违反球形假设。
Huynh-Feldt ε:Huynh-Feldt修正是另一种调整自由度的方法。与Greenhouse-Geisser修正相比,Huynh-Feldt修正在估计自由度时相对较宽松,因此在实际应用中可能存在假阳性风险。Huynh-Feldt ε的值介于0和1之间,同样地,当ε趋近于1时,说明球形假设趋于成立;反之,趋近于0则违反球形假设。
在重复测量方差分析中,如果球形度检验表明数据违反了球形假设,那么通常需要采用Greenhouse-Geisser或Huynh-Feldt修正来调整自由度,以减小估计偏差,从而得到更准确的统计推断。选择哪种修正方法取决于实际情况,通常情况下,Greenhouse-Geisser修正较为保守,而Huynh-Feldt修正较为宽松。
重复测量方差分析的选项
这里可以选择平方和(ss)的类型,默认选类型3;
在重复测量方差分析中,效应量(effect size)是一个反映因素对因变量的影响程度的指标。常用的效应量指标有η²G(总组间效应量,Eta-squared generalized)、η²(组间效应量,Eta-squared)、η²p(偏组间效应量,Partial Eta-squared)和ω²(总组内效应量,Omega-squared)。
η²G(总组间效应量,Eta-squared generalized):η²G是一个描述整个模型中组间差异(即因素对因变量的影响)与总差异(因素效应和误差效应的总和)之间比例的指标。η²G的值介于0和1之间,值越大表示组间差异越明显,因素对因变量的影响越大。
η²(组间效应量,Eta-squared):η²是一个描述某个特定因素对因变量的影响程度的指标。它反映了该因素产生的差异与总差异之间的比例。与η²G类似,η²的值介于0和1之间,值越大表示该因素对因变量的影响越大。
η²p(偏组间效应量,Partial Eta-squared):η²p是一个描述某个特定因素对因变量的影响程度的指标,与η²类似,但是它考虑了其他因素的影响。它反映了该因素产生的差异与总差异(包括该因素和其他因素的影响)之间的比例。η²p的值介于0和1之间,值越大表示该因素对因变量的影响越大,同时考虑了其他因素的影响。
ω²(总组内效应量,Omega-squared):ω²是一个描述整个模型中组内差异(即误差效应)与总差异(因素效应和误差效应的总和)之间比例的指标。ω²的值介于0和1之间,值越大表示组内差异越明显,误差效应对因变量的影响越大。
在重复测量方差分析中,Within Subjects Effects(组内效应)和Between Subjects Effects(组间效应)是两种不同类型的因素对因变量产生影响的方式。
Within Subjects Effects(组内效应):组内效应是指在同一实验单位内,在不同条件或时间点上的因变量值之间的差异。例如,在一个实验中,对同一组受试者在不同时间点进行测量,以研究某种干预措施的长期效果。
Between Subjects Effects(组间效应):组间效应是指在不同实验单位或组别之间的因变量值的差异。例如,在一个实验中,将受试者分为两个或多个组,每个组接受不同的干预措施,以研究不同干预措施之间的效果差异。
在重复测量方差分析的输出结果中,通常会看到以下统计量:
Sum of Squares(平方和):Sum of Squares是指因素效应、误差效应或总效应下,因变量值与其均值之差的平方和。它用于衡量因素、误差或总体中的变异性。
Mean Square(均方):Mean Square是平方和除以对应的自由度,即Sum of Squares的平均值。对于因素效应和误差效应,它们的均方分别用于计算F值。
F值(F统计量):F值是因素效应的均方与误差效应的均方之比。它用于检验因素对因变量的影响是否显著。F值越大,说明因素对因变量的影响越大,拒绝原假设(即认为因素对因变量有显著影响)的可能性越高。
P值(显著性水平):P值是在原假设成立的前提下,观察到当前或更极端F值的概率。通常情况下,如果P值小于预定的显著性水平(如0.05),则拒绝原假设,认为因素对因变量有显著影响。
在解释重复测量方差分析的结果时,需要分别关注Within Subjects Effects和Between Subjects Effects的F值和P值,以了解组内和组间因素对因变量的影响程度。同时,还需要关注效应量指标(如η²、η²p等),以了解因素对因变量的实际影响大小。
事后检验
重复测量方差分析的事后检验(post hoc tests)用于在方差分析结果显著的情况下,进一步确定哪些组别之间存在显著差异。事后检验分为重复测量变量之间的事后检验和其他分组因素的事后检验。
重复测量变量之间的事后检验:这种事后检验主要关注不同时间点或条件下因变量之间的差异。当重复测量方差分析的Within Subjects Effects显著时,可以通过这类事后检验来确定具体哪些时间点或条件之间存在显著差异。常用的事后检验方法包括Tukey法、Scheffe法、Bonferroni法和Holm法。这些方法通过调整显著性水平或P值,来控制多重比较带来的假阳性风险。
其他分组因素的事后检验:这种事后检验主要关注不同组别之间因变量的差异。当重复测量方差分析的Between Subjects Effects显著时,可以通过这类事后检验来确定具体哪些组别之间存在显著差异。同样可以采用Tukey法、Scheffe法、Bonferroni法和Holm法进行事后检验。
以下简要介绍这四种方法:
Tukey法(Tukey’s Honestly Significant Difference, Tukey’s HSD):Tukey法主要用于多组比较,可以在保证整体显著性水平的前提下,确定哪些组别之间存在显著差异。适用于组间样本量相等的情况。
Scheffe法(Scheffé’s method):Scheffe法适用于各种自由度的比较,包括两两比较和多重比较。它较为保守,适用于组间样本量不等的情况。
Bonferroni法(Bonferroni correction):Bonferroni法通过将原显著性水平除以比较次数来调整显著性水平,从而控制整体显著性水平。它是一种保守的方法,但在多重比较较多时可能过于保守。
Holm法(Holm-Bonferroni method):Holm法是对Bonferroni法的改进,它通过对P值进行排序和按顺序进行调整,以减轻Bonferroni法在多重比较较多时过于保守的问题。
在选择事后检验方法时,研究者需要权衡实际情况和对误差控制的需求,以得到准确的统计
这里我们选了不同时间点之间的比较,不同治疗组之间的比较,和不同性别之间的比较。
如果需要进一步交叉比较,例如每个治疗组中不同时间点比较,或者每个时间点中不同治疗组的比较,则应该在事后检验的菜单中选择中交互作用Times:Treatment进行事后检验。
估计边际平均值
重复测量方差分析中的Estimated Marginal Means(估计边际均值)是一种描述性统计量,用于表示在考虑所有其他因素的影响下,某一特定因素水平的平均因变量值。估计边际均值是通过将模型中的其他因素固定在它们的平均水平上,并计算给定因素水平的平均因变量值来获得的。
在重复测量方差分析中,可以对重复测量的时间点和其他分组因素分别单独进行估计边际均值的展示,也可以将这几个因素交互在同一个统计表中。这有助于更好地理解和展示因素水平对因变量的影响。
单独对时间点进行估计边际均值的展示:这种方法将展示不同时间点上因变量的估计边际均值,以及它们之间的差异。这有助于了解在不同时间点上因变量值的变化趋势。
单独对其他分组因素进行估计边际均值的展示:这种方法将展示不同分组因素水平上因变量的估计边际均值,以及它们之间的差异。这有助于了解不同分组因素水平对因变量的影响程度。
将重复测量时间点和其他分组因素交互在同一个统计表中:这种方法将展示不同时间点和分组因素水平组合下因变量的估计边际均值,以及它们之间的差异。这有助于了解时间点和分组因素之间的交互作用对因变量的影响。
在绘制统计图时,也可以采用类似的方式来展示估计边际均值。例如,可以绘制线图来展示不同时间点上的估计边际均值,或者绘制条形图来展示不同分组因素水平上的估计边际均值。对于交互作用的展示,可以在同一图中绘制多条曲线或多组柱状图,以展示不同时间点和分组因素水平组合下的估计边际均值。这将有助于更直观地了解因素水平对因变量的影响及其交互作用。
分别对各分组因素进行估计边际均值的展示:
把各因素交叉组合在同一张统计图表中:
下载报告
点击下载word文件即可