以下内容转载自李东同撰写的《医用咖啡俱乐部》微信官方账号(medieco-ykh)。
在前一期中,我们讨论了单向方差分析。在本期中,我们将讨论双向方差分析。
问题和数据
一位研究者已经知道,受教育程度可以影响政治兴趣,也就是说,如果受试者的受教育程度分为三个等级(学校、学院和大学),他们对政治的兴趣会随着受教育程度的提高而增加。
研究者打算进一步分析受试者的教育程度和政治兴趣之间的相关性是否受到性别的影响。他计划招募60名受试者,包括30名男性和30名女性。在每个性别中,科目的教育水平分为“学校”、“学院”和“大学”三类,每类10人。
研究人员使用问卷来测量受试者的政治兴趣。受试者的分数从0到100不等。分数越高,政治兴趣越强。
最后,收集了诸如政治兴趣、性别和教育水平等可变信息。一些数据如下:
图中提示“大学”文化程度的女性群体中存在离群值,第57位(排数)科目政治兴趣非常低,应考虑调整或剔除离群值。
有离群点怎么办?
如果不想或者不能剔除离群点,可以保留。可以采用以下四种方法:
(1)选择更稳健的双因素方差模型;
(2)调整异常值,如用第二大极值代替异常值;
(3)对自变量进行数据转换;
(4)确认离群值的存在不会影响结果。例如,分别运行有异常值和无异常值的模型。如果结果没有差异,可以保留异常值。
当然也可以直接剔除离群值,但这往往是不得已而为之。因为我们分析数据是为了根据样本结果推断出整个种群,直接剔除离群值就相当于没有考虑到这些人的信息,忽略了他们在整个种群中的作用。
如果一定要剔除离群值,就要在报告中描述被剔除者的信息(数据和对研究结果的影响)。这样,读者就可以清楚地了解我们拒绝离群值的原因以及这些离群值可能带来的影响,消除人们对研究结果的疑虑。
3.2.3假设5:任何分类中的残差近似为正态分布
在这项研究中,夏皮罗-维尔克被用来检验数据的正态性。看了前面几栏的内容,应该知道检验数据正态性的方法有很多。本研究之所以采用夏皮罗-维尔克检验,是因为各组样本量较小,夏皮罗-维尔克检验主要适用于此类小样本的正态性检验(样本量
SPSS输出夏皮罗-维尔克检验结果如下:
一般来说,如果夏皮罗-维尔克检验的P值小于0.05,我们认为数据不符合正态分布。从上表可以看出,本研究各组的P值大于0.05,即任何分类中的残差都是近似正态分布,满足假设5。
残差不接近正态分布怎么办?
我们可以采用以下四种方法:
(1)转换数据;
(2)由于ANOVA对假设5不是很敏感,即使残差不接近正态分布,也可以尝试采用双因素方差模型。
(3)检验模型的结果。因为没有可以替代双因素方差分析的非参数检验方法,只能对比数据转换前后的模型,判断直接采用双因素方差分析是否合理;
(4)选择更稳健的双因素方差模型。
3.2.4假设6:任何分类都有相等的方差
双因素方差分析的基本假设是任何分类都有相等的方差,可以通过Levene方差齐性检验来完成。
通过3.2.1的运算,SPSS的输出结果如下:
一般来说,如果Levene方差齐性检验的P值大于0.05,我们认为数据符合等方差。从上表可以看出,本研究的Levene方差齐性检验的P值为0.061,大于0.05,即任何分类都具有相等的方差,满足假设6。
方差不均匀怎么办?
我们可以采用以下四种方法:
(1)转换数据;
(2)如果各组样本量一致且正态,最大方差组与最小方差组之比小于3,那么我们认为即使方差不均匀,也可以尝试采用双因素方差模型;
(3)选择更稳健的模型,比如一般的线性模型;
(4)加权最小二乘法回归方程。
3.2.5数据整合
在解释结果之前,让我们将数据合并如下:
(1)单击数据→分割文件
出现下图:
(2)单击分析所有案例,不要创建组
(3)单击确定
结果说明
在解释双因素方差分析的结果之前,我们需要对以下内容进行分类,然后根据分类采用不同的解释方法:
(1)如果自变量之间没有交互作用,进行主效应分析;
(2)如果自变量之间存在交互作用,对主效应和交互作用做一个简单的对比分析。
4.1结果的判断
4.1.1确定是否有相互作用
双因素方差分析的出发点之一是判断自变量之间是否存在交互作用,如本研究中的性别和教育水平变量。在统计检验之前,我们可以通过图表了解自变量之间的相互作用,如下例所示:
一般来说,如果两条直线平行或者即使X轴伸长也不相交,就可以初步判断自变量之间不存在交互作用。但如果两条线相交或延伸X轴后可能相交,我们认为自变量之间可能存在交互作用。
在本研究中,SPSS输出结果如下:
这两个数字都表明,在这项研究中,教育水平和性别可能对政治兴趣的影响产生相互作用。左上图比较直观,我们就以左上图为例介绍一下。
具体来说,男女双方的政治利益随着受教育程度的提高而增加,尤其是当受教育程度达到“大学”的水平时。但是,男女的增长趋势是不同的。
在“学校”和“学院”受教育时,男性的政治兴趣低于女性。但当男性的教育水平达到“大学”时,他们的政治利益高于女性。可以看出,在提高教育和增加政治兴趣的过程中,男性受益大于女性。
虽然上图可以提供自变量之间相互作用的直观结果,但我们不确定这些样本结果是否能代表整体,即图形结果是否会受到采样误差的影响。所以还是要根据统计检验来判断。SPSS输出测试结果如下:
表中每个索引的含义如下:
结果表明,本研究中的交互项目具有统计学意义,f (2,52) = 7.315,P = 0.002,部分η2=0.220,说明性别和教育水平对政治兴趣有交互作用。如果p >: 0.05,说明交互项没有统计学意义,两个自变量之间没有交互作用。
4.1.2有互动时,
如果自变量之间存在交互作用,则需要分别考虑自变量的简单主效应。但在此之前,我们需要区分有序相互作用和有序相互作用。
其中,序列内相互作用是指相互作用没有重叠或交叉,序列外相互作用是指相互作用有重叠或交叉,如下例所示:
在这项研究中,性别和教育水平之间有不同的相互作用。后面会详细介绍。
4.1.3当没有交互时,
如果没有交互作用,不同自变量的简单主效应是一致的,可以直接讨论主效应。一些研究人员还质疑是否有必要将交互项目保留在模型中,因为交互项目在统计上没有意义。考虑到研究样本推断群体的可信度,我们还是建议保留双因素方差模型中的交互项,供大家参考。
4.2简单的主要效果
4.2.1 SPSS操作简单主要效果
(1)点击分析→通用线性模型→统一
出现下图:
(2)点击【保存】,弹出下图:
(3)删除预测值中的非标准点击,并删除残差中的非标准和学生化点击
(4)点击继续→粘贴,弹出IBM SPSS统计语法编辑器界面
在/emmens = tables(性别*教育程度)后输入COMPARE(性别)ADJ(BONFERRONI),如下所示:
说明:COMPARE(gender)指根据性别变量提供简单的主效应结果;ADJ(BONFERRONI)指多个组之间的比较和BONFERRONI对结果的调整。如果不需要多次比较,也可以去掉这个语法。
(6)复制该声明,并将COMPARE(性别)更改为COMPARE(教育水平)
说明:COMPARE(education_level)是指根据education_level变量提供简单的主要效果结果。
(7)单击运行→全部
4.2.2简单主效应的解释
两类变量的简单主效应比多类变量更容易解释,所以我们从性别变量的简单主效应开始:
性别的简单主效应性别简单的主要作用就是分析性别在不同教育层次中的作用。我们首先从下图中得到一些直观的理解:
从图中可以看出,不同教育程度下,不同性别对政治利益的影响不同,统计结果如下:
以“大学”教育中不同性别政治兴趣的简单主效应为例,如下图黄色部分所示:
表中每个索引的含义如下:
结果表明,f (2,52) = 12.94,P = 0.001,偏η2=0.199,表明不同性别对“大学”教育中政治兴趣的简单主效应不同,差异具有统计学意义。
成对比较表提示这组数据的平均比较结果,如下所示:
从表中可以看出,“大学”教育中不同性别的政治利益是不同的,差异有统计学意义(P=0.001),这与统一测试的结果一致。如果想知道“大学”教育中不同性别的具体政治兴趣分数,需要画一个统计描述表,如下:
该表显示,男性对“大学”学位的政治兴趣为64.1±3.07,女性为58.0±6.46。通过综合上述三个表的结果,即品种测试、成对比较和迪夫统计,我们可以得到不同性别对“大学”教育中政治兴趣的简单主要影响的综合分析。其他教育中简单的性别主效应的分析方法是类似的,这里就不赘述了。
受教育程度的简单主效应教育水平的简单主要作用是分析不同性别下不同教育水平的作用。我们首先从下图中得到一些直观的理解:
从图中可以看出,不同性别下,不同教育程度对政治利益的影响不同,统计结果如下:
以女性受教育程度不同对政治兴趣的简单主要影响为例,如下:
表中每个索引的含义如下:
结果表明,f (2,52) = 62.96,p
成对比较表提示这组数据的平均比较结果,如下所示:
受教育程度是一个三分类变量,多次比较需要成对比较不同的受教育程度,可分为以下三种情况:
(1)“学校”vs“学院”
(2)“学校”vs“大学”
(3)“学院”vs“大学”
我们以女性中“学院”和“学校”的平均比较为例,如下:
从表中可以看出,“学校”和“学院”的政治利益在女性中是不同的,差异有统计学意义(P=0.014),这与统一测试的结果一致。
如果想知道女性“学校”和“学院”的具体政治兴趣分数,需要画一个统计描述表,如下:
表格显示,女性“学校”学历政治兴趣为39.6±3.27,女性“学院”学历政治兴趣为44.6±3.27。通过综合上述三个表的结果,即品种测试、成对比较和迪夫统计,我们可以全面分析妇女不同教育水平对政治兴趣的简单主要影响。男性受教育程度不同的简单主效应的分析方法是相似的,这里就不赘述了。
4.3主要效果
4.3.1 SPSS操作的主要效果
(1)在主界面点击分析→通用线性模型→统一
出现下图:
(2)单击选项
(3)在“显示方式”栏中输入性别和教育程度,激活“比较主要效果”,并在置信区间调整中选择“Bonferroni”选项
(4)点击继续→临时发布,弹出下图:
(5)将性别和教育水平放入“特定测试后”列,激活“假设相等差异”,然后单击“邦费罗尼和图基”
(6)单击继续→确定
4.3.2主要效果的说明
在解释主要效果之前,我们需要区分平衡设计和不平衡设计。如果在双因素方差分析中各组的样本量不同,那么研究就是一个不平衡的设计;如果每组样本量相同,就是均衡设计。
在实际工作中,即使设计在研究时是平衡的,但在研究结束时也可能变得不平衡。往往由于失访或拒绝随访,每组的最终样本量是不一样的。例如,在研究设计中,本研究计划在每个类别中招募10名受试者,共60名受试者。但最终有的组收集了10例数据,有的组只收集了9例,成为不平衡设计。
其实平衡设计和非平衡设计的区别在于,非平衡设计中的自变量和因变量变异之间可能存在“重叠”,导致对因变量变异的过度解读。
在不平衡设计中,我们还需要选择计算加权边际均值还是不加权边际均值。两者的区别在于加权边际均值考虑了每组样本大小的不同,但之前的研究一般都推荐使用未加权边际均值,本研究也是如此。
那么对于不同的双因素方差模型,应该如何解释主要的效应结果呢?
(1)如果是平衡设计,我们用SPSS输出单变量的分析结果:对观察均值进行事后的多重比较;
(2)如果是非平衡设计,需要计算加权边际均值,则阅读设计统计和多重比较的结果;
(3)如果设计是不平衡的,并且要计算未加权的边际平均值,我们阅读估计和成对比较的结果如下:
在本研究中,我们采用非平衡设计,并打算计算未加权的边际均值,因此我们通过SPSS输出的估计表获得未加权的均值,并通过成对比较表获得多个比较结果。估算表的结果如下:
从表中的均值栏,我们可以得到未加权的边际均值,即本研究中“学校”、“学院”和“大学”的未加权边际均值分别为38.52、43.77和61.05。
同时,我们还可以与设计统计表中的加权边际平均值进行比较,如下所示:
根据Deive统计表,“学校”、“学院”和“大学”的加权边际均值分别为38.57、43.81和61.05。可以看出,加权边际均值和未加权边际均值并不完全相同。事实上,只有在平衡设计中,加权边际均值和未加权边际均值才会完全相等。在其他情况下,这两个指标是不同的。
性别的主效应结果性别的主要作用是指性别在政治利益中的作用,而忽略了不同教育水平的影响。性别主要影响的未加权边际平均值计算如下:
从图中可以看出,当忽略教育水平时,男女的边际平均数分别为48.16和47.40。可以推测,男性的政治利益比女性更强烈。但是我们仍然需要进行统计测试,如下所示:
统计检验结果表明,P=0.448,大于0.05,即不同性别之间的主要效应没有显著差异。鉴于主要效应的差异不显著,我们不需要进一步讨论事后分析的结果。
受教育程度的主效应结果受教育程度的主要影响是指受教育程度对政治兴趣的影响,而忽略了不同性别的影响。与性别一样,教育水平主要影响的未加权边际均值的计算方法如下:
从图中可以看出,“学校”教育的边际均值为38.52,“学院”教育的边际均值为43.77,“大学”教育的边际均值为61.05。SPSS输出的估算表还显示了与手工计算结果一致的结果,如下所示:
根据这个结果,我们可以推测,受教育程度越高,政治兴趣越强。然而,这种推测需要进行统计检验,如下所示:
统计检验结果表明
受教育程度是一个三分类变量,多次比较需要成对比较不同的受教育程度,可分为以下三种情况:
(1)“学校”vs“学院”
(2)“学校”vs“大学”
(3)“学院”vs“大学”
我们以“学院”和“学校”的边际均值比较为例,如下图黄色所示:
从表中可以看出,“学校”和“学院”文化程度的受试者政治利益不同,即“学院”的政治利益得分比“学院”高5.25分(95% CI为2.20-8.30),差异有统计学意义(P
综合上述三个表的结果,可以得到不同教育水平对政治兴趣的主要影响的综合分析:受试者间影响测试、成对比较和估计。
4.4交互对比
4.4.1 SPSS操作的交互控制
(1)在主菜单中点击分析→一般线性模型→统一
出现下图:
(2)点击【粘贴】,弹出下图
(3)输入/打印=ETASQ同质性设计
/LMATTRIX =性别*教育_ 0 1-1 0-1 1级
说明:在/l矩阵中的“0 1-1 0-1 1”=性别*受教育程度_ 01-10-11分别对应于用来计算学校男性、大学男性、大学男性、学校女性、大学女性和大学女性政治利益指标差异的比较组。
其中“0”组不参与比较,“1”组作为参照组。在这个例子中,是“大学男”和“大学女”组合与“大学男”和“大学女”组合的比较。也可以根据实际情况调整比较组,只要加起来是0。
(4)单击运行→全部
4.4.2交互控制结果的解释
SPSS将本研究的交互控制分析结果输出如下:
上表中的“L1”是指针与第一组交互的对比分析。一般来说,当研究中只有一个交互项目时,这个指标可以忽略(比如这个研究)。当研究中有多个交互项目时,这个指标可以提醒研究者每组结果对应的变量。
在“对比度估计”列中,您可以查看交互控件的实际值,即差值的差值:
本研究中交互控制的实际值为-7.756。这个值是怎么算出来的?
在“大专”条件下,男女政治兴趣分之差为44.60-42.94 =-1.66;在“大学”条件下,男女政治兴趣分数的差异为64.10-58.00 = 6.10。
本研究中交互控制的实际值是这些项目的差异,即-1.66–6.10 =-7.756,这代表了受过大学教育的男性和女性的政治利益得分之间的差异。
“Sig”列提示该指标的统计检验结果,如下所示:
P=0.002,提示差值与0的差异有统计学意义。95%置信区间值如下:
从“差异的95%会议间隔”一栏可以看出,差异值的95%置信区间为-2.877至-12.634。综上,我们认为本研究的差值为-7.756(95%CI为-2.877至-12.634),P=0.002。
写结论
5.1当自变量之间存在交互作用时,采用简单主效应和配对比较分析
双因素方差分析用于分析性别和教育水平对政治兴趣的影响。除非另有说明,在本研究中,平均标准差用于反映数据,箱线图用于检验异常值,夏皮罗-维尔克用于检验数据的正态性,勒文方差齐性检验用于判断等方差。
结果表明,本研究数据不存在异常值,残差接近正态分布(P > 0.05);0.05),方差相等(P=0.061)。
本研究中,性别和教育程度对政治兴趣的影响存在交互作用,f (2,52) = 7.315,P=0.002,偏η2=0.220。简单的主效应分析表明,不同性别的受试者在不同教育水平下的政治利益是不同的:男性f (2,52) = 62.96,P
成对比较用于分析每个类别的简单主要效果结果。受教育程度为“学校”、“学院”和“大学”的女性政治兴趣平均得分分别为39.60±3.27、44.60±3.27和58.00±6.46。
其中,“学校”教育的女性政治兴趣得分比“大学”教育低5.00(95% CI为0.81-9.20),P = 0.014比“大学”低18.40(95%置信区间14.21-22.60),p
受教育程度为“学校”、“学院”和“大学”的男性的平均政治兴趣得分分别为37.44±2.51、42.94±2.34和64.10±3.07。
其中,“学校”学历男性政治兴趣得分比“大学”学历低5.50分(95% CI为1.08-9.92),P = 0.010比“大学”低26.66(95%可信区间为22.35-30.97),P
5.2当自变量之间存在交互作用时,采用交互控制分析
双因素方差分析用于分析性别和教育水平对政治兴趣的影响。除非另有说明,在本研究中,平均标准差用于反映数据,箱线图用于检验异常值,夏皮罗-维尔克用于检验数据的正态性,勒文方差齐性检验用于判断等方差。结果表明,本研究数据不存在异常值,残差接近正态分布(P > 0.05);0.05),方差相等(P=0.061)。
本研究中,性别和教育程度对政治兴趣的影响存在交互作用,f (2,52) = 7.315,P=0.002,偏η2=0.220。互动比较分析表明,受过大学教育的男性的政治兴趣得分比受过大学教育的女性低1.66分。然而,受过“大学”教育的男性的政治兴趣得分比受过“大学”教育的女性高6.10分。差异为-7.756(95%置信区间:-2.877至-12.634),P=0.002。
5.3当自变量之间没有交互作用时,采用主效应和配对比较分析
双因素方差分析用于分析性别和教育水平对政治兴趣的影响。除非另有说明,在本研究中,平均标准差用于反映数据,箱线图用于检验异常值,夏皮罗-维尔克用于检验数据的正态性,勒文方差齐性检验用于判断等方差。结果表明,本研究数据不存在异常值,残差接近正态分布(P > 0.05);0.05),方差相等(P=0.061)。
本研究中,性别和教育程度对政治兴趣没有交互作用,f (2,52) = 1.108,P=0.092,偏η2=0.020。主效应分析表明,受教育程度对政治兴趣的影响具有统计学意义,f (2,52) = 189.414,p
通过配对比较,分析了教育水平的主要影响结果。“学校”、“学院”和“大学”受试者政治兴趣得分的未加权边际均值分别为38.52±0.871、43.77±0.871和61.05±0.848。
其中,“大专”学历的政治兴趣分比“学校”学历高5.25分(95% CI为2.20-8.30),P
1.《双因素方差分析 【科研加油站】SPSS操作之双因素方差分析》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《双因素方差分析 【科研加油站】SPSS操作之双因素方差分析》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/shehui/1293058.html