精品用SPSS进行单因素方差分析和多重比较.docx
- 文档编号:27520292
- 上传时间:2023-07-02
- 格式:DOCX
- 页数:14
- 大小:113.65KB
精品用SPSS进行单因素方差分析和多重比较.docx
《精品用SPSS进行单因素方差分析和多重比较.docx》由会员分享,可在线阅读,更多相关《精品用SPSS进行单因素方差分析和多重比较.docx(14页珍藏版)》请在冰豆网上搜索。
精品用SPSS进行单因素方差分析和多重比较
方差分析
方差分析可以用来检验来多个均值之间差异的显著性,可以看成是两样本t检验的扩展。
统计学原理中涉及的方差分析主要包括单因素方差分析、两因素无交互作用的方差分析和两因素有交互作用的方差分析三种情况。
虽然Excel可以进行这三种类型的方差分析,但对数据有一些限制条件,例如不能有缺失值,在两因素方差分析中各个处理要有相等的重复次数等;功能上也有一些不足,例如不能进行多重比较。
而在方差分析方面SPSS的功能特别强大,很多输出结果已经超出了统计学原理的范围。
用SPSS检验数据分布的正态性
方差分析需要以下三个假设条件:
(1)、在各个总体中因变量都服从正态分布;
(2)、在各个总体中因变量的方差都相等;(3)、各个观测值之间是相互独立的。
在SPSS中我们很方便地对前两个条件进行假设检验。
同方差性检验一般与方差分析一起进行,这一小节我们只讨论正态性的检验问题。
[例7.4] 检验生兴趣对考试成绩的影响的例子中各组数据的正态性。
在SPSS中输入数据(或打开数据文件),选择Analyze→DescriptiveStatistics→Explore,在Explore对话框中将统计成绩作为因变量,兴趣作为分类变量(Fator),单击Plots按钮,选中“Histogram”复选框和“NormalityplotswithTest”,单击“Continue”按钮,在单击主对话框中的“OK”,可以得到分类别的描述统计信息。
从数据的茎叶图、直方图和箱线图都可以对数据分布的正态性做出判断,由于这些内容前面已经做过讲解,这里就不再进一步说明了。
图7-2用Expore过程进行正态性检验
top↑
输出结果中的Q-Q图是观察数据分布正态性的一种常用图形。
这类图形大致是这样绘制的:
计算数据在样本中对应的经验分布函数值(类似于累积分布的函数值,取值在0-1之间);然后计算标准正态分布(或者均值、方差相同的正态分布)对应于经验分布函数值的分位数。
以实际值为横坐标,正态分布的分位数为纵坐标作散点图,如果图形中的点大致在一条直线上则说明数据服从正态分布。
图7-3是不太喜欢统计学的学生统计成绩的Q-Q图,从图中可以判断数据并没有严重背离正态分布。
图7-3Q-Q图
表7-8是对数据进行正态性检验的结果。
SPSS中采用的是Kolmogorov-Smirnov检验和Shapiro-Wilk检验。
这两种检验方法都属于非参数统计的内容,统计量的计算方法可以参考有关书籍。
我们可以根据软件给出的p-值对数据是否服从正态分布进行检验:
由于表7-8中的p-值都大于0.05,因而我们不能拒绝零假设,也就是说没有证据表明各组的数据不服从正态分布(检验中的零假设是数据服从正态分布)。
表7-8 正态性检验的结果
兴趣
Kolmogorov-Smirnova
Shapiro-Wilk
Statistic
df
Sig.
Statistic
df
Sig.
统计
成绩
1 很不喜欢
.223
4
.
.948
4
.704
2 不太喜欢
.194
9
.200*
.924
9
.425
3 无所谓
.244
7
.200*
.845
7
.110
4 比较喜欢
.191
8
.200*
.925
8
.474
5 非常喜欢
.207
7
.200*
.901
7
.335
* Thisisalowerboundofthetruesignificance.
a LillieforsSignificanceCorrection
top↑
用SPSS进行单因素方差分析和多重比较
SPSS的One-WayANOVA过程可以进行单因素方差分析和均值的多重比较。
[例7.5] 对不同兴趣的学生的统计成绩进行多重比较。
单击Analyze→mpareMeans→One-WayANOVA,在对话框中将变量“统计成绩”选入DependentList框,将变量“兴趣”移入Factor栏,如图7-4。
单击对话框中的“Options”按钮,在弹出的对话框中选中“Discriptive(描述统计)”、“Homogeneityofvariancetest(同方差检验”和“Meansplot(均值的图形)”复选框(图7-5)。
单击主对话框中的“PostHoc(事后多重比较)”,选中“LSD(最小显著差异方法)”复选框。
单击主对话框中的“OK”按钮,就可以得到相应的分析结果了。
图7-4单因素方差分析对话框
图7-5单因素方差分析的选项设定
在SPSS的输出结果中,表7-9是对同方差性的检验。
SPSS采用的是Levene检验,这是一种非参数检验方法,与F检验类似,但不依赖于正态性假设,比F检验更稳健。
从检验结果看,在5%的显著性水平下不能认为个总体的方差不相等。
表7-9同方差性检验
LeveneStatistic
df1
df2
Sig.
2.112
4
30
.104
top↑
表7-10是SPSS生成的方差分析表,与Excel的计算结果完全一致。
表7-11是用LSD法进行多重比较的结果。
在表-11中的均值差(MeanDifference)一栏中加有星号的值是在5%的显著性水平下显著不等于零的值。
例如,很不喜欢统计学的学生的考试成绩与不太喜欢的学生的平均成绩相差19.083分,这一差异在5%的显著性水平下是显著的。
在加有星号的行中,相应的置信区间没有包含“0”值。
表7-10 SPSS输出的方差分析表
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
1658.832
4
414.708
3.316
.023
WithinGroups
3751.911
30
125.064
Total
5410.743
34
表7-11 LSD法多重比较的结果
(I)兴趣 (J)兴趣
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
1 很不喜欢
2 不太喜欢
-19.083*
6.720
.008
-32.81
-5.36
3 无所谓
-12.464
7.009
.086
-26.78
1.85
4 比较喜欢
-17.875*
6.848
.014
-31.86
-3.89
5 非常喜欢
-23.893*
7.009
.002
-38.21
-9.58
2 不太喜欢
1 很不喜欢
19.083*
6.720
.008
5.36
32.81
3 无所谓
6.619
5.636
.249
-4.89
18.13
4 比较喜欢
1.208
5.434
.826
-9.89
12.31
5 非常喜欢
-4.810
5.636
.400
-16.32
6.70
3 无所谓
1 很不喜欢
12.464
7.009
.086
-1.85
26.78
2 不太喜欢
-6.619
5.636
.249
-18.13
4.89
4 比较喜欢
-5.411
5.788
.357
-17.23
6.41
5 非常喜欢
-11.429
5.978
.065
-23.64
.78
4 比较喜欢
1 很不喜欢
17.875*
6.848
.014
3.89
31.86
2 不太喜欢
-1.208
5.434
.826
-12.31
9.89
3 无所谓
5.411
5.788
.357
-6.41
17.23
5 非常喜欢
-6.018
5.788
.307
-17.84
5.80
5 非常喜欢
1 很不喜欢
23.893*
7.009
.002
9.58
38.21
2 不太喜欢
4.810
5.636
.400
-6.70
16.32
3 无所谓
11.429
5.978
.065
-.78
23.64
4 比较喜欢
6.018
5.788
.307
-5.80
17.84
* Themeandifferenceissignificantatthe.05level.
图7-6是以因素水平为横轴,以各组平均考试成绩为纵轴绘制的散点图可看出各组均数的分布状况。
从图中可以看出,总体来说学生的学习兴趣越大平均考试成绩越好,但“不太喜欢”统计学的一组是个例外。
图7-6不同学习兴趣学生的平均考试成绩
top↑
用SPSS进行双因素方差分析
SPSS的GeneralLinearModel中的Univariate过程可以用来进行单因素或多因素方差分析,检验不同因素以及因素之间的交互作用对均值的影响是否显著。
[例7.6] 7.1.3小节的数据为例在SPSS中进行双因素无交互作用的方差分析。
要用SPSS处理表7-6的数据需要先将数据整理成列表的形式(表7-12)。
在SPSS中建立数据表以后,选择Analyze→GeneralLinearModel→Univariate,在主对话框中将“收入”放入DependentVariable矩形框,将“地区”和“险种”放入FixedFactor(s)矩形框中(图7-7)。
表7-12 SPSS需要的数据格式
编号
险种
地区
收入
编号
险种
地区
收入
1
1
1
39.3
19
2
3
40.2
2
1
1
37.7
20
2
3
41.1
3
1
1
40.6
21
2
3
40.9
4
1
2
41.6
22
2
4
38.9
5
1
2
42.7
23
2
4
38.1
6
1
2
38.9
24
2
4
39.2
7
1
3
38.8
25
3
1
40.6
8
1
3
37.2
26
3
1
39.8
9
1
3
39.1
27
3
1
41.3
10
1
4
42.9
28
3
2
40.3
11
1
4
39.3
29
3
2
38.8
12
1
4
40.5
30
3
2
39.6
13
2
1
41.5
31
3
3
37.2
14
2
1
39.7
32
3
3
38.4
15
2
1
38.4
33
3
3
37
16
2
2
38.4
34
3
4
43.6
17
2
2
37.7
35
3
4
42.1
18
2
2
40.1
36
3
4
44.5
图7-7 Univariate主对话框
在主对话框中点击Model按钮进入Model对话框,选择Custom,在效应下拉框中选择Maineffect,把“险种”和“地区”变量选入右边的模型框中,单击Continue返回主对话框(图7-8)。
其它选项采用默认值,单击主对话框中的“OK”按钮,可以得到无交互作用的双因素方差分析结果,分析结果见表7-13。
这一模型在Excel中是不能直接分析的。
图7-8 Univariate过程的模型定义对话框
top↑
表7-13SPSS输出的有重复双因素、无交互作用的方差分析表
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
24.002(a)
5
4.800
1.547
.205
Intercept
57280.444
1
57280.444
18463.004
.000
险种
3.376
2
1.688
.544
.586
地区
20.627
3
6.876
2.216
.107
Error
93.073
30
3.102
Total
57397.520
36
CorrectedTotal
117.076
35
根据表7-13的分析结果,在无交互作用的双因素方差分析模型中,险种和地区因素对保险销售人员的收入都没有显著影响:
险种因素的p-值等于0.586,地区因素的p-值等于0.107。
表中的CorrectedTotal是我们常用的“总离差平方和”,“Total”是总平方和(与0的离差平方和)。
然而,如果地区和险种因素的交互作用对收入有显著影响,而我们在模型中忽略了二者的交互作用,我们所作的双因素方差分析就是错误的。
下面我们来作有交互作用的方差分析。
[例7.7] 使用例7.5中的数据进行双因素有交互作用的方差分析。
调用Univariate过程,变量的设置保持不变,在模型设置对话框中选择Custom,在效应下拉框中选择Interaction,同时选中“险种”和“地区”变量,点击中间的右箭头,右面Model下面的矩形框中会出现入“险种*地区”这一变量,这表示模型中包含了二者的交互作用(图7-9)。
返回主对话框,单击Plots按钮,在弹出的对话框中把“地区”变量指定为HorizontalAxis,把“险种”指定为SpearateLines,点击下面的Add按钮,表示我们需要做一个以地区为横轴,每个险种按险种的平均值为一条线的图形(图7-10)。
返回主对话框,在options对话框中选中“Homogeneitytest(同方差检验)”复选框。
最后单击主对话框中的“OK”按钮就可以得到有交互作用的双因素方差分析结果了。
图7-9有交互作用的双因素模型设定
图7-10要求SPSS输出均值图形的设定
top↑
表7-14是同方差性检验的结果,检验的p-值等于0.358,表明没有证据表明各个总体的方差不相等。
表7-14同方差性的Levene检验a
F
df1
df2
Sig.
1.168
11
24
.358
零假设是各组中的因变量误差的方差都相等。
a Design:
Intercept+险种+地区+险种*地区
表7-15是SPSS输出的方差分析表。
表中关于险种、地区因素以及二者交互作用的F检验值和p-值与Excel的计算结果是一致的,检验的结论同样是在5%的显著性水平下险种因素的影响不显著,地区的影响以及二者的交互作用影响显著。
表7-15 SPSS输出的双因素方差分析模型
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
81.076(a)
11
7.371
4.914
.001
Intercept
57280.444
1
57280.444
38186.963
.000
险种
3.376
2
1.688
1.125
.341
地区
20.627
3
6.876
4.584
.011
险种*地区
57.073
6
9.512
6.341
.000
Error
36.000
24
1.500
Total
57397.520
36
CorrectedTotal
117.076
35
图7-11反映了地区和险种的保险销售人员的平均收入。
从图中可以看出,在第4
个地区不同险种之间的差异较大,但在第一个地区差异很小。
三条线并非平行线,说明地区和险种因素之间存在交互影响。
从图形可以看出,在第1和第4个地区第3种保险的销售人员收入最高,在第2个地区第1种保险的销售人员收入最高,而在第3个地区第2种保险的销售人员收入最高。
图7-11分地区和险种的平均收入
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品 SPSS 进行 因素 方差分析 多重 比较