sect41 单因素方差分析.docx
- 文档编号:28632520
- 上传时间:2023-07-19
- 格式:DOCX
- 页数:17
- 大小:150.28KB
sect41 单因素方差分析.docx
《sect41 单因素方差分析.docx》由会员分享,可在线阅读,更多相关《sect41 单因素方差分析.docx(17页珍藏版)》请在冰豆网上搜索。
sect41单因素方差分析
§4.1单因素方差分析
单因变量的单因素方差分析主要解决多于两个总体样本或变量间均值的比较问题。
是一种对多个(大于两个)总体样本的均值是否存在显著差异的检验方法。
其目的也是对不同的总体的数据的均值之间的差异是否显著进行检验。
单因素方差分析的应用范围很广,涉及到工业、农业、商业、医学、社会学等多个方面。
◆单因素方差分析的应用条件:
在不同的水平(因素变量取不同值)下,各总体应当服从方差相等的正态分布。
例4,某企业需要一种零件,现有三个不同的地区的企业生产的同种零件可供选择,为了比较这三个零件的强度是否相同,每个地区的企业抽出6件产品进行强度测试,其值如表2.6所示。
假设每个企业零件的强度值服从正态分布,试检验这三个地区企业的零件强度是否存在显著差异。
解:
首先建立假设H0:
三个地区的零件强度无显著差异;
H1:
三个地区的零件强度有显著差异。
然后根据表2.6中数据,建立数据文件SY-6并进行单因素方差(One-WayANOVA)分析。
具体操作过程如下:
表2.6样本零件强度值单位:
百公斤
1
2
3
1
116
110
89
2
98
103
85
3
100
118
99
4
115
106
73
5
83
107
97
6
105
116
102
1、单击AnalyzeCompareMeansOne-WayANOVA,打开One-WayANOVA对话框。
图2.7单因素方差主对话框
2、从左框中选择因变量”零件强度”进入Dependentlist框内,选择因素变量”地区”进入Factor框内。
点击OK就可以得到方差分析表2.7。
表2.7ANOVA方差分析表百公斤
方差来源
平方和
SumofSquares
自由度Df
均方
MeanSquare
F值
P值
Sig.
BetweenGroups组间
1125.444
2
562.722
5.591
.015
WithinGroups组内
1509.667
15
100.644
Total总和
2635.111
17
表2.7是方差分析表,由于F统计量值的P值明显小于显著性水平0.05,故拒绝假设H0,认为这三个地区的零件强度有显著差异。
如果需要对各地区间的零件强度进行进一步的比较和分析,可以通过按纽Option选项,contrast对照比较,PostHoc多重比较去实现。
3、单击Option按纽,打开Option对话框如图2.8所示:
在Option选项中选择输出项。
主要有不同水平下样本方差的齐性检验,缺失值的处理方式及均值的图形。
图2.8单因素方差分析Options对话框
本例中选择Homogeneityofvariancetest进行不同水平间方差齐性的检验以及Descriptive基本统计描述。
在MissingValue栏中选择系统默认项。
完成所有选择后返回主对话框,然后单击OK,就可以得到三个地区零件强度分析表2.8。
表2.8(a)Descriptives基本统计描述
N
Mean
Std.Deviation
Std.Error
95%ConfidenceIntervalforMean
Minimum
Maximum
LowerBound
UpperBound
A1
6
102.83
12.254
5.003
89.97
115.69
83
116
A2
6
110.00
5.899
2.408
103.81
116.19
103
118
A3
6
90.83
10.815
4.415
79.48
102.18
73
102
Total
18
101.22
12.450
2.935
95.03
107.41
73
118
表2.8(b)TestofHomogeneityofVariances方差齐性检验
百公斤
LeveneStatistic
df1
df2
Sig.
1.203
2
15
.328
从基本统计分析表2.8(a)可以得到均值、标准差等数据相应的统计特征值。
从表2.8(b)中的统计检验可以得出,因素变量的各水平间的方差是没有显著差异的。
4、Contrasts按纽可以用来进一步分析随着控制变量水平的变化,观测值变化的总体趋势以及进一步比较任意指定水平间的均值差异是否显著。
单击Contrasts按纽,打开One-WayANOVA:
Contrasts对话框.见图2.9.
图2.9单因素方差分析Contrasts对话框
如果要对组间平方和进行趋势成分检验,选中Polynomial多项式复选项,选中后激活Degree参数框,在Degree框中选择趋势检验多项式的阶数,有最高次数可达5次。
系统将给出指定阶数和低于指定阶次各阶次的自由度、F值和F检验的概率值。
在Contrast栏,指定需要对照比较两个水平的均值。
在Coefficients框中输入一个系数,单击Add按纽,系数就进入到Coefficients框中。
重复上述,依次输入各组均值的系数。
注意系数的和应当等于0。
如;图2.9中就是指第一个水平与第三个水平的均值差比较。
5、如果需要将水平间两两比较,可以单击PostHoc按纽,打开多重比较对话框。
如图2.10所示:
在该对话框中列出了二十种多重比较检验,涉及到许多的数理统计方法,在实际中只选用其中常用的方法即可。
对话框下部的Significancelevel表示显著性水平,默认值是0.05,也可以根据需要重新输入其它值。
●如果满足在水平间方差相等的条件,常用LSD(least-significantdifference最小显著性差异法),表示用t检验完成各组均值间的配对比较。
●当方差不等的情况下,可以选择TamhanesT2,用t检验进行各组均值间的配对比较。
图2.10单因素方差分析PHC对话框
选择多重比较方式后,点击OK,得到输出结果表2.9。
表2.9MultipleComparisons多重比较
DependentVariable:
百公斤
LSD
(I)地区
(J)地区
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
LowerBound
UpperBound
A1
A2
-7.17
5.792
.235
-19.51
5.18
A3
12.00
5.792
.056
-.35
24.35
A2
A1
7.17
5.792
.235
-5.18
19.51
A3
19.17(*)
5.792
.005
6.82
31.51
A3
A1
-12.00
5.792
.056
-24.35
.35
A2
-19.17(*)
5.792
.005
-31.51
-6.82
*Themeandifferenceissignificantatthe.05level.
从表2.8中可以看出,地区2与地区3之间的差异是非常显著的,它们均值差的检验的尾概率为0.005,明显小于显著性水平0.05。
§4.2双因素方差(Univariate)分析过程
单因变量的双因素方差分析是对观察的现象(因变量)受两个因素或变量的影响进行分析,检验不同水平组合之间对因变量的影响是否显著。
双因素方差分析的应用范围很广,如粮食产量受到气候、温度因素的影响;某生物产品的生产过程不仅受催化剂多少的影响、还受温度高低的影响等,甚至两因素变量之间的交互作用对因变量也有一定的影响。
要分清楚哪个因素的影响作用比较大,就可以应用双因素方差分析的方法来解决。
◆双因素方差分析应用条件:
因变量和协变量必须是数值型变量,且因变量来自或近似来自正态总体。
因素变量是分类变量,变量可以是数值型或字符型的。
各水平下的总体假设服从正态分布,而且假设各水平下的方差是相等的。
双因素方差分析过程可以分析出每一个因素的作用;各因素之间的交互作用;检验各总体间方差是否相等;还能够对因素的各水平间均值差异进行比较等。
例5:
表2.10是某商品S在不同地区和不同时期的销售量表。
已知数据服从正态分布,则要检验地区因素及时间因素对销售量的影响是否显著。
表2.10某商品S销售量表单位:
千件
1
2
3
4
5
1
6.5
14.2
13.4
2.4
6.2
2
1.8
7.1
9.4
1.5
4.8
3
3.6
10.8
7.2
1.7
4.9
4
3.7
8.9
8.6
2.3
4.6
5
7.6
12.6
7.5
2.8
5.2
由于销售量受地区和时间两个因素的影响,这是一个双因素方差分析的问题,根据上表建立数据文件SY-7,具体分析的步骤如下:
1、单击AnalyzeGenerallinearModelUnivariate,打开Univariate主对话框。
如图2.11所示:
图2.11双因素方差分析对话框
2、选择要分析的变量”销售量”进入DependentVariable框中,选择因素变量”地区”和”时期”进入FixedFactor框中。
3、单击Model按纽选择分析模型,得到Model对话框。
如图2.12所示:
在Specify框中,指定模型类型。
FullFactorial选项为系统默认项,建立全模型,全模型中包括因素之间的交互作用。
如果选择分析两个因素的交互作用,则必须在每种水平组合下,取得两个以上的实验数据,才能实现两个因素的交互作用的分析结果。
如果不考虑因素间的交互作用时,应当选择自定义模型。
图2.12Univariate:
Model对话框
Custom选项为自定义模型,本例选择此项并激活下面的各项操作。
先从左边框中选择因素变量进入Model框中,然后选择效应类型。
一般不考虑交互作用时,选择主效应Main,考虑交互作用时,选择交互作用Interaction。
可以通过单击BuildTerm下面的小菜单完成,本例中选择主效应。
最后在SumofSquare中选择分解平方和的方法后返回在主对话框。
一般选取默认项TypeⅢ。
单击OK就可以得到相应的双因素方差分析表2.11.
表2.11销售量的双因素方差分析检验表
TestsofBetween-SubjectsEffects
DependentVariable:
商品S(千件)
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
289.717(a)
8
36.215
14.679
.000
Intercept
1015.060
1
1015.060
411.438
.000
地区
247.218
4
61.805
25.052
.000
时期
42.498
4
10.625
4.307
.015
Error
39.474
16
2.467
Total
1344.250
25
CorrectedTotal
329.190
24
aRSquared=.880(AdjustedRSquared=.820)
表中用黑体字部分是一般统计学原理书中给出的双因素方差分析表。
从表中数据可以看出,F值对应概率P值都小于显著性水平0.05,这说明地区和时期对销售量的影响都是显著的。
4、如果需要进行特定的两水平间的均值比较,可单击Contrast比较按纽,打开Contrast对话框如图2.13。
在Factor框中显示所有在主对话框中选择的因素变量,括号中显示的是当前的比较方法,点击选中因素变量,可以改变均值的比较方法。
图2.13Univariate:
Contrasts对话框
●ChangeContrast栏中列出对比方法。
在小菜单中供选择的方法依次是:
None不进行均数比较;
Deviation以观测量均值为标准进行比较;
Simple以第一个或最后一个水平的观察值均值为标准;
Difference各水平上观察值均值与前一个水平的均值进行比较;
Hermert各水平上观察值与最后一个水平的均值比较。
选择了比较方法后,再点击Change按纽确定,将选中的比较方法显示在选中的因素变量后的括号内。
然后返回主对话框。
图2.14Univariate:
ProfilePlots对话框
5、如果需要进行图形展示,可单击Plots按纽,打开图形对话框如图2.14所示。
选择作均值轮廓图(Profile)的参数。
(1)在Factor框中选择因素变量进入横坐标HorizontalAxis框内,然后单击add按纽,可以得到该因素不同水平的因变量均值的分布。
(2)如果要了解两个因素变量的交互作用,将一个因素变量送入横坐标后,将另一个因素变量送入SeparateLines分线框中,然后单击add按纽。
就可以输出反映两个因素变量的交互图。
本例中选择因素A为横坐标。
6、如需要将因素A各水平间均值进行两两比较,单击PostHoc按纽,打开PostHocMultiple多重比较对话框如图2.15所示。
从Factor框中选择因素变量进入PostHocTestfor框中,然后选择多重比较方法。
本例中各组方差相等,选择LSD方法。
图2.15Univariate:
PostHoc多重比较对话框
7、单击Save按纽,打开保存对话框,如图2.16所示。
选择需要保存的变量。
图2.16Univariate:
Save对话框
●PredictedValue预测值栏,选择此栏系统将给出根据模型计算的有关预测值的选择项。
●Diagnostics诊断异常值栏,有库克距离和杠杆值(leveragevalue)。
●SavetoNewFile保存新文件栏
●Residual残差栏,有非标准化和标准化残差、学生化和剔除残差等。
本例中不作选择。
8、单击Options按纽,打开Univariate:
Options对话框,从中选择需要输出的显著性水平,默认值为0.05。
本例中不作选择。
在进行所有的选择后,单击OK,就可以得到输出结果。
由多重比较LSD表中得到不同地区销售量的比较表2.12。
表2.12MultipleComparisons多重比较表
DependentVariable:
商品S
LSD
(I)因素A
(J)因素A
MeanDifference(I-J)
均值Ai-均值Aj
Std.Error
标准误
Sig.
P值
95%ConfidenceInterval
95%的置信区间
LowerBound
UpperBound
A1
A2
-6.0800(*)
.99340
.000
-8.1859
-3.9741
A3
-4.5800(*)
.99340
.000
-6.6859
-2.4741
A4
2.5000(*)
.99340
.023
.3941
4.6059
A5
-.5000
.99340
.622
-2.6059
1.6059
A2
A1
6.0800(*)
.99340
.000
3.9741
8.1859
A3
1.5000
.99340
.151
-.6059
3.6059
A4
8.5800(*)
.99340
.000
6.4741
10.6859
A5
5.5800(*)
.99340
.000
3.4741
7.6859
A3
A1
4.5800(*)
.99340
.000
2.4741
6.6859
A2
-1.5000
.99340
.151
-3.6059
.6059
A4
7.0800(*)
.99340
.000
4.9741
9.1859
A5
4.0800(*)
.99340
.001
1.9741
6.1859
A4
A1
-2.5000(*)
.99340
.023
-4.6059
-.3941
A2
-8.5800(*)
.99340
.000
-10.6859
-6.4741
A3
-7.0800(*)
.99340
.000
-9.1859
-4.9741
A5
-3.0000(*)
.99340
.008
-5.1059
-.8941
A5
A1
.5000
.99340
.622
-1.6059
2.6059
A2
-5.5800(*)
.99340
.000
-7.6859
-3.4741
A3
-4.0800(*)
.99340
.001
-6.1859
-1.9741
A4
3.0000(*)
.99340
.008
.8941
5.1059
Basedonobservedmeans.
*Themeandifferenceissignificantatthe.05level.
从表2.12中可以看到地区之间的差异比较结果,如A1与A2,A1与A3的差异就比较大,而A1和A5之间的没有显著差异。
图2.17因素A与因素B的交互作用图
由图2.17可以看出,两个因素变量地区和时期的折线之间无交叉,因此两个因素之间基本上没有交互作用。
实验练习题二
1、为了比较两种材料的质量,选择15台不同设备对这两种材料进行特别处理,假设未处理前两种材料的指标数据均为10,一星期后经测量得到两种材料的指标数据如下:
试根据下面的数据检验两种材料的质量有无显著差异?
材料A
7.6
7.0
8.3
8.2
5.2
9.3
7.9
8.5
7.8
7.5
6.1
8.9
6.1
9.4
9.1
材料B
8.0
6.4
8.8
7.9
6.8
9.1
6.3
7.5
7.0
6.5
4.4
7.7
4.2
9.4
9.1
2、下面给出的是两个大文学家马克.吐温的8篇小品文及斯诺特格拉斯的10篇小品文中由3个字母组成的词的比例。
马克吐温
0.225
0.262
0.217
0.240
0.230
0.229
0.235
0.217
斯诺特格拉斯
0.209
0.205
0.196
0.210
0.202
0.207
0.224
0.223
0.220
0.201
设两组数据分别来自正态总体,试检验两位作家写的小品文稿中包含由3个字母组成的词的比例是否有显著的差异?
并且检验两组数据的方差是否相等?
3、现有甲、乙、丙3家企业生产同一种型号电池,为评比其质量,从每个生产企业各随机抽取12只进行寿命测试,数据如下表所示:
工厂
寿命(h)
甲
乙
丙
404838424543423948444743
263130343435292837323735
394140424142475043504843
试在显著性水平0.05下,检验三企业生产的电池的平均寿命μ1、μ2、μ3有无显著差异,并求μ1-μ2,μ1-μ3,μ2-μ3的95%置信区间。
4、下表中给出了某种化工过程在三种浓度、四种温度水平下的得率,
浓度(%)
温度(℃)
10
24
38
52
2
14
10
11
11
13
9
10
12
4
9
7
10
8
7
11
6
10
6
5
11
13
14
12
13
14
10
假设在诸水平的搭配下的总体服从正态分布且方差相等,试在水平0.05下检验不同的浓度及不同的温度下的得率的差异是否显著?
交互作用的效应是否显著?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- sect41 单因素方差分析 因素 方差分析
![提示](https://static.bdocx.com/images/bang_tan.gif)