第5讲 spss一般线性模型.docx
- 文档编号:10194041
- 上传时间:2023-02-09
- 格式:DOCX
- 页数:23
- 大小:145.65KB
第5讲 spss一般线性模型.docx
《第5讲 spss一般线性模型.docx》由会员分享,可在线阅读,更多相关《第5讲 spss一般线性模型.docx(23页珍藏版)》请在冰豆网上搜索。
第5讲spss一般线性模型
第五讲一般线性模型(GLM)
GeneralLinearModel菜单
5.1 两因素方差分析(配伍设计方差分析)
5.2 协方差分析
5.3拉丁方设计的方差分析
5.4 多元方差分析
5.5 重复测量的方差分析
一般线性模型用途广泛,凡是和方差分析粘边的资料都可以用它来做,比如成组设计的方差分析(即单因素方差分析)、配伍设计的方差分析(即两因素方差分析)、交叉设计的方差分析、析因设计的方差分析、重复测量的方差分析、协方差分析等等。
因此,能真正掌握GLM菜单的用法,会使大家的统计分析能力有极大地提高。
实际上一般线性模型包括的统计方法还不止这些,这里举出来的只是从用SPSS作统计分析的角度而言的一些。
一般线性模型下属的四个子菜单各自的功能:
∙Univariate子菜单:
最主要的菜单项,绝大部分的统计分析都在这里面进行。
∙Multivariate子菜单:
当结果变量(应变量)不止一个时,要用该菜单来分析;
∙RepetedMeasures子菜单:
顾名思义,重复测量的数据就要用它来分析,对于重复测量数据,用前面两个菜单似乎都可以分析出结果,但在许多情况下所得的结果是不正确的,应该用重复测量的分析方法才对。
∙VarianceComponents子菜单:
用于作方差成份分析的,这个模型实在太深,不是一时半会说的请的,这里不讲述。
§5.1 两因素方差分析(配伍设计的方差分析)
先看下面例子:
例5.1对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果。
采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。
现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。
三周后所增体重(克)如下表,问小白鼠喂养三种不同营养素后所增体重有无差别?
区组号
A营养素
B营养素
C营养素
1
50.10
58.20
64.50
2
47.80
48.50
62.40
3
53.10
53.80
58.60
4
63.50
64.20
72.50
5
71.20
68.40
79.30
6
41.40
45.70
38.40
7
61.90
53.00
51.20
8
42.20
39.80
46.20
根据资料的设计方法和统计分析的要求,该资料需做配伍设计的方差分析,所建立的数据格式如下:
三个变量来包括上述信息,即block表示区组,food代表使用的营养素,weight表示所增加的重量,即:
block
food
weight
1
1
50.01
1
2
58.20
其余依此类推。
5.1.1 Univariate对话框界面说明
这里只有一个结果变量weight,要采用univariate对话框,如下所示:
在上面的这些框和按钮中,最常用的有:
DependentVariable框、FixedFactors框、Model钮、PostHoc钮,下面我们来一一解释。
【DependentVariable框】
选入需要分析的变量(应变量),只能选入一个。
这里我们的应变量为weight,将他选入即可。
【FixedFactors框】
FixedFactors即固定因素,说的通俗一些,就是绝大多数要分析的因素都应该往里面选。
这里我们要分析的是block和food两个变量,把他们选入FixedFactors框
固定因素指的是在样本中它所有可能的取值都出现了,比如food,只可能有1、2、3这三个值,并且都出现了,就被称作固定效应;而相对应的随机效应的因素指的是所有可能的取值在样本中没有都出现,或不可能都出现,如本例中的block,实际上总体中当然不可能只有这8窝,因此要用样本中block的情况来推论总体中block未出现的那些取值的情况时就会存在误差,因此被称为随机因素。
我这里让block也选入固定框是基于下面的事实:
这样做统计分析的结论是完全相同的。
【RandomFactors框】
RandomFactors,即随机因素,用于选入随机因素。
【Covariate框】
用于选入协方差分析时的协变量。
【WLSWeight框】
即用于选入最小二乘法权重系数。
【Model钮】
单击后出现一个对话框,用于设置在模型中包含哪些主效应和交互因子,默认情况为Fullfactorial,即分析所有的主效应和交互作用。
我们这里没有交互作用可分析,所以要改一下,否则将做不出结果来。
选择右侧的custom单选项,这时中部的BuildTerm下拉列表框就变黑可用,该框用于选择进入模型的因素交互作用级别,即是分析主效应、两阶交互、三阶交互、还是全部分析。
这里我们只能分析主效应:
选择main,再用黑色箭头将block和food选入右侧的model框中。
该对话框中还有两个元素:
左下方的Sumofsquares框用于选择方差分析模型类别,有1型到4型四种,如果你搞不清他们之间的区别,使用默认的3型即可;中下部有个Includeinterceptinmodel复选框,用于选择是否在模型中包括截距,不用改动,默认即可。
【Contrast钮】:
用于选择对照的方法。
弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义,在这里,该对话框比单因素方差分析的时候还要专业,使用频率也更少。
1、在Factors框中显示出所有在主对话框中选中的因素变量。
在因素变量名后的括号中是当前的对比方法。
Change按钮可以改变对比方法。
2、Contrast框中包含7种对比方法:
(1)None选项:
不进行均数比较;
(2)Deviation选项:
除忽略水平外(在ReferenceCategoryz
中选定:
Last或First),比较预测变量或因素变量的每个水平的效应。
(3)Simple选项:
除了作为参考水平外,对预测变量或因素变量的每个水平都与参考水平进行比较(在ReferenceCategoryz
中选定:
Last或First作为参考水平)。
(4)Difference选项:
对预测变量或因素每一个水平的效应,除第一水平外,都与其前面各个水平的平均效应进行比较。
(5)Helmert选项:
对预测变量或因素的效应,除最后一水平外,都与后续的各个水平的平均效应进行比较。
(6)Repeated选项:
对相邻的水平进行比较。
对预测变量或因素的效应,除第一水平外,对每一水平都与它前面的水平进行比较。
(7)Polynomial选项:
多项式比较。
【Plots钮】选择分布图形。
用于指定用模型的某些参数作图,制作均值轮廓图(ProfilePlot)。
轮廓图是线图,用于比较边际均值,表明因变量在因素变量每个水平上的边际均值的估计值,如果指定了协变量,则该均值是经过协变量调整的均值。
因变量做纵轴,因素变量做横轴。
做单因素分析时,轮廓图表明该因素各水平的因变量的均值;
做双因素分析时,指定一个因素做横轴变量,另一个因素变量的每个水平产生不同的线。
双因素或多因素轮廓图中,相互平行的线表明在该因素间无交互效应;不平行的线表明因素间存在交互效应;
Factors框中为主对话框中所选因素变量名;
HorizontalAxis横坐标框:
指定横坐标变量;若看该变量各个水平的因变量均值分布,单击Add,将该因素选入Plots框中。
SeparateLines分线框:
如果想看两个因素变量组合的各个单元格中因变量均值分布,或想看两个因变量间是否存在交互效应,在SeparateLines框中放入一个因素变量,按Add按钮,将自动生成的图形表达式送入Plot框中,分线框中的变量的每个水平将在图中是一条线。
SeparatePlot分图框:
如果在Factor框中还有因素变量,按照上述方法,将其送入SeparatePlot框中,按Add,将自动生成的图形表达式送入Plot框中。
分图变量的每个水平生成一张线图。
【PostHoc钮】
该按钮弹出的两两比较对话框和单因素方差分析中的一模一样,不再重复。
本题对food作两两比较,方法为SNK法。
【Save钮】
将模型拟合时产生的中间结果或参数保存为新变量供继续分析时用,可保存的指标有预测值(PredictedValues)、残差(Residual)、诊断用指标(Diagnostics)等。
【Options钮】
定义选项,可以定义输出指标的估计边际均数、并做所选择的两两比较,还有其他一些输出,如常用描述指标、方差齐性检验等。
1.Analyze==>GeneralLinealmodel==>Univariate
2.DependentVariable框:
选入weight
3.FixedFactors框:
选入block和food
4.单击Model按钮;
5. 选中Custom单选钮:
6.在Factors框中选定block和food
7.在BuildTerms框中选择Maineffects
8. Model框:
选入group和food
9. 单击OK
10.PostHoc钮:
单击
11. PostHoctestfor框:
选入food
12. SNK复选框:
选中
13. 单击OK
14.单击OK
5.1.2 结果解释
按照上题的操作,结果输出如下:
1、UnivariateAnalysisofVariance
这是一个所分析因素的取值情况列表,没有什么不好懂的。
2、方差分析表,只不过是两因素的而已。
首先是所用方差分析模型的检验,F值为11.517,P小于0.05,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义,忽略即可;第三行是变量block,可见它也有统计学意义,不过我们关心的也不是他;第四行是我们真正要分析的FOOD,非常遗憾,它的P值为0.084,还没有统计学意义。
尽管不太愿意,我们的结论也只能是:
尚不能认为三种营养素喂养的小白鼠体重增量有差别。
上表的标题内容翻译如下:
变异来源
III型方差SS
自由度
均方MS
统计量F
P值
校正的模型
2521.294
9
280.144
11.517
.000
截距
74359.534
1
74359.534
3056.985
.000
block
2376.376
7
339.482
13.956
.000
FOOD
144.917
2
72.459
2.979
.084
误差
340.543
14
24.324
合计
77221.370
24
校正的合计
2861.836
23
3、PostHocTests
FOOD
HomogeneousSubsets
3、两两比较的结果,方法为LSD和SNK法。
由于前面总的比较无差异,所以这里三种食物均在一个亚组内,检验无差异,P值为0.121。
前面方差分析FOOD的P值不是0.084吗?
这里又是0.121,究竟哪个为准?
两两比较只是近似的比较结果,应以前面方差分析的P为准,不过这两个P值不会在检验结果上发生质的冲突,一般只是大小不同而已。
好了,上面是正确的结果,如果model选择是采用Fullfactor又如何呢?
由于所谓的交互作用将误差变异和自由度给全部“吃”掉了,没有误差可用于统计分析,什么结果也做不出来。
§8.2 协方差分析
例5.2 某医生欲了解成年人体重正常者与超重者的血清胆固醇是否不同。
而胆固醇含量与年龄有关,资料见下表。
正常组
超重组
年龄(X1)
胆固醇(Y1)
年龄(X2)
胆固醇(Y2)
48
3.5
58
7.3
33
4.6
41
4.7
51
5.8
71
8.4
43
5.8
76
8.8
44
4.9
49
5.1
63
8.7
33
4.9
49
3.6
54
6.7
42
5.5
65
6.4
40
4.9
39
6.0
47
5.1
52
7.5
41
4.1
45
6.4
41
4.6
58
6.8
56
5.1
67
9.2
考虑到统计分析对数据格式的要求,我们这里建立三个变量:
GROUP表示组别,AGE代表年龄,CHOL则表示胆固醇。
5.2.1 分析步骤
首先应进行预分析,了解资料是否符合协方差分析的要求,最重要的一点就是看age的影响在两组中是否相同,这可以用age与group是否存在交互作用来表示。
对该问题,粗糙的方法可以是作分组散点图,差不多就可以,也可以进行预分析,看交互作用有无统计学意义,这里用后一种方法中最为精确的步骤来讲解。
预分析步骤:
1.Analyze==>GeneralLinealmodel==>Univariate
2.DependentVariable框:
选入chol
3.FixedFactors框:
选入group、age
4.Model钮:
单击
5. Custom单选钮:
选中
6. Model框:
选入group、age和group*age(后者用interaction方法就可选入)
7. Sumofsquares列表框:
改为TYPEI
8. 单击OK
9.单击OK
该步骤用于判断group和age间是否存在交互作用,如存在,则协方差分析的条件不满足,分析不能继续。
注意这里选择了ModelI,从而拟合结果和模型中变量的引入顺序有关,即侧重点在group对chol的影响大小和交互作用上。
5.2.2 预分析结果解释
预分析的结果如下:
UnivariateAnalysisofVariance
结果显示交互作用无统计学意义,而且P值非常大,因此交换group和age多半交互作用也无统计学意义,因此可以不继续作预分析了,当然,严格的步骤应当交换两者的顺序继续进行预分析。
5.2.3协方差分析步骤:
1.Analyze==>GeneralLinealmodel==>Univariate
2.DependentVariable框:
选入chol
3.FixedFactors框:
选入group
4.Covariates框:
选入AGE
5.Model钮:
单击
6. Custom单选钮:
选中
7. Model框:
选入group、age
8. Sumofsquares列表框:
改为TYPEIII
9. 单击OK
10.Options钮:
单击
11. Displsymeansfor框:
选入group
12. Comparemeaneffects复选框:
选中(下面的区间调整方法就用LSD(none)即可)
13. 单击OK
14.单击OK
5.2.4协方差分析结果:
1、TestsofBetween-SubjectsEffects
DependentVariable:
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
42.995
2
21.498
23.493
.000
Intercept
1.527
1
1.527
1.668
.209
GRUOP
4.458
1
4.458
4.872
.038
AGE
24.380
1
24.380
26.642
.000
Error
21.047
23
.915
Total
980.940
26
CorrectedTotal
64.042
25
aRSquared=.671(AdjustedRSquared=.643)
这是正式的统计分析结果,显示group和age都对胆固醇含量有影响,P值分别为0.038和小于0.001。
2、EstimatedMarginalMeans
Estimates
DependentVariable:
胆固醇(mmol/L)
Mean
Std.Error
95%ConfidenceInterval
组别
LowerBound
UpperBound
正常体重
5.491
.276
4.919
6.062
超重
6.386
.276
5.815
6.958
aEvaluatedatcovariatesappearedinthemodel:
年龄(岁)=50.23.
这是两组的修正均数及相应的可信区间,显然超重组的胆固醇均值较高。
下方的提示表明该修正均数是按年龄为50.2308岁的情形计算的。
PairwiseComparisons
DependentVariable:
胆固醇(mmol/L)
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceIntervalforDifference
(I)组别
(J)组别
LowerBound
UpperBound
正常体重
超重
-.895
.406
.038
-1.735
-5.619E-02
超重
正常体重
.895
.406
.038
5.619E-02
1.735
Basedonestimatedmarginalmeans
*Themeandifferenceissignificantatthe.05level.
aAdjustmentformultiplecomparisons:
LeastSignificantDifference(equivalenttonoadjustments).
5.3拉丁方设计的方差分析
拉丁方设计为三因素的研究设计,每个因素可以有三个或以上水平,实验效率很高,其资料的方差分析如下。
例5.3为研究不同剂量的甲状腺素注射液对甲状腺体的影响,以5个种系的豚鼠,每个种系各5只,分养于5个笼子,每个笼子放置豚鼠1只,甲状腺素分为5个剂量注射豚鼠,测得豚鼠甲状腺体的重量如下表,分析不同种系的豚鼠间,不同甲状腺素剂量间,不同笼间豚鼠的甲状腺体重量有无差别。
豚鼠注射不同剂量的甲状腺素后甲状腺体重量(mg)
种笼号
系ⅠⅡⅢⅣⅤ
甲C65E85A57B49D79
乙E82B63D77C70A46
丙A73D68C51E76B52
丁D92C67B63A41E68
戊B81A56E99D75C66
因变量:
甲状腺体重量(表中数字);
分组变量(甲状腺剂量):
5个水平,用A、B、C、D、E表示;
分组变量(豚鼠种系):
5个水平,用甲、乙、丙、丁、戊表示;
分组变量(笼号):
5个水平,用表示;Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ表示;
1、数据格式:
25行4列(四个变量:
剂量、种系、笼号);
2、分析过程:
1、Analyze==>GeneralLinealmodel==>Univariate;
2、DependentVariable框:
选入甲状腺重;
3、FixedFactors框:
选入剂量、种系、笼号;
4、单击Model按钮,做下面选择:
(1)选中Custom单选钮;
(2)在BuildTerms选择框中选择Maineffect;(3)在Model框中选入剂量、种系、笼号;
(4)在Sumofsquares列表框中选TYPEIII;单击继续;
5、单击PostHoc按钮:
在PostHocTestfor:
框中选入剂量;选中S-N-K;单击继续;
6、单击Options按钮:
在Displsymeansfor框:
选入剂量;单击继续;
7、单击OK
3、结果
5.3.3方差分析几点说明
1、其它设计资料的方差分析,如交叉设计的方差分析、析因设计的方差分析等,其做法按以上的方法就可以作出来。
2、需要分析的影响因素可以都选入fixedfactor框,如果不是复杂的模型,一般分析结果不会有误。
3、方差分析模型多数情况下要选TYPEIII,但如果数据存在缺失值、设计不平衡等情况下要慎重考虑,因为此时往往会要求模型进行详细的设置。
3、Model的设置对分析是非常重要的,如果设置不正确,可能什么都做不出来,比如无重复数据的方差分析纳入了交互作用、析因设计的方差分析纳入了设计中不存在的因素,就会做不出结果。
4、一般线性模型是很复杂的,上面的分析仅是其中的一些应用。
§8.4 多元方差分析
所谓多元方差分析,就是说存在着不止有一个应变量,而是两个或以上的应变量共同反映了自变量的影响程度。
比如要研究某些因素对儿童生长的影响程度,则身高、体重等都可以作为生长程度的测量因子,即都应作为应变量。
5.3.1 分析步骤
为了方便起见,我们这里直接利用SPSS自带的数据集plastic.sav,假设tear_res、gloss和opacity都是反映橡胶质量的指标,现在要研究extrusn和additive对橡胶的质量影响如何,则应采用多元方差分析。
选择Analyze==>GeneralLinearModel==>Multivariate,则弹出Multivariate对话框,请注意,除了没有randomeffect外,它的所有元素都是和univariate对话框相同的,里面的内容也相同,因此我们这里就不再重复了。
按照我们的分析要求,对话框操作步骤如下:
1.Analyze==>GeneralLinealmodel==>Multivariate
2.DependentVariable框:
选入tear_res、gloss和opacity
3.FixedFactors框:
选入extrusn和additive
4.单击OK
此处两个自变量均是二分类变量,故无需选择两两比较方法。
8.4.2 结果解释
按上面的选择,分析结果如下:
GeneralLinearModel
1、引入模型的自变量的取值情况列表。
Between-SubjectsFactors
N
AdditiveAmount
1
10
2
10
Extrusion
1
10
2
10
2、是针对模型中的自变量间及其交互作用所做的检验,采用的是四种多元检验方法。
一般他们的结果都是相同的,如果不同,一般以Hotelling'sTrace方法的结果为准。
可见在所用的模型中,extrusn和additive对结果变量是有统计学意义的,但交互作用无统计学意义。
3、方差分析表的合并,即分别考虑三个应变量时的方差分析结果。
上面的多元方差分析已经得知两自变量对应变量有影响,从现在的分析表就可以更清楚的知道是对那
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5讲 spss一般线性模型 spss 一般 线性 模型