欢迎来到冰豆网! | 帮助中心 分享价值,成长自我!
冰豆网
全部分类
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • 党团工作>
  • ImageVerifierCode 换一换
    首页 冰豆网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    SPSS学习系列22 方差分析教学内容.docx

    • 资源ID:7161563       资源大小:516.58KB        全文页数:22页
    • 资源格式: DOCX        下载积分:12金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要12金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    SPSS学习系列22 方差分析教学内容.docx

    1、SPSS学习系列22 方差分析教学内容SPSS学习系列22. 方差分析22. 方差分析一、方差分析原理1. 方差分析概述方差分析可用来研究多个分组的均值有无差异,其中分组是按影响因素的不同水平值组合进行划分的。方差分析是对总变异进行分析。看总变异是由哪些部分组成的,这些部分间的关系如何。方差分析,是用来检验两个或两个以上均值间差别显著性(影响观察结果的因素:原因变量(列变量)的个数大于2,或分组变量(行变量)的个数大于1)。一元时常用F检验(也称一元方差分析),多元时用多元方差分析(最常用Wilks检验)。方差分析可用于:(1)完全随机设计(单因素)、随机区组设计(双因素)、析因设计、拉丁方设

    2、计和正交设计等资料;(2)可对两因素间交互作用差异进行显著性检验;(3)进行方差齐性检验。要比较几组均值时,理论上抽得的几个样本,都假定来自正态总体,且有一个相同的方差,仅仅均值可以不相同。还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。所谓的方差是离均差平方和除以自由度,在方差分析中常简称为均方(Mean Square)。2. 基本思想基本思想是,将所有测量值上的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都

    3、与某一种效应相对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以各自的自由度得出各部分的均方,然后列出方差分析表算出F检验值,作出统计推断。方差分析的关键是总离均差平方和的分解,分解越细致,各部分的含义就越明确,对各种效应的作用就越了解,统计推断就越准确。 效应项与试验设计或统计分析的目的有关,一般有:主效应(包括各种因素),交互影响项(因素间的多级交互影响),协变量(来自回归的变异项),等等。当分析和确定了各个效应项S后,根据原始观察资料可计算出各个离均差平方和SS,再根据相应的自由度df,由公式MS=SS/df,求出均方MS,最后由相应的均方,求出各个变异项的F值,F值实际上是两

    4、个均方之比值,通常情况下,分母的均方是误差项的均方。根据F值的分子、分母均方的自由度f1和f2,在确定显著性水平为情况下,由F(f1, f2)临界值表查得单侧F界限值。当F,不拒绝原假设H0,说明不拒绝这个效应项的效应为0的原假设,也即这个效应项是可能对总变异没有实质影响的;若FF则P值,拒绝原假设H0,也即这个效应项是很可能对总变异有实质影响的。3.方差分析的实验设计为了确定方差分析表中各个有关效应项,需要在试验设计阶段就作出安排,再根据设计要求进行试验,得出原始观察值,按原来设计方案算出方差分析表中的各项。在试验设计阶段通常需要考虑如下4个方面:(1)研究的主要变量(因变量)即试验所要观察

    5、的主要指标,一次试验时可以有多个观察指标,方差分析时也可以同时对多个因变量进行分析;(2)因素和水平试验的因素(factor)可以是品种、人员、方法、时间、地区等等,因素所处的状态叫水平(level)。在每一个因素下面可以分成若干水平。例如,某工厂的原料来自4个不同地区,那么用不同地区的原料生产的产品质量是否一致呢?所要比较的地区就是因素,4个地区便是地区这一因素的4个水平。当某个主要因素的各个水平间的主要因变量的均值呈现统计显著性时,必要时可作两两水平间的比较,称为均值间的两两比较。(3)因素间的交互影响多因素的试验设计,有时需要分析因素间的交互影响(interaction),2个因素间的交

    6、互影响称为一级交互影响(AB);3个因素间的交互影响称为二级交互影响(ABC)。当交互影响项呈现统计不显著时,表明各个因素独立,当呈现统计显著时,就需要列出这个交互影响项的效应,以助于作出正确的统计推断。二、单因素方差分析1个因变量,1个影响因素:总差异Yij = 平均差异 + 因素差异i + 随机差异ij例1 比较4种品牌的胶合板的耐磨性,各抽取5个样品,相同转速磨损相同时间测得磨损深度(mm),如下:比较4个品牌胶合板的耐磨性有无差异? 总差异Yij = 平均磨损 + 品牌差异i + 随机差异ij1. 【分析】【一般线性模型】【单变量】,打开“单变量”窗口,将变量“wear磨损深度”选入【

    7、因变量】框,“brand品牌”选入【固定因子】框;2. 点【两两比较】,打开“观测均值的两两比较”子窗口,勾选【假定方差齐性】下的“LSD”、“S-N-K”,点【继续】;3. 点【选项】,打开“选项”子窗口,勾选“描述统计”、“方差齐性检验”,点【继续】;点【确定】,得到描述性统计量因变量: 磨损深度(mm)地板品牌均值标准 偏差NA2.4100.112695B2.4040.117605C2.0460.112165D2.5720.032715总计2.3580.2177120 给出每个品牌的均值、标准差、样本数。误差方差等同性的 Levene 检验a因变量: 磨损深度(mm)Fdf1df2Sig

    8、.1.292316.311检验零假设,即在所有组中因变量的误差方差均相等。a. 设计 : 截距 + brand 方差齐性检验结果,P值=0.3110.05, 故接受原假设H0:方差齐。主体间效应的检验因变量: 磨损深度(mm)源III 型平方和df均方FSig.校正模型.740a3.24724.550.000截距111.2031111.20311070.511.000brand.7403.24724.550.000误差.16116.010总计112.10420校正的总计.90119a. R 方 = .822(调整 R 方 = .788)方差分析结果,“校正模型”是整个方差分析模型的检验,原假设

    9、H0:所有系数(, i, ij)都=0;P值0.0010.05, 故拒绝原假设。“截距”检验均值, 原假设H0:=0(即不考虑品牌时,平均磨损为0);P值0.0010.05, 故拒绝原假设。“brand”对因素品牌的检验,原假设H0:按因素水平值的各分组的因变量无差异,即品牌因素对磨损深度无影响;P值0.0010.05, 故拒绝原假设,即不同品牌的耐磨性有差异。参数估计因变量: 磨损深度(mm)参数B标准 误差tSig.95% 置信区间下限上限截距2.572.04557.383.0002.4772.667brand=A-.162.063-2.556.021-.296-.028brand=B-.

    10、168.063-2.650.017-.302-.034brand=C-.526.063-8.298.000-.660-.392brand=D0a.a. 此参数为冗余参数,将被设为零。B列为各品牌均值与均值(截距)的差。截距参数对比L1截距1brand=A.250brand=B.250brand=C.250brand=D.250此矩阵的缺省显示是相应的 L 矩阵的转置。基于 III 型平方和。 估计常数项时使用的L矩阵,均为0.25即总样本的均值是按四种品牌等量混合的情况计算的。brand参数对比L2L3L4截距000brand=A100brand=B010brand=C001brand=D-1

    11、-1-1此矩阵的缺省显示是相应的 L 矩阵的转置。基于 III 型平方和。对比系数矩阵,默认将最后一组“品牌D”作为对照组,故上上表的截距(均值)的估计值=品牌D的均值=2.572L2=0 1 0 0 -1T, 对于L2列,令 1 2 3 4L2 = 0,化简得1 = 4 即前表对1作的假设检验。多个比较因变量: 磨损深度(mm)(I) 地板品牌(J) 地板品牌均值差值 (I-J)标准 误差Sig.95% 置信区间下限上限LSDAB.0060.06339.926-.1284.1404C.3640*.06339.000.2296.4984D-.1620*.06339.021-.2964-.027

    12、6BA-.0060.06339.926-.1404.1284C.3580*.06339.000.2236.4924D-.1680*.06339.017-.3024-.0336CA-.3640*.06339.000-.4984-.2296B-.3580*.06339.000-.4924-.2236D-.5260*.06339.000-.6604-.3916DA.1620*.06339.021.0276.2964B.1680*.06339.017.0336.3024C.5260*.06339.000.3916.6604基于观测到的均值。 误差项为均值方 (错误) = .010。*. 均值差值在 .

    13、05 级别上较显著。 LSD法给出的两两比较,将各组均和一个参照水平做比较,未指定默认,则每一个水平都作为参照比较一次。每两个之间的差异有无统计学意义,看对应的P值判断(原假设H0:无差异)。磨损深度(mm)地板品牌N子集123Student-Newman-Keulsa,bC52.0460B52.4040A52.4100D52.5720Sig.1.000.9261.000已显示同类子集中的组均值。 基于观测到的均值。 误差项为均值方 (错误) = .010。a. 使用调和均值样本大小 = 5.000。b. Alpha = .05。 LSD法给出的两两比较结果,将各组的值从小到大排序,注意4个品

    14、牌共被分成了3个亚组(无差异的作为一组),品牌B和A放在一个亚组,二者的P值=0.926(无差异)。三、两因素方差分析1个因变量,2个影响因素:总差异Yijk = 平均差异 + 因素1差异i + 因素2差异i+ 因素1,2交互作用差异ij + 随机差异ijk例2 分析超市某商品的销售量在不同的超市规模(小型、中型、大型)、货架位置(A、B、C、D)是否有差异?部分数据文件如下:变量size超市规模:1=小型,2=中型,3=大型。总差异Yijk = 平均差异 + 超市规模差异i + 货架位置差异i+ 超市规模货架位置交互作用差异ij + 随机差异ijk1. 【分析】【一般线性模型】【单变量】,打

    15、开“单变量”窗口,将变量“sale销售量”选入【因变量】框,将变量“size超市规模”、“position货架位置”选入【固定因子】框;2. 点【选项】,打开“选项”子窗口,勾选【输出】下的“描述统计”、“方差齐性检验”,点【继续】;点【确定】,得到主体间因子值标签N超市规模1小型82中型83大型8摆放位置A6B6C6D6描述性统计量因变量: 周销售量超市规模摆放位置均值标准 偏差N小型A47.5003.53552B59.5004.94972C68.0004.24262D50.5003.53552总计56.3759.13298中型A61.0005.65692B73.5006.36402C76.

    16、5004.94972D58.5002.12132总计67.3759.11738大型A74.0005.65692B78.5004.94972C85.5004.94972D73.0002.82842总计77.7506.36408总计A60.83312.48076B70.5009.77246C76.6678.64106D60.66710.44356总计67.16711.937024误差方差等同性的 Levene 检验a因变量: 周销售量Fdf1df2Sig.1112.检验零假设,即在所有组中因变量的误差方差均相等。a. 设计 : 截距 + size + position + size * posit

    17、ion 超市规模3个水平,货架位置4个水平,共将样本分成34=12组,由于有单组样本数0.05, 故接受原假设H0:该交互作用无差异。下面去掉交互因子继续做两因素方差分析。3. 在第1步的窗口点【模型】,打开“模型”子窗口,选择【指定模型】下的“设定”,将【构建项】下的【类型】设为“主效应”,将变量“size”、“position”选入【模型】框,点【继续】;4. 原窗口点【两两比较】,打开“观测均值的两两比较”子窗口,将因子“size”、“position”选入【两两比较检验】框,勾选【假定方差齐性】下的“S-N-K”,点【继续】;注:若已明确对照组,考察其它组与它的比较,宜采用LSD法;若

    18、要进行多个均值间的两两比较,且各组人数相等,宜采用Tukey法或S-N-K法(若比较的组数特别多,不宜用S-N-K法,宜用Scheffe法);对于不平衡设计或含有协变量的模型,应采用LSD法、Bonferroni法、Sidak法。点【确定】得到:误差方差等同性的 Levene 检验a因变量: 周销售量Fdf1df2Sig.1711112.997检验零假设,即在所有组中因变量的误差方差均相等。a. 设计 : 截距 + size + position 方差齐性检验,P值=0.9970.5, 故接受原假设H0, 即方差齐。主体间效应的检验因变量: 周销售量源III 型平方和df均方FSig.校正模型

    19、2930.417a5586.08330.409.000截距108272.6671108272.6675617.799.000size1828.0832914.04247.426.000position1102.3333367.44419.065.000误差346.9171819.273总计111550.00024校正的总计3277.33323a. R 方 = .894(调整 R 方 = .865) 整个方差模型的检验结果(解释参考例1)。周销售量Student-Newman-Keuls超市规模N子集123小型856.375中型867.375大型877.750Sig.1.0001.0001.00

    20、0已显示同类子集中的组均值。 基于观测到的均值。 误差项为均值方 (错误) = 19.273。a. 使用调和均值样本大小 = 8.000。b. Alpha = .05。周销售量Student-Newman-Keuls摆放位置N子集123D660.667A660.833B670.500C676.667Sig.9481.0001.000已显示同类子集中的组均值。 基于观测到的均值。 误差项为均值方 (错误) = 19.273。a. 使用调和均值样本大小 = 6.000。b. Alpha = .05。 用S-N-K法进行两两比较,可见超市规模越大,销售量越大;货架位置对销售量也有影响,位置AD在同一

    21、亚组,销售量最小,位置B销售量居中,位置C销售量最大,三个亚组之间有统计学差异;另外,由于交互作用被合理地剔除,故上述差异不受另一因素(超市规模)取值的影响。5. 若要绘制轮廓图。原窗口点【绘制】,打开“轮廓图”子窗口,将因子“size”、“position”分别选入【水平轴】点【添加】,点【继续】;注:若要得到两变量的联合轮廓图,将另一变量选入【单图】框即可。点【确定】,得到单变量的轮廓图:边际均值,是基于现有模型,控制了其它因素作用后,根据样本情况计算某因素各水平的均值估计值(若模型中有协变量,会按协变量均值加以修正)。轮廓图,即以边际均值为纵轴,以考察因素为横轴的折线图。用以比较该因素取

    22、不同水平值时,样本均值的变化情况。另外,轮廓图也可用来检验两因素是否存在交互作用:对于单因素模型或包含全部交互项的全模型,边际均值就是各分组的样本均值,其轮廓图就呈现一组平行线;若剔除某交互作用后各曲线明显不平行,则说明两因素存在交互作用。另外,【选项】子窗口也提供了“缺乏拟合优度检验”,勾选它,运行得到失拟检验因变量: 周销售量源平方和df均方FSig.失拟88.917614.819.689.663纯误差258.0001221.500用来检验当前模型(剔除交互项)与全模型(包括全部交互项)的比较,原假设H0:两模型无差别;本例的P值=0.6630.05, 接受原假设,即两因素超市规模、货架位

    23、置的交互作用可以忽略。6. 若要绘制残差图。原窗口点【选项】,勾选【输出】下的“残差图”,运行得到残差图给出了因变量的实测值、预测值、标准化残差的散点图,若预测值与实测值有明显的相关性(接近直线趋势),标准化残差在0附近随机分布,则表明拟合结果较好。7. 除两两比较外,也可以自定义比较。下面只说明原理,具体操作需要借助代码实现。例如,前文比较货架位置A与D时,L矩阵=1 0 0 -1T, 有A B C D1 0 0 -1T=0 等价于 A=D前面分析发现位置A与D的销售量基本无差异,现在想将A与D合并再与B比较有无差异,则可以指定L矩阵=1 -2 0 1T, 则A B C D1 -2 0 1T

    24、 =0 等价于 (A+D)/2 = B注意:是从(A+D)/2 = B倒推L矩阵,该式即A-2B+0C+D=0. 四、含随机因素的方差分析随机因素设为固定因素作为分析,可能得到错误的结果。例3 研究4种广告方式(店内展示、发放传单、推销员展示、广播广告)有无差异。该地区有几百个销售网点,经费有限只随机选取了18个网点,记录了固定时间段内使用某种广告方式的销售额(为减小误差,各网点重复测量两次):变量area表示网点;adstype表示广告类型:1=店内展示,2=发放传单,3=推销员展示,4=广播广告;sales表示销售额。由于网点是随机选取的,若重复研究重新抽取的网点可能完全不同,故变量are

    25、a属于随机因素。注:若对区域进行细分归类,每类区域选代表网点,则不是随机因素。【分析】【一般线性模型】【单变量】,打开“单变量”窗口,将变量“sales销售额”选入【因变量】框,将“adstype广告类型”选入【固定因子】框,将“area网点”选入【随机因子】框;点【确定】得到主体间效应的检验因变量: 销售额源III 型平方和df均方FSig.截距假设642936.6941642936.6941179.661.000误差9265.30617545.018aadstype假设5866.08331955.36120.094.000误差4962.9175197.312barea假设9265.30617545.0185.601.000误差4962.9175197.312badstype * area假设4962.9175197.3121.153.286误差6075.0007284.375ca. MS(area)b. MS(adstype * area)c. MS(错误) 整个方差分析模型的检验结果,注意当模型含有随机因素时,不再进行总模型的检验,而是分别对每个因素做单独检验,并给出单独的误差项。


    注意事项

    本文(SPSS学习系列22 方差分析教学内容.docx)为本站会员主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 冰点文档网站版权所有

    经营许可证编号:鄂ICP备2022015515号-1

    收起
    展开