欢迎来到冰豆网! | 帮助中心 分享价值,成长自我!
冰豆网
全部分类
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • 党团工作>
  • ImageVerifierCode 换一换
    首页 冰豆网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    SAS学习系列27秩和检验Word格式.docx

    • 资源ID:20882867       资源大小:526.47KB        全文页数:22页
    • 资源格式: DOCX        下载积分:12金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要12金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    SAS学习系列27秩和检验Word格式.docx

    1、二、配对资料的Wilcoxon符号秩检验若两组配对资料近似服从正态分布,则它们差值的检验可以使用配对t检验法;若配对资料的正态分布的假设不成立,可以使用Wilcoxon符号秩检验(非参数检验)。Wilcoxon符号秩检验是对配对资料的差值采用符号秩方法来检验。基本要求是差值数据设置为最小的序列等级和两组配对资料是相关的(配成对)。在两组配对资料的差异有具体数值的情况下,符号检验只利用大于0和小于0的信息,即正号和负号的信息,而对差异大小所包含的信息却未加利用,但Wilcoxon符号秩检验方法既考虑了正、负号,又利用了差值大小,故效率较符号检验法高。基本步骤:1. 假设检验(比较两个总体均值(中

    2、位数)是否有显著差异)H0:两个总体的均值(中位数)相同;H1:两个总体的均值(中位数)不相同;先求出每对数据的差值D,按其绝对值由小到大排列(去掉差值为0的数据,相同值用平均秩),并将其“排列顺序号”编为秩R. 然后将R分成正和负差值的两个部分秩值R+和R-,最后求符号秩和T+=R+, T-=R-(注意:T+ T-=n(n+1)/2);符号秩的平均值为n(n+1)/4. 再构造Wilcoxon符号秩统计量为若H0为真,T+与T-应该有相同的值=n(n+1)/4,因此太大的S值或太小的S值都是拒绝H0的依据。在实际中为了便于计算,常取W=min(T+, T+)作为统计量,W服从Wilcoxon

    3、符号秩分布。查表在显著水平下,关于n的双侧检验的临界值Wb,则得W值的拒绝区域为0, Wb,接受域为Wb, n(n+1)/4,若W统计量20样本,当原H0为真时,统计量T= T+-T-接近于0,其方差为建立检验统计量近似于标准正态分布。由于T= T+-T-= 2T+-n(n+1)/2,故可将上式中的T改写为T+的形式:标准正态分布使用显著水平=0.05时,拒绝区域为z1.96,因为2.241.96,计算出z统计量的值,判断拒绝H0与否。三、SAS实现(PROC UNIVARIATE过程步)例1 检验提高学生某种素质的训练是否有效。随机地选取15名学生作为试验样本,在训练开始前做了一次测验,每个

    4、学生的素质按优、良、中、及、差打分,经过三个月训练后,再做一次测试对每个学生打分(素质提高用+表示,降低用表示,无变化用0表示)。表1 训练前后的素质比较学生编号训练之前训练之后差异符号1中优2及格良34差56789101112131415为了处理,先对定性资料进行量化:用1,2,3,4,5,分布表示差、及格、中、良、优。代码:data training;input before after ;d= after-before;datalines;3 5 2 4 4 3 1 3 4 43 5 1 2 4 5 3 1 1 33 5 2 4 3 2 3 5 1 3;run;proc print da

    5、ta = training;title 原始数据proc univariate data = training;var d;运行结果及说明:注意:只能调用univariate过程,而不能调用means过程来进行符号检验。分析变量为单样本数据集training中的d变量。符号检验统计量M(Sign)=4,它是取正符号和负符号两者之间的小者作为检验统计量(?)Pr=|M|计算的概率是二项分布的两尾概率之和,因此它是双侧检验,检验正符号和负符号是否相同,结果为0.0574。在显著水平设定为0.1时,由于0.05740.05,则变为不能拒绝原假设。但是,如果用考虑差值d大小的信息的Wilcoxon符号

    6、秩检验,即Sgn Rank,由于0.01540.05配对资料如果其差值不是具体数字,只能用符号检验。但如果差值有具体数字,而使用符号检验,相当于只利用了它的“+”、“-”,而对数字大小中所包含信息却未加利用。此时,若符合正态分布则使用配对资料的t检验;若不符合正态分布则用Wilcoxon符号秩检验。差值D的正态性检验的结果为0.53380.05,因此不能拒绝差值D具有正态性。因为制造商拒绝相信差值D具有正态性,所以采用Wilcoxon符号秩检验。Wilcoxon符号秩统计量S=22。SAS建议在n20时,Pr=|S|的概率由S的精确分布计算,而S的分布是尺度二项分布的卷积,所以精确结果为p值=

    7、0.0234 20时,将符号秩统计量S标准化成自由度为1的t统计量来计算显著水平(注意跟前文的转换成标准正态分布略有不同),原因是当较大时,t分布渐近标准正态分布。另外,SAS系统在计算秩统计量S的方差时,用结值来修正方差。p值=0.0194 0减0.5修正,对于Wx- 0加0.5修正。二、PROC NPAR1WAY过程步(单因子非参数方差分析)NPAR1WAY过程,是分析变量的秩,并计算几个基于经验分布的函数和通过一个单因子分类变量的响应变量确定的秩得分的统计量。 秩的得分计算有:Wilcoxon得分、中位数得分、Savage得分和Van der Waerden得分等。然后再由秩得分计算简单

    8、的线性秩统计量,由这个秩统计量可以检验一个变量的分布在不同组中是否具有相同的位置参数,或者在EDF检验下,检验这个变量分布在不同组中是否分布相同。秩得分的统计量也可以先用proc rank过程计算秩得分,然后用proc anova过程分析这些秩得分而得到。秩得分计算,用线性秩统计量:其中Ri为第i个观察的秩,a(Ri)为秩得分,Ci是一个指示向量(由0和1组成),它表示了第i个观察所属的类,n是观察的总数。下面介绍NPAR1WAY过程的四种不同的a(Ri)秩得分的计算:(1)Wilcoxon得分a(Ri) = Ri它对Logistic分布的位置移动是局部最优的。在计算两样本情况下的Wilcox

    9、on秩和统计量时,过程对零假设下的渐近标准正态分布的Z统计量进行一个连续的0.5校正。(2)Median得分又称为中位数得分。当观察的秩大于中位点时,中位数得分为1,否则为0. 对于双指数分布,中位数得分是局部最优。(3)Van der Waerden得分简称为VW的得分,是对正态分布的次序统计量的期望值的近似:a(Ri) = F-1(Ri/(n+1)其中F-1(x)是标准正态的累积分布函数的反函数,这个得分对正态分布是最优的。(4)Savage得分是指数分布的次序统计量的期望值,减去1使得得分以0为中心:它在指数分布中比较尺度的不同性或在极值分布中的位置移动上是最优的。基本语法:PROC N

    10、PAR1WAY data=数据集 BY 变量;CLASS 变量;EXACT 统计量选项;FREQ 变量;OUTPUT VAR 变量列表;说明:(1)可选项:ANOVA方差分析CONOVER协方差分析D运用Kolmogorov-Smirnov (D)统计量评分进行分析KLOTZ运用Klotz评分进行分析MEDIAN运用中位数评分进行分析MOOD运用Mood评分进行分析SAVAGE运用Savage评分进行分析(指数分布)SCORES=DATA以原始数据为评分值进行分析ST运用Siegel-Tukey评分进行分析VW/NORMAL运用Van der Waerden评分进行分析(通过应用反正态分布累积

    11、函数得到近似的正态得分)WILCOXONKruskal-Wallis秩和检验EDF计算基于经验分布函数的统计量(2)EXACT语句,对指定的统计量(选项)进行精确概率的计算。例3某航空公司的CEO注意到飞离亚特兰大的飞机放弃预定座位的旅客人数在增加,他想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预定座位的旅客。获得一个从亚特兰大起飞的9次航班和从芝加哥起飞的8次航班上放弃预定座位的旅客人数样本。表3 放弃预定座位的旅客人数及统一秩值航班次数亚特兰大(组)芝加哥(放弃人数统一编秩1816202417222125秩和96.556.5data noshows ;do group=

    12、1 to 2; input n; do i=1 to n; input x ; output; end;end;drop i n;11 15 10 18 11 20 24 22 2513 14 10 8 16 9 17 21proc print data = noshows;proc npar1way data = noshows wilcoxon;class group;var x;选项wilcoxon要求进行wilcoxon秩和检验。要注意,若两组样本是配对样本,应该使用配对t检验或wilcoxon符号检验,因为使用wilcoxon秩和方法,将损失配对信息。组1和组2的秩和分别为96.50

    13、和56.50。原假设H0为真时(组1和组2的总体分布相同),期望秩值分别为(96.50+56.50)9/(9+8)=81.08/(9+8)=72.0标准差为10.3795614,每组平均得分分别为96.50/9=10.722222256.50/ 8=7.0625000Wilcoxon两样本秩和统计量(较小的秩和)S = 56.5000,正态近似检验统计量Z = -1.44515(连续性修正因子为0.5,加在分子上),正态分布的双尾p值之和为0.1484 = 0.05,不能拒绝原假设H0.同时还给出了近似t检验和卡方检验的结果:近似t检验的p值=0.1677,近似卡方检验统计量为2.2300,自

    14、由度为1,p值=0.1354。结果都是相同的,不能拒绝原假设H0.(四)完全随机设计的Kruskal-Wallis秩和检验一、概述方差分析,可以检验三个或更多总体的均值是否相等的问题,数据是被假设成具有正态分布和方差齐性(相等的方差),此时F检验才能奏效。但有时数据不能完全满足这些条件,不妨将数据转换成秩统计量(秩统计量的分布与总体分布无关),可以摆脱总体分布的束缚。在比较两个以上的总体时,广泛使用非参数的Kruskal-Wallis秩和检验,它是对两个以上的秩样本进行比较,本质上它是两样本时的Wilcoxon秩和检验方法在多于两个样本时的推广。Kruskal-Wallis秩和检验,首先要求从

    15、总体中抽取的样本必须是对立的,然后将所有样本的值混合在一起看成是单一样本,再把这个单一的混合样本中值从小到大排序,序列值替换成秩值,最小的值给予秩值1,多个相同值时用平分秩值。将数据样本转换成秩样本后,再对这个秩样本进行方差分析,但此时构造的统计量KW不是组间平均平方和除以组内平均平方和,而是组间平方和除以全体样本秩方差。这个KW统计量是我们判定各组之间是否存在差异的有力依据。二、基本原理设有k组样本,ni是第i组样本中的观察数,n是所有样本中的观察总数,Ri是第i组样本中的秩和,Rij是第i组样本中的第j个观察值的秩值。需要检验的原假设H0为各组之间不存在差异,或者说各组的样本来自的总体具有

    16、相同的中心或均值或中位数。在H0为真时,各组样本的秩平均应该与全体样本的秩平均比较接近:所以组间平方和为恰好是刻划该接近程度的一个统计量,除以全体样本秩方差消除量纲的影响。样本方差的自由度为n-1,所以全体样本的秩方差为:因此,Kruskal-Wallis秩和统计量KW为:若样本中存在多个相同值(结值)则需要调整KW公式,校正系数C为:其中,其中j为第j个结值的个数。调整后的KWc统计量为:KWc = KW / C如果每组样本中的观察数目至少有5个,那么样本统计量KWc非常接近自由度为k-1的卡方分布。因此,我们将用卡方分布来决定KWc统计量的检验。三、SAS实现(PROC NPAR1WAY过

    17、程步)例4某制造商从来自3个大学的雇员中随机地抽取了3个独立样本,想知道来自这3个不同大学的雇员在管理岗位上的表现是否有所不同。表4来自三个不同大学雇员得分及统一秩值雇员大学A大学B大学C60507030858015.595409018.53575组A秩和组B秩和27组C秩和88data colleges ;do group=1 to 3;25 70 60 85 95 90 8060 20 30 15 40 3550 70 60 80 90 70 75proc npar1way data = colleges wilcoxon;运行结果:组1、组2和组3的秩和分别为95.0、27.0和88.0

    18、; 原假设H0(组1、组2、组3的总体分布相同)为真时,期望秩值分别为(95+27+88)7/(7+6+7)=73.506/(7+6+7)=63.00各组的标准差分别为12.5718985、12.0786894、12.5718985。每组平均得分分别为95/7=13.5714286、27/ 6=4.50、88/7=12.5714286。各组的总体均值相等。按修正公式修正后的多样本的Kruskal-Wallis秩和检验统计量为8.9839,用自由度为DF=3-1=2的卡方分布近似,得到大于近似卡方检验统计量8.9839的概率为p =0.0112=0.05,拒绝H0, 表明各组的总体分布的差异是有统计学意义的。根据平均秩和的结果,组1的最高,组2的最低,因此至少组1和组2的差异是显著的。例5 对于例4,也可以用freq过程,在tables语句中选项用scores=rank和cmh,查看第二项统计量即为Kruskal-Wallis检验。proc freq data = colleges formachar= |-


    注意事项

    本文(SAS学习系列27秩和检验Word格式.docx)为本站会员主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 冰点文档网站版权所有

    经营许可证编号:鄂ICP备2022015515号-1

    收起
    展开