04t检验和u检验.docx
- 文档编号:3903176
- 上传时间:2022-11-26
- 格式:DOCX
- 页数:12
- 大小:38.82KB
04t检验和u检验.docx
《04t检验和u检验.docx》由会员分享,可在线阅读,更多相关《04t检验和u检验.docx(12页珍藏版)》请在冰豆网上搜索。
04t检验和u检验
第四章数值资料的统计推断
(一)——t检验和u检验
数值资料的参数统计推断,按推断目的不同分为两大类:
总体参数的区间估计及总体参数的假设检验。
其中应用最广泛的是总体均数的区间估计及总体均数的假设检验。
PROCMEANS过程可以进行总体均数的区间估计,而总体均数的假设检验,依据研究设计类型的不同分别由PROCMEANS过程和PROCTTEST过程完成。
4.1总体均数的区间估计
4.1.1总体均数区间估计的涵义
总体均数的可信区间是以100(1-α)%的可信度给出包含未知总体均数所在的数值范围。
其中α称显著性水平或检验水平,常取α=0.05或0.01。
可信度作为区间估计的准确性度量,区间宽度作为区间估计的精密性度量。
4.1.2总体均数μ区间估计的计算
若样本来自正态总体,且已知样本含量n,样本均数
及样本标准差s,则估计总体均数μ的100(1-α)%可信区间的计算式为:
双侧区间:
下限为:
-tα,ν(双)·s/
上限:
+tα,ν(双)·s/
单侧区间:
>
-tα,ν(单)·s/
或<
+tα,ν(单)·s/
其中ν为自由度,ν=n-1。
4.1.3实例
例4.1对某人群随机抽取20人,用某批号的结核菌素作皮试,平均浸润直径为10.9mm,标准差为3.86mm,问这批结核菌在该人群中使用时,皮试的平均浸润直径的95%可信区间?
SAS程序为:
/*THEFOLLOWINGEXAMPLEIS95%CONFIDENCEINTERVALLCLM-UCLM*/;
DATAP25;
MEAN=10.9;S=3.86;N=20;
T=TINV(0.975,N-1);自由度为N-1时双侧0.05的T界值
IN=T*S/SQRT(N);
LCLM=MEAN-IN;
UCLM=MEAN+IN;
RUN;
结果为:
confidenceintervalLCLM-UMLM1
OBSMEANSNTINLCLMUCLM
110.93.86202.0931.80659.09312.706
皮试的平均浸润直径95%的可信区间为9.093~12.706。
4.2总体均数的假设检验—t检验与u检验
4.2.1总体均数的假设检验的涵义
总体均数的假设检验是根据资料的性质和所需要解决的问题,对总体均数建立检验假设,然后选定适当的检验方法计算相应的检验统计量,依据检验统计量相应的抽样分布,确定由样本所提供的信息是否支持所建立的假设,以决定该假设能否成立的统计分析过程。
下面介绍两组总体均数比较的假设检验方法——t检验与u检验。
4.2.2样本均数与已知总体均数比较的t检验及其SAS过程
1.推断目的:
由
与μ0比较推断μ是否等于μ0。
2.适用条件:
随机样本来自总体均数为μ的正态总体。
3.已知条件:
样本例数n,样本均数
标准差s与已知总体均数μ0。
4.检验统计量t值计算:
5.使用的SAS过程:
采用MEANS过程或UNIVARIATE过程,计算观测值与已知总体均数的差值,再对该差值的均数进行t检验。
用UNIVARIATE过程可同时实现对观测值是否服从正态分布作检验(下同)。
6.实例
例4.2某药厂制剂车间用自动装瓶机封装药液,在装瓶机工作正常时,每瓶药液净重500克。
某日随机抽取10瓶成品,称重分别为504,498,496,487,509,476,482,510,469,472。
问这时的装瓶机工作是否正常。
SAS程序:
/*THEFOLLOWINGEXAMPLEIST-TESTOFTYPEⅠ*/;
DATAD1;
INPUTX@@;
Y=X-500;
CARDS;
504498496487509476482510469472
;
PROCUNIVARIATENORMAL;
VARY;
RUN;
运行结果为:
UnivariateProcedure
Variable=Y
Moments
N10SumWgts10
Mean-9.7Sum-97
StdDev15.2392Variance232.2333
Skewness-0.0756Kurtosis-1.59813
USS3031CSS2090.1
CV-157.105StdMean4.819059
T:
Mean=0-2.01284Pr>|T|0.0750
Num^=010Num>03
M(Sign)-2Pr>=|M|0.3438
SgnRank-16Pr>=|S|0.1113
W:
Normal0.932285Pr Quantiles(Def=5) 略 Extremes 略 从上面的结果来看: 正态性检验: W=0.932285,p t检验: T(Mean=0)=-2.01284,Pr>|T|=0.0750>0.05,按α=0.05水平,尚不能 拒绝总体均数为零的假设,即可认为装瓶机工作正常。 例4.3若上例仅已知n=10, =490.3,s=15.2392,及μ0=500,则SAS程序为: DATAA; N=10;MEAN=490.3;SD=15.2392;MU=500;赋初值 T=(MEAN-MU)/(SD/SQRT(N));DF=N-1;计算t统计量及其自由度 P=(1-PROBT(ABS(T),DF))*2;计算此t值对应的概率 PUTTP;结果在LOG窗口输出 RUN; 在LOG窗口输出的结果如下: 11dataa; 12n=10;mean=490.3;sd=15.2392;mu=500; 13t=(mean-mu)/(sd/sqrt(n));df=n-1; 14p=(1-probt(abs(t),df))*2; 15puttp; 16run; -2.0128414420.0749834588 结果同上。 4.2.3配对设计资料的t检验及其SAS过程 1.推断目的: 由对子观测值之差的均数 与μd比较,推断μd是否为零。 2.适用条件: 对子的观测值之差服从正态分布,即d~N(μd,σ2d)。 3.已知条件: 对子数n,差值的均数 及标准差sd。 4.检验统计量t值计算: ν=n—1 5.使用的SAS过程: 采用MEANS过程或UNIVARIATE过程,计算对子观测值之差值,再对该差值的总体均数是否为零进行t检验。 6.实例 例4.4用克矽平雾化吸入治疗矽肺患者7人,测得治疗前后的血清粘蛋白(mg/L)7对观测值如表4.1,据此能否认为治疗会引起患者血清粘蛋白的变化? 表4.1克矽平治疗前后的血清粘蛋白(mg/L) 患者号 1 2 3 4 5 6 7 治疗前 65 73 73 30 73 56 73 治疗后 34 36 37 26 43 37 50 SAS程序: /*THEFOLLOWINGEXAMPLEIST-TESTOFTYPEⅡ*/; DATAP31; INPUTX1X2@@; D=X1-X2; CARDS; 6534733673373026734356377350 ; PROCUNIVARIATENORMAL; VARD; RUN; 运行结果为: UnivariateProcedure Variable=D Moments N7SumWgts7 Mean25.71429Sum180 StdDev11.57172Variance133.9048 Skewness-1.17595Kurtosis1.18317 USS5432CSS803.4286 CV45.00114StdMean4.3737 T: Mean=05.879298Pr>|T|0.0011 Num^=07Num>07 M(Sign)3.5Pr>=|M|0.0156 SgnRank14Pr>=|S|0.0156 W: Normal0.896401Pr Quantiles(Def=5) 略 Extremes 略 从上面的结果来看: 正态性检验: W=0.896401,p T检验: T(Mean=0)=5.879298,Pr>|T|=0.0011<0.05,按α=0.05水平,拒绝H0接受H1,可认为治疗使矽肺患者的血清粘蛋白含量下降。 4.2.4成组设计两样本均数比较的t检验及其SAS过程 1.推断目的: 由 与 比较,推断两样本来自的总体均数μ1与μ2是否相等。 2.适用条件: 两样本来自正态总体。 3.已知条件: 两组的样本含量、样本均数和标准差。 即n1, s1与n2, s2。 4.检验统计量t值计算。 (与两总体方差σ12与σ22是否相同有关) a.方差齐(σ12=σ22)时: ν=(n1-1)+(n2-1) 其中, ,称两样本的合并方差。 b.方差不齐(σ12≠σ22)时: c.两样本方差齐性的F检验 F=max(s12,s22)/min(s12,s22) 5.使用的SAS过程: 采用TTEST过程可实现两样本均数比较的t检验。 下面具体介绍TTEST过程。 4.2.5TTEST过程 TTEST过程执行成组设计的来自正态总体的两个样本均数比较的t检验。 它具有对两样本方差齐性比较的的F检验功能,计算t值与t’值,并给出相应的p值。 1.TTEST过程的语句组成。 *PROCTTESToptions; *CLASSvariable; VARvariable; BYvariable; RUN; 2.TTEST过程的语句说明。 (1)PROCTTEST语句。 格式: PROCTTESToptions; options选择项有: ·Cochran要求在方差不齐条件下用Cochran和Cox法计算t’分布的检验概率水平p值。 ·DATA=SASdataset;指明调用的数据集。 (2)CLASS语句 格式: CLASSvariable; 用以指明一个两水平的分组变量名,它可以是数值型也可以是字符型。 PROCTTEST过程把数据集中的观测按这个变量的两个水平分成对立的两组。 (3)BY语句。 格式与功能同前。 (4)VAR语句。 格式: VARvariable; 指定一组要分析的变量名,其中每一个变量包括两个样本的观测值。 如果缺省,输入数据集中的所有数值变量都包含在分析中。 3.实例 例4.5某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如表4.2,据此判断该地急性克山病患者与健康人的血磷值是否相同。 表4.2克山病患者与健康人血磷值(mmol/L)表 患者组 0.84 1.05 1.20 1.20 1.39 1.53 1.37 1.80 1.87 2.07 2.11 健康组 0.54 1.56 0.64 1.87 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 SAS程序: /*THEFOLLOWINGEXAMPLEIST-TESTOFTYPEⅢ*/ DATAP35; INPUTGROUPN; DOI=1TON; INPUTX@@;OUTPUT; END; CARDS; 111 0.841.051.201.201.391.531.671.801.872.072.11 213 0.540.640.640.750.760.811.161.201.341.351.481.581.87 ; PROCUNIVARIATENORMAL; VARX; BYGROUP; PROCTTEST; VARX; CLASSGROUP; RUN; 运行结果: -------------------------GROUP=1----------------------------- UnivariateProcedure Variable=X Moments N11SumWgts11 Mean1.520909Sum16.73 StdDev0.421793Variance0.177909 Skewness-0.08288Kurtosis-1.16408 USS27.2239CSS1.779091 CV27.73293StdMean0.127175 T: Mean=011.95916Pr>|T|0.0001 Num^=011Num>011 M(Sign)5.5Pr>=|M|0.0010 SgnRank33Pr>=|S|0.0010 W: Normal0.962669Pr -----------------------------GROUP=2--------------------------- UnivariateProcedure Variable=X N13SumWgts13 Mean1.084615Sum14.1 StdDev0.42215Variance0.17821 Skewness0.342064Kurtosis-1.05815 USS17.4316CSS2.138523 CV38.92159StdMean0.117083 T: Mean=09.263628Pr>|T|0.0001 Num^=013Num>013 M(Sign)6.5Pr>=|M|0.0002 SgnRank45.5Pr>=|S|0.0002 W: Normal0.930363Pr TTESTPROCEDURE Variable: X GROUPNMeanStdDevStdErrorMinimumMaximum ----------------------------------------------------------------- 1111.52090.42180.12720.8402.110 2131.08460.42210.11710.5401.870 VariancesTDFProb>|T| --------------------------------------- Unequal2.523921.40.0196 Equal2.523722.00.0193 ForH0: Variancesareequal,F'=1.00DF=(12,10)Prob>F'=1.0000 从上面结果可以看出: 正态性检验: 患者组(group=1): w=0.962669,p 健康组(group=2): w=0.930393,p T检验: 两组方差齐性检验: F’=1.00,prob>F’=1.00。 两总体方差齐。 T检验: t=2.5237,p=0.0193(<0.05)。 结论: 按α=0.05水平,拒绝H0接受H1,可认为克山病患者的血磷值较健康人的要高。 4.3.6大样本的两个样本比较的u检验 1.适用条件: 两个样本含量大于50。 2.已知条件: 两组的样本含量、样本均数和标准差。 即n1, s1与n2, s2。 3.检验统计量计算: 4.实例 例4.6某地抽查25-29岁正常人群的红细胞数,其中男性156人,得均数4.65×1012/L,标准差为0.55×1012/L;女性74人,得均数4.22×1012/L,标准差0.44×1012/L。 问该人群男、女红细胞数有无差异。 SAS程序: DATAP33; N1=156;MEAN1=4.65;SD1=0.55; N2=74;MEAN2=4.22;SD2=0.44; U=(MEAN1-MEAN2)/SQRT(SD1**2/N1+SD2**2/N2);计算u值 P=(1-PROBNORM(ABS(U)))*2;计算概率p PUTUP;在LOG窗口输出 RUN; 在LOG窗口输出的结果为: 22Datap33; 23N1=156;mean1=4.65;sd1=0.55; 24N2=74;mean2=4.22;sd2=0.44; 25U=(mean1-mean2)/sqrt(sd1**2/n1+sd2**2/n2); 26P=(1-probnorm(abs(u)))*2; 27Putup; 28Run; 6.37102146761.877734E-10 NOTE: ThedatasetWORK.P33has1observationsand8variables. NOTE: TheDATAstatementused0.05seconds. 结果为: u=6.371,p=1.878×10-10。 按α=0.05水平,拒绝H0接受H1,可认为该地男、女红细胞数不同,男性高于女性。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 04 检验
![提示](https://static.bdocx.com/images/bang_tan.gif)