4统计学模拟题答案.docx
- 文档编号:6451479
- 上传时间:2023-01-06
- 格式:DOCX
- 页数:23
- 大小:89.65KB
4统计学模拟题答案.docx
《4统计学模拟题答案.docx》由会员分享,可在线阅读,更多相关《4统计学模拟题答案.docx(23页珍藏版)》请在冰豆网上搜索。
4统计学模拟题答案
《卫生统计学》模拟试题(A)
一、简答题(每小题7分,共计70分)
1.列举五个描述数值变量离散趋势的指标及其各自的适用条件。
答:
极差:
描述数据分布的范围,极差越大,说明数据分布较分散。
用于初步了解数据的特征,适应于样本量接近的同类资料相比较;四分位数间距:
是从小到大排列后中间一段数据所在的范围,可以用于各种类型的连续型变量;方差:
可用于不同样本含量数据分布离散程度的比较;标准差:
同方差;变异系数:
标准差与算术均数之比,常用于比较度量衡单位不同的多组资料的变异度和比较均数相差悬殊的多组资料的变异度。
2.说明统计学检验中的P与
的区别与联系。
答:
区别在于,
为事先规定的检验水准,也是犯Ⅰ型错误的概率大小;P指从
规定的总体随机抽得等于及大于(等于及小于)现有样本获得的检验统计量值的概率,是获得的事后概率。
联系是,将P与
大小进行比较而得出统计结论。
3.常用的概率抽样方法有哪些?
其中哪一种抽样方法的抽样误差最小?
答:
调查设计常用的抽样方法有单纯随机抽样、系统抽样、整群抽样、分层抽样。
抽样误差最小的是分层抽样。
4.标准化法的目的和基本思想是什么?
答:
当比较的两组或多组率时,其内部构成不同时,标准化的目的就是按统一的“标准”进行调整,使之具有可比性。
5.何谓方差分析?
其应用条件是什么?
列出几种主要的设计类型?
答:
方差分析的基本思想是根据资料的设计类型,即变量的不同来源将全部的观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。
6.对同一组资料的两变量回归分析,如果算出的b有统计学意义,那么两变量的r也有统计学意义,你认为这种观点是否正确?
为什么?
答:
正确,同一资料的b和r的假设检验是等价的,b有统计学意义,那么r也有统计学意义。
7.参数统计和非参数统计的主要区别是什么?
答:
参数统计与非参数统计的主要区别是:
(1)资料要求不一样,参数统计要求样本来自总体分布已知,非参数统计对资料分布无特殊要求。
(2)参数统计对总体参数进行估计和检验,非参数统计不对总体参数进行估计和检验。
8.何谓抽样误差?
用什么指标反映抽样误差?
答:
由于个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差。
均数的标准误反映样本均数间的离散程度,也反映了样本均数与总体均数间的差异,说明均数抽样误差的大小。
9.在“用孕雌素制剂治疗老年良性前列腺肥大”研究中,用药物治疗12例良性肥大,有7例改善;对照组有12例,仅3例改善。
经检验高度显著(P=0.005)。
故可以认为用孕雌素治疗老年良性前列腺肥大有效。
请对此结论作出评价。
答:
由于例数小于40,所以应该用确切概率法。
10.什么是截尾值?
包括哪几种情况?
答:
由于失访、改变防治方案、研究工作结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。
从起点至截尾点所经历的时间,称为截尾值。
二、计算分析题(共计30分)
1.用两种方法检查已确诊为尿铅阳性的患者120名。
湿式热消化法检出的阳性率为60%。
硝酸-高锰酸钾冷消化法检出的阳性率为50%,两法同时检出的阳性率为35%。
问:
(1)该资料属于何种类型的资料?
研究属于何种设计方案?
(2分)
(2)列出数据整理后的表格。
(3分)
(3)两种方法检出的结果是否有差别?
(写出具体的分析步骤,可不计算出最终的结果)(10分)
1、答:
(1)该资料为计数资料,配对设计类型。
(2)资料整理为下面的四格表:
两种检测方法的结果比较
硝酸-高锰酸钾冷消化法
湿式热消化法
合计
+
-
+
42
18
60
-
30
30
60
合计
72
48
120
(3)用配对设计四格表
检验
:
两种方法的结果无差别
:
两种方法的结果有差别
查
界值表,
,P>0.05,差异无统计学意义,尚不能认为两种方法的结果有差异。
2.比较两种药物对红斑狼疮的治疗效果,资料如下:
红斑狼疮的疗效
结果
例数
A药
B药
痊愈
41
54
显效
36
36
进步
23
18
无效
5
6
合计
105
114
试问:
(1)该资料属何种类型?
(1分)
(2)该资料属何种设计?
(2分)
(3)两药的治疗效果有无差别?
(写出具体的分析计算步骤,可不计算出最终的结果)(12分)
2、答:
(1)该资料的变量属等级资料类型。
(2)该资料的设计属于成组设计类型。
(3)要比较药物的疗效有无差别,由于是单向有序的资料,可以用成组设计两样本比较的秩和检验。
建立检验假设,确定检验水准
:
两种药物的疗效无差别
:
两种药物的疗效有差别
编秩:
两种药物的疗效比较
结果
例数
合计
秩次
范围
平均
秩次
秩和
A组
B组
A组
B组
痊愈
41
54
95
1~95
48
1968
2592
显效
36
36
72
95~167
131
4716
4716
进步
23
18
41
168~208
188
4324
3384
无效
5
6
11
209~219
214
1070
1284
合计
105
114
219
12078
11976
计算检验统计量
检验统计量
=12078,这里需要用
检验。
相同的秩次太多,还要进行校正。
确定P值和得出推断结论
查
界值表,若P≤0.05,差别有统计学意义,可以认为两种药物的疗效不同;若P>0.05,差别无统计学意义,尚不能认为两种药物疗效不同。
《卫生统计学》模拟试题(B)
一、简答题(每小题7分,共70分)
1.简述描述定量变量的集中趋势的几种指标。
答案:
平均数
表示方法
计算方法
意义
适用条件
均数
μ,
平均数量水平
单峰对称分布,特别是正态分布
几何均数
G
平均增减倍数
等比资料;对数正态分布
中位数
M
(n为奇数时)
(n为偶数时)
位次居中的观察值水平
偏态分布;分布不明;分布末端有不确定值
2.请说明
与
的区别
答案:
表示的是呈正态分布的变量的95%双侧参考值范围,即正常人群中95%的人该指标的取值范围。
但是当原变量不服从正态分布,则不应用正态分布法估计参考值范围,而应用百分位数法;
表示的是总体均数的95%双侧可信区间,即该可信区间有95%的可能性包括了真实的总体均数。
并且,无论原变量服不服从正态分布,只要样本含量足够,则根据大数定理都是成立的。
3.简述
与
的区别?
答案:
回归直线
是统计学上用来描述某变量随另一变量变化而变化依存关系的线形方程,其中
是指X取某特定值时,总体均数
的一个估计值,所以
与X不是一一对应的关系,是条件均数的关系。
而
是线形函数,有严格的一一对应关系。
4.有人认为“凡是均数间的比较,都需进行假设检验”,你同意这种说法吗?
为什么?
答案:
如果资料收集采用的是抽样调查获得的样本数据,那么必须利用样本信息,通过假设检验的方法来推断两个样本所代表的总体间是否存在差别;但如果资料收集采用的是普查,那得到的就是研究总体的数据,此时就无需进行假设检验,而直接将总体参数进行比较即可。
5.某医师对某试验所得的两组计量资料作秩和检验,其有关数据为n1=12,T1=68;n2=10,T2=78;则T为多少?
相应的P值为多少?
答案:
(据n1、n2查两样本秩和检验的T界值表得T0.05=84-146,T0.01=76-154)。
成组设计两样本比较的秩和检验,若两组例数不等,应以样本例数较小者对应的秩和为统计量
。
本例中
,所以取
。
查
界值表,若
值在界值范围内,其
值大于相应的概率,若
值等于界值或在界值范围外,其
值等于或小于相应的概率。
所以
。
6.单因素方差分析变异分解中
成立吗?
为什么?
答案:
不正确。
方差分析的变异分解是对总变异进行分解,单因素方差分析可将总变异分解为组间变异和误差变异两部分,即
,而
、
、
分别为总均方、组间均方和误差均方,其之间并无上述的数学表达关系式。
7.某药治疗糖尿病的临床试验结果经t检验得P<0.05,按α=0.05水准拒绝H0。
但某医生怀疑检验效能是否足够大,你认为这种怀疑对吗?
简述其理由。
答案:
不正确。
检验效能(1-β)是与Ⅱ型错误相联系,其统计学意义是若总体间确有差别,按现有的α水准能检出其差别的能力。
即是在不拒绝
的情况下才考虑检验效能是否足够的问题,本例中已经拒绝
,已经检验出总体有差别,说明检验效能已经足够。
8.某研究采用冷原子吸收法检测了某电子管工厂工人(汞接触组)的血汞浓度和普通人群(非接触组)的血汞浓度,得到以下结果:
表1两组血汞结果的对比
经成组设计两样本t检验得t=13.254,由t0.01,80=2.639,P<0.01,表明两组血汞含量差异有统计学意义,以上分析正确吗?
请从统计描述和统计推断两方面来说明并给出理由。
答案:
统计描述部分:
根据常识,由于血汞不服从正态分布,多呈正偏态分布,因此应该使用中位数描述其集中趋势,用百分位数法来描述其95%频数范围,且血汞只有单侧上限,因此求解95%上限是正确的。
统计推断部分:
t检验的适用条件必须是服从正态分布的变量,而血汞呈偏态分布,因此采用t检验是错误的,应该采用成组设计的两样本Wilcoxon检验,或者对血汞对数值作成组设计两样本t检验。
9.经调查得甲、乙两个城市女性的肺癌粗死亡率分别为45.6/10万和44.2/10万,按年龄构成标化后,两城市的肺癌标化率均为44.8/10万,请解释此现象及其原因。
答案:
造成此差异的原因是甲乙两城市的年龄构成不同。
甲城市的肺癌粗死亡率经年龄标化后降低,而乙城市的肺癌粗死亡率经年龄标化后升高,说明甲城市的年龄构成较乙城市年轻,即甲城市年轻人比重大,而乙城市老年人比重大。
10.为比较乳腺癌的A、B两种治疗方案的治疗效果,将60例乳腺癌患者随机分为两组,分别采用两种治疗方案治疗并随访,得到A方案的平均生存时间和标准差分别为86.67月、19.51月,B方案的平均生存时间和标准差分别为92.69月、20.75月,经t检验得
,可以认为两种治疗方案的治疗效果无差异。
该统计分析方法是否正确?
为什么?
答案:
不正确。
生存资料的特点是生存时间分布比较复杂,呈非正态分布,因此不应该用平均生存时间来描述其集中趋势,而应采用中位生存时间。
且不能用t检验对两种方案乳腺癌病人的生存过程进行比较,应采用生存分析对病人的生存时间进行比较。
二、计算分析题(共30分)
1.已知110名7岁男童身高
,现欲估计该地身高界于112.70cm到129.70cm范围内的7岁男童比例及110名7岁男童中身高界于112.70~129.70cm范围的人数(写出具体的分析步骤,可不计算出最终的结果)(15分)
答案:
先作标准化变换。
本题虽不知
的确切值,但由于110例是一个大样本,故可用样本均数和样本标准差作为
的估计,故:
查标准正态分布表得:
,
故估计该地身高界于112.70~129.70cm范围内的7岁男童比例为92.5%;估计110名7岁男童中有
名男童的身高界于112.70cm到129.70cm范围内。
2.用两种方法检查已确诊为血铬阳性的患者300名。
用FIA-化学发光法检出的阳性率为56%。
用电热原子吸收法检出的阳性率为48%,两法同时检出的阳性率为30%。
试问:
(1)列出数据整理后的表格。
(3分)
(2)该资料属于何种类型的资料?
(1分)
(3)该研究属于何种设计方案?
(1分)
(4)两种方法检出的结果是否有差别?
(10分)
(写出具体的分析计算步骤,可不计算出最终的结果)
答案解:
(1)数据整理成如下表所示的配对设计四格表形式:
两种检查方法的结果比较
电热原子吸收法
FIA-化学发光法
合计
+
-
+
90
54
144
-
78
78
156
合计
168
132
300
(2)该资料是两分类的分类变量;
(3)实验设计类型为配对设计;
(4)采用配对设计四格表的
检验,比较两种方法测定结果有无差异。
H0:
两法总体阳性检出率无差别,即B=C,
H1:
两法总体阳性检出率不同,即B≠C;
α=0.05。
由于b+c=54+78=132≥40,因此不需做连续性校正:
查
界值得P<0.005,按α=0.05水准拒绝H0,接受H1,故可认为两法的阳性检出率不同。
参照所得结果,说明电热原子吸收法阳性检出率较高。
《卫生统计学》模拟试题(C)
一、填空题(22分)
1.统计工作的基本步骤为①_设计,②_收集资料、,③_整理资料__④分析资料__。
这四个步骤互相联系,不可分割。
但其中_设计是最关键的一步。
2.某检验师测得159名正常钢铁工人的血红蛋白平均值为2.325mmol/L,标准差为0.0775mmol/L。
同时测定了这些工人的红细胞数,得其平均值为
,标准差为
。
欲比较两检验结果的变异度,宜用变异系数
3.在t检验中,若要同时缩小α和β,唯一的办法是增大样本含量。
4.常用的相对数有率,构成比、比。
5.Poisson分布是指当_n较大,
较小时,作为二项分布的特例。
6.作行
列表χ2检验时,对理论数太小有三种方法:
①_合并,②_删除③增加样本量_。
7.两样本比较的秩和检验属于_非参数统计方法,该法的主要缺点是_对于可以用参数统计的资料统计效能较低。
8.常用的抽样方法有单纯随机抽样、系统抽样、整群抽样、分层抽样。
9.在直线相关与回归分析中,b=1.84(P<0.05),这里b的含义为_X每改变一个单位,y平均改变1.84个单位_,而r=0.9(P<0.05),这里r2的含义为在总变异中,回归可以解释的比例为81%。
二、是非判断并改错(30分)
1.在比较同性别、同年龄儿童的体重和肺活量变异度何者为大时,应采用标准差。
答案:
不正确。
因为对于度量衡单位不同或均数相差较大的两组或多组计量资料变异程度大小的比较不宜用标准差,而应用变异系数。
2.某资料假设检验的结果为P<0.05,按
=0.05水准拒绝H0,接受H1,但怀疑其检验效能可能不够大。
答案:
不正确。
因为该资料假设检验的结果为P<0.05,按
=0.05水准拒绝H0,接受H1,只可能犯I型错误,而不可能犯II型错误。
而检验效能1-
是否足够大与犯II型错误有关,只有当不拒绝H0,可能犯II型错误时,才可怀疑检验效能是否足够大。
3.均数是反映定量资料集中趋势最可靠的指标。
答案:
不正确。
均数是反映正态或近似正态分布资料的集中趋势的可靠指标,在偏态分布资料中均数并不是反映资料的集中趋势的可靠指标。
4.由于秩和检验不必考虑总体分布特征,因此在作两组定量资料比较的假设检验时它应为首选的检验方法。
答案:
不正确。
因为参数统计和非参数统计有不同的适用条件。
当资料符合参数统计条件时,其统计效能高于非参数统计;如果不符合参数统计条件而使用参数统计方法时可能会得出错误的结论。
5.对同一组资料,如相关分析算出的r越大,则回归分析算出的b也越大。
答案:
不正确。
r表示两变量相关关系的密切程度与方向,回归系数b是反映两变量之间依存变化的数量关系。
两者在数量上不成正比的关系。
三、简答题(25分)
1.描述数值变量集中趋势的指标有哪些?
它们的适用条件是什么?
答案:
适用条件如下:
均数:
对称分布,特别是正态分布或近似正态分布的资料。
中位数:
偏态分布;两端无确切值;分布不明确的资料。
几何均数:
等比资料;对数正态分布资料。
2.什么是医学参考值范围和可信区间?
它们的意义有何不同?
答案:
医学参考值范围是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标值的范围。
可信区间指的是按100(1-α)%估计总体均数所在的范围。
医学参考值范围的意义在于判断某指标是否正常,可信区间的意义在于计算总体均数所在范围。
3.简述P与α的区别与联系。
答案:
P与α区别:
α是事先人为设定的检验水准。
可以根据具体情况设定其值,一般设置为0.05,P值是按照检验H0成立时计算出的事件发生的概率。
P与α联系:
(1)计算出的P值可与预先规定的α值相比较得出统计推断结论。
(2)若P≤α,说明H0是小概率事件,可以认为在一次试验中不会发生,下统计学结论拒绝H0,接受H1。
(3)若P>α,说明H0不是小概率事件,下统计学结论尚不能拒绝H0,检验结果无统计学意义。
4.对同一资料,又出于同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准?
答案:
不正确。
因为参数统计和非参数统计有不同的适用条件。
当资料符合参数统计条件时,其统计效能高于非参数统计;如果不符合参数统计条件而使用参数统计方法时可能会得出错误的结论。
5.简述调查研究与实验(试验)研究的主要区别。
答案:
调查研究的特点:
(1)观察性研究。
(2)没有认为施加的干预措施。
(3)无随机分配。
实验研究则与之相反。
四、计算分析题
1.对150名冠心病患者用两种方法检查室壁收缩运动的情况,检测结果如下:
两种方法检查室壁收缩运动情况
甲法测定结果乙法测定结果合计
正常减弱异常
正常603265
减弱042951
异常891734
合计685428150
试问:
(1)该资料属何种类型?
(1分)
(2)该资料为何种设计?
(1分)
(3)两种测定方法结果有无相关?
(写出计算分析的步骤,可不计算出具体结果)(10分)
答案:
(1)分类资料
(2)配对设计
(3)H0:
两种方法的结果无相关关系
H1:
两种方法的结果有相关关系
=0.05
如果P>0.05,按
=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为两种方法有相关关系。
如果P<0.05按
=0.05水准,拒绝H0,差别有统计学意义,可以认为两种方法有相关关系。
2.用两种方法治疗胃溃疡患者,A方法治疗31人,治疗结束后有20人有效,B方法治疗11人,治疗结束后5人有效。
(1)该资料属何种类型,何种设计方法?
(2分)
(2)两种治疗方法的疗效有无差别?
(9分)
答案:
(1)分类资料,随机对照设计(成组设计)
(2)两种治疗方法的疗效
有效
无效
总计
甲法
20
11
31
乙法
5
6
11
总计
25
17
42
H0:
两种方法的检查结果相同
H1:
两种方法的检查结果不同
=0.05。
因有理论值小于5大于1,同时
大于40,故需对
值进行校正。
,
=1
查统计界值表,
,P>0.05,按
=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为两种检查方法的结果不同。
《卫生统计学》模拟试题(A)
参考答案
一、简答题
1、答:
极差:
描述数据分布的范围,极差越大,说明数据分布较分散。
用于初步了解数据的特征,适应于样本量接近的同类资料相比较;四分位数间距:
是从小到大排列后中间一段数据所在的范围,可以用于各种类型的连续型变量;方差:
可用于不同样本含量数据分布离散程度的比较;标准差:
同方差;变异系数:
标准差与算术均数之比,常用于比较度量衡单位不同的多组资料的变异度和比较均数相差悬殊的多组资料的变异度。
2、答:
区别在于,
为事先规定的检验水准,也是犯Ⅰ型错误的概率大小;P指从
规定的总体随机抽得等于及大于(等于及小于)现有样本获得的检验统计量值的概率,是获得的事后概率。
联系是,将P与
大小进行比较而得出统计结论。
3、答:
调查设计常用的抽样方法有单纯随机抽样、系统抽样、整群抽样、分层抽样。
抽样误差最小的是分层抽样。
4、答:
当比较的两组或多组率时,其内部构成不同时,标准化的目的就是按统一的“标准”进行调整,使之具有可比性。
5、答:
方差分析的基本思想是根据资料的设计类型,即变量的不同来源将全部的观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。
6、答:
正确,同一资料的b和r的假设检验是等价的,b有统计学意义,那么r也有统计学意义。
7、答:
参数统计与非参数统计的主要区别是:
(1)资料要求不一样,参数统计要求样本来自总体分布已知,非参数统计对资料分布无特殊要求。
(2)参数统计对总体参数进行估计和检验,非参数统计不对总体参数进行估计和检验。
8、答:
由于个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差。
均数的标准误反映样本均数间的离散程度,也反映了样本均数与总体均数间的差异,说明均数抽样误差的大小。
9、答:
由于例数小于40,所以应该用确切概率法。
10、答:
由于失访、改变防治方案、研究工作结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。
从起点至截尾点所经历的时间,称为截尾值。
二、计算分析题
1、答:
(1)该资料为计数资料,配对设计类型。
(2)资料整理为下面的四格表:
两种检测方法的结果比较
硝酸-高锰酸钾冷消化法
湿式热消化法
合计
+
-
+
42
18
60
-
30
30
60
合计
72
48
120
(3)用配对设计四格表
检验
:
两种方法的结果无差别
:
两种方法的结果有差别
查
界值表,
,P>0.05,差异无统计学意义,尚不能认为两种方法的结果有差异。
2、答:
(1)该资料的变量属等级资料类型。
(2)该资料的设计属于成组设计类型。
(3)要比较药物的疗效有无差别,由于是单向有序的资料,可以用成组设计两样本比较的秩和检验。
建立检验假设,确定检验水准
:
两种药物的疗效无差别
:
两种药物的疗效有差别
编秩:
两种药物的疗效比较
结果
例数
合计
秩次
范围
平均
秩次
秩和
A组
B组
A组
B组
痊愈
41
54
95
1~95
48
1968
2592
显效
36
36
72
95~167
131
4716
4716
进步
23
18
41
168~208
188
4324
3384
无效
5
6
11
209~219
214
1070
1284
合计
105
114
219
12078
11976
计算检验统计量
检验统计量
=12078,这里需要用
检验。
相同的秩次太多,还要进行校正。
确定P值和得出推断结论
查
界值表,若P≤0.05,差别有统计学意义,可以认为两种药物的疗效不同;若P>0.05,差别无统计学意义,尚不能认为两种药物疗效不同。
《卫生统计学》模拟试题(B)参考答案
一、简答题
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 模拟 答案