第一单元计量资料的统计描述Word版.docx
- 文档编号:4847201
- 上传时间:2022-12-10
- 格式:DOCX
- 页数:19
- 大小:175.79KB
第一单元计量资料的统计描述Word版.docx
《第一单元计量资料的统计描述Word版.docx》由会员分享,可在线阅读,更多相关《第一单元计量资料的统计描述Word版.docx(19页珍藏版)》请在冰豆网上搜索。
第一单元计量资料的统计描述Word版
第一单元计量资料的统计描述
【习题】
分析计算题
1.1某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素锌(Zn)的含量(μg/g),资料如下:
40
87
105
113
121
127
133
142
152
168
215
54
88
105
113
121
127
134
143
153
173
220
61
92
106
113
122
127
135
143
153
176
74
94
107
114
124
128
136
143
155
177
77
94
107
116
124
128
137
145
156
180
80
95
109
117
124
128
138
147
156
182
81
96
109
119
125
130
138
147
163
183
82
97
111
119
125
130
138
149
163
186
83
102
112
120
126
131
140
151
166
188
85
105
112
120
126
132
141
151
168
195
(1)编制频数表并绘制直方图,简述频数分布类型和频数分布特征。
(2)计算适当的集中趋势指标和离散程度指标。
1.2某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素铜(Cu)的含量(μg/g),资料如表1,求男性脑卒中患者头发中微量元素铜的平均含量。
表1102名男性脑卒中患者头发中微量元素铜(Cu)的含量/(μg·g-1)频数表
头发中铜的对数值
频数f
0.3500~
1
0.4500~
2
0.5500~
4
0.6500~
3
0.7500~
18
0.8500~
36
0.9500~
22
1.0500~
6
1.1500~
3
1.2500~
3
1.3500~1.4500
4
合计
102
1.3某年某地一次伤寒暴发潜伏期的分布情况如表2,计算该年伤寒暴发的
平均潜伏期。
表2某年某地一次伤寒暴发潜伏期频数表
潜伏期/d
发病人数f
3~
3
5~
24
7~
20
9~
17
11~
14
13~
7
15~
6
17~
2
19~
1
21~23
2
合计
96
1.4测得566名成年男子的心率及血压情况如表3,试比较这些指标的离散程度。
表3566名成年男子的心率及血压
指标
心率/(次·min-1)
77.30
12.83
收缩压/kPa
17.17
1.74
舒张压/kPa
10.63
1.25
脉压差/kPa
6.54
1.52
1.5根据1999年某大学的体检资料,得该校312名一年级女大学生的平均
身高
=158.0㎝,标准差S=6.5㎝,请据此资料:
(1)计算其95%频数范围。
(2)试估计该校一年级女大学生身高在156.5~159.2㎝范围内的人数。
(3)试估计该校身高低于152㎝一年级女大学生所占比例。
1.6最佳选择题
(1)下列指标中可以用来描述计量资料的离散程度。
a.
b.
c.
d.
e.
(2)偏态分布资料宜用来描述其集中趋势。
a.
b.
c.
d.
e.
(3)
排除了有序数列两端各的观察值的影响。
a.5%b.10%c.15%d.20%e.25%
(4)离散程度指标中,最容易受极端值影响的是。
a.
b.
c.
d.
e.
(5)可用于比较坐高与头围的变异度。
a.
b.
c.
d.
e.
(6)频数分布两端无确切值的资料,宜用来描述其分布的集中趋势。
a.
b.
c.
d.
e.
(7)两组同质资料,若甲组
小于乙组
,但甲组
大于乙组
,则。
a.甲组
代表性较好b.甲组
代表性较差
c.两组
一样大d.两组
一样大
e.无法判断
(8)分布的资料,
等于
。
a.对称b.正偏态c.负偏态d.偏态e.正态
(9)用
和
可以全面描述分布资料的分布特征。
a.正态b.对称c.正偏态d.负偏态e.任何计量资料
复习思考题
1.7均数、中位数、几何均数的适用范围有何异同?
1.8同一资料的标准差是否一定小于均数?
1.9极差、四分位数间距、标准差、变异系数的适用范围有何异同?
【习题解答】
分析计算题
1.1解:
(1)编制频数表,绘制直方图
1)频数表的编制
①求全距Xmin=40,Xmax=220,全距R=220-40=180(μg/g)
②划分组段n=102,拟分10组;组距=R/组数=180/10=18(μg/g),确定各组段的上下限,见表1.1.1。
③统计各组段频数。
表1.1.1102名男性脑卒中患者发锌含量的频数分布
组段/(μg·g-1)
频数f
频率/%
累计频数
累计频率/%
40~
2
1.96
2
1.96
58~
2
1.96
4
3.92
76~
9
8.82
13
12.75
94~
15
14.71
28
27.45
112~
28
27.45
56
54.90
130~
21
20.59
77
75.49
148~
11
10.78
88
86.27
166~
9
8.82
97
95.10
184~
3
2.94
100
98.04
202~220
2
1.96
102
100.00
合计
102
100.00
-
-
2)绘制直方图,见图1.1.1。
图1.1.1102名男性脑卒中患者发锌含量的频数分布
3)本资料频数分布范围为40~220μg/g;集中分布在94~、112~、130~、148~组段,其中112~组段的频数分布最多;从中央向两侧频数逐渐减少,左右基本对称。
(2)由上述分析可知,本资料呈单峰对称分布,近似正态,故选用
作为描述集中趋势的指标,以
作为描述离散程度的指标。
用加权法求均数:
128.94(μg/g)
由频数表得
13152,
1801182,代入公式:
(μg/g)
SPSS操作
数据录入:
打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量x和标签Zn;再点击DataView标签,录入数据(见图1.1.3,图1.1.4)。
图1.1.3VariableView窗口内定义要输入的变量x和标签Zn
图1.1.4DataView窗口内录入数据
分析:
GraphsHistogram
Variable:
Zn[x]要描述的变量是x,Zn是标签
OK
Analyze
DescriptiveStatistics
Descriptives
Variable[s]:
Zn[x]
OK
1.2解:
本题为对数正态分布资料,应采用几何均数描述其集中趋势。
令发铜含量为X,发铜对数值为lgX
即男性脑卒中患者头发中铜含量的几何均数为8.42μg/g。
SPSS操作
数据录入:
打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量logx和f;再点击DataView标签,录入数据(见图1.2.1,图1.2.2)。
图1.2.1VariableView窗口内定义要输入的变量logx和f
图1.2.2DataView窗口内录入数据
分析:
Data
WeightCases
WeightCasesby
FrequencyVariables:
f权重为f
OK
Analyze
DescriptiveStatistics
Descriptives
Variable[s]:
logx描述变量logx
OK
注:
将结果中的mean求反对数,就可以得到几何均数。
1.3解:
本资料为偏态分布资料,宜用中位数来描述其集中趋势。
天
即该年该地伤寒暴发潜伏期的中位数约为9.12天。
注:
由于本题无原始数据,不宜用统计软件计算中位数。
1.4解:
本资料是比较计量单位不同的多个指标的离散程度,宜用变异系数来描述,根据公式
,计算结果见表1.4.1。
表1.4.1566名成年男子的心率及血压的离散程度比较
指标
CV/%
心率/(次·min-1)
77.30
12.83
16.60
收缩压/kPa
17.17
1.74
10.13
舒张压/kPa
10.63
1.25
11.76
脉压差/kPa
6.54
1.52
23.24
由变异系数可见,脉压差的离散程度最大,其次是心率,而舒张压和收缩压的离散程度较小。
1.5解:
(1)95%频数范围即95%的医学参考值范围,根据题意,得
下限:
cm
上限:
cm
即该校一年级女大学生身高的95%频数范围为(145.26,170.74)cm。
(2)本题为非标准正态分布,需先进行标准化变换。
由于312例为大样本,可用样本均数
和样本标准差S作为总体均数μ和总体标准差σ的点估计值,得
查标准正态分布曲线下的面积表得
Φ(u1)=Φ(-0.23)=0.4090,Φ(u2)=1-Φ(-0.18)=1-0.4286=0.5714
D=Φ(u2)
Φ(u1)=0.5714-0.4090=0.1624=16.24%
故估计该校1999年身高界于156.5~159.2cm范围内的一年级女大学生所占比例为16.24%,估计312名一年级女大学生中身高界于156.5~159.2cm范围内的人数为312×16.24%=50.67
51名。
(3)根据公式
得
查标准正态分布曲线下的面积表得
Φ(u)=Φ(-0.92)=0.1788=17.88%
故估计该校1999年一年级女大学生中身高低于152cm者所占比例为17.88%。
1.6最佳选择题
(1)d
(2)c(3)e(4)a(5)c(6)c(7)b(8)a(9)a
【复习思考题参考答案】
1.7答:
三者的相同点为均用于描述定量资料的集中趋势,其不同点见表1.7.1。
表1.7.1常用平均数的不同点比较
平均数
意义
应用
均数
平均数量水平
对称分布,特别是正态分布或近似正态分布的资料
几何均数
平均增(减)倍数
等比资料;对数正态分布资料
中位数
位次居中的观察值水平
偏态分布;两端无确切值;分布不明确的资料
1.8答:
不一定。
均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料分布特征的两个不同方面。
1.9答:
这四个指标的相同点在于均用于描述计量资料的离散程度。
其不同点为:
极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。
若样本含量相差较大,不宜用极差来比较资料的离散程度。
四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
标准差常用于描述对称分布,特别是正态分布或近似正态分布资料离散程度。
变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度
。
【补充选择题】
A型题
1.统计资料的类型可以分为
A定量资料和等级资料B分类资料和等级资料
C正态分布资料和离散分布的资料D定量资料和分类资料
E二项分布资料和有序分类资料
2.下列符号中表示参数的为
A
B
C
D
E
3.统计学上所说的随机事件发生的概率P,其取值范围为
AP≤1
BP≥1
CP≥0
D1≥P≥0
E1>P>0
4.小概率事件在统计学上的含义是
A指的是发生概率P≤0.5的随机事件
B指一次实验或者观察中绝对不发生的事件
C在一次实验或者观察中发生的可能性很小的事件,一般指P≤0.05
D以上说法均不正确
EA和C正确
5.描述定量资料集中趋势的指标有
A均数、几何均数、变异系数B均数、几何均数、四分位数间距
C均数、变异系数、几何均数D均数、四分位数间距、变异系数
E均数、几何均数、中位数
6.关于频数表的说法正确的是
A都分为10个组段
B每一个组段必须组距相等
C从频数表中可以初步看出资料的频数分布类型
D不是连续型的资料没有办法编制频数表
E频数表中的每一个组段不一定是半开半闭的区间,可以任意指定
7.关于偏态分布资料说法不正确的是
A正偏态资料的频数分布集中位置偏向数值大的一侧
B负偏态资料的频数分布集中位置偏向数值大的一侧
C偏态分布资料频数分布左右不对称
D不宜用均数描述其集中趋势
E不宜用变异系数来描述其离散程度
8.对于一个两端都没有确切值的资料,宜用下列哪个指标来描述其集中趋势
A几何均数
B均数
C方差
D中位数
E四分位数间距
9.下列关于标准差的说法中哪种是错误的
A对于同一个资料,其标准差一定小于均数
B标准差一定大于0
C同一个资料的标准差可能大于均数,也可能小于均数
D标准差可以用来描述正态分布资料的离散程度
E如果资料中观察值是有单位的,那么标准差一定有相同单位
10.下列关于标准差S和样本含量n的说法,正确的是
A同一个资料,其他条件固定不变,随着n增大,S一定减小
B同一个资料,即使其他条件固定不变,随着n增大,也不能确定S一定减小
C同一个资料,其他条件固定不变,随着n增大,S一定增大
D以上说法均正确
E以上说法均错误
11.用下列哪两个指标可以较全面地描述正态分布特征
A均数和中位数B中位数和方差
C均数和四分位数间距D均数和标准差
E几何均数和标准差
12.下列哪个资料适宜用几何均数来描述其集中趋势
A偏态分布的资料B对称分布的资料
C等比级数资料D一端不确定的资料
E正态分布资料
13.下列关于变异系数的说法,错误的是
A与标准差一样都是用来描述资料变异程度的指标,都有单位
B可以比较计量单位不同的几组资料的离散程度
C可以比较均数相差悬殊的几组资料的离散程度
D变异系数的实质是同一个资料的标准差与均数的比值
E变异系数可以用来描述正态分布资料的变异程度
14.假设将一个正态分布的资料所有的原始数据都加上一个正数,下列说法正确的是
A均数将增大,标准差不改变B均数和标准差均增大
C均数不变,标准差增大D不一定
E均数和标准差均没有变化
15.假设将一个正态分布的资料所有的原始数据都乘以一个大于1的常数,下列说法正确的是
A均数不发生改变B标准差将不发生改变
C均数是否变化不一定D变异系数不发生改变
E中位数不发生改变
16.下列关于正态分布曲线的两个参数
和
说法正确的是
A
和
越接近于0时,曲线越扁平
B曲线形状只与
有关,
值越大,曲线越扁平
C曲线形状只与
有关,
值越大,曲线越扁平
D曲线形状与两者均无关,绘图者可以随意画
E以上说法均不正确
17.对于正态分布曲线的描述正确的是
A当
不变时,随着μ增大,曲线向右移
B当
不变时,随着μ增大,曲线向左移
C当μ不变时,随着
增大,曲线向右移
D当μ不变时,随着
增大,曲线将没有变化
E以上说法均不正确
18.在正态曲线下,下列关于μ-1.645
说法正确的是
Aμ-1.645
到曲线对称轴的面积为90%
Bμ-1.645
到曲线对称轴的面积为10%
Cμ-1.645
到曲线对称轴的面积为5%
Dμ-1.645
到曲线对称轴的面积为45%
Eμ-1.645
到曲线对称轴的面积为47.5%
19.在正态曲线下,小于μ-2.58
包含的面积为
A1%
B99%
C0.5%
D0.05%
E99.5%
20.在正态曲线下,大于μ-2.58
包含的面积为
A1%
B99%
C0.5%
D0.05%
E99.5%
21.下列关于标准正态分布的说法中错误的是
A标准正态分布曲线下总面积为1
B标准正态分布是μ=0并且σ=1的正态分布
C任何一种资料只要通过
变换均能变成标准正态分布
D标准正态分布的曲线是唯一的
E因为标准正态分布是对称分布,所以u≥-1.96与u≤1.96所对应的曲线下面积相等
22.某年某中学体检,测得100名高一女生的平均身高
=154cm,S=6.6cm,该校高一女生中身高在143~170cm者所占比重为(
)
A90%
B95%
C97.5%
D94.5%
E99%
23.下列关于确定正常人肺活量参考值范围说法正确的是
A只能为单侧,并且只有上限B只能为单侧,并且只有下限
C只能为双侧,这样才能反映全面D单双侧都可以
E以上说法均不确切
24.下列关于医学参考值范围的说法中正确的是
A医学参考值范围是根据大部分“健康人”的某项指标制定的
B医学参考值范围的制定方法不受分布资料类型的限制
C在制定医学参考值范围时,最好用95%范围,因为这个范围最能说明医学问题
D在制定医学参考值范围时,最好用95%范围,因为这样比较好计算
E以上说法均不正确
25.为了制定尿铅的正常值范围,测定了一批正常人的尿铅含量,下列哪种说法正确
A无法制定,要制定正常值范围必须测定健康人的尿铅含量
B可以制定,应为单侧上限
C可以制定,应为单侧下限
D可以制定,但是无法确定是上侧范围还是下侧范围
E可以制定双侧95%的参考值范围
B型题
26~30题
A中位数
B四分位数间距
C均数
D几何均数
E对数标准差的反对数
26.对于只有上限不知道下限的资料,欲描述其集中趋势宜用
27.某学校测定了大学一年级新生乙肝疫苗的抗体滴度,欲描述其集中位置,宜用
28.描述偏态资料的离散程度,可用
29.描述近似正态分布的资料的集中趋势,最适宜用
30.偏态分布的资料,如果经对数变换后服从正态分布,那么欲描述其离散程度,应选用
补充选择题参考答案
1.D
2.C
3.D
4.C
5.E
6.C
7.A
8.D
9.A
10.B
11.D
12.C
13.A
14.A
15.D
16.C
17.A
18.D
19.C
20.E
21.C
22.D
23.B
24.A
25.B
26.A
27.D
28.B
29.C
30.E
(注:
可编辑下载,若有不当之处,请指正,谢谢!
)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一 单元 计量 资料 统计 描述 Word