统计学习题及答案.docx
- 文档编号:24226653
- 上传时间:2023-05-25
- 格式:DOCX
- 页数:40
- 大小:56.37KB
统计学习题及答案.docx
《统计学习题及答案.docx》由会员分享,可在线阅读,更多相关《统计学习题及答案.docx(40页珍藏版)》请在冰豆网上搜索。
统计学习题及答案
第一章数据与统计学
一、填空题:
1.统计学的发展史有三个起源,即政治算术学派、 及数理统计学派。
2.在现实生活中,“统计”一词有三种涵义,即 、 及
统计学。
3.同一变量往往有许多变量值,变量按变量值是否连续可分为 和 。
4.凡是客观存在的,并在某一相同性质基础上结合起来的许多个别事物
组成的整体,我们称之为 。
5.按数据的来源渠道划分,数据可分为 和 。
6.统计调查按调查对象所包括被研究总体的范围可分为 和 。
7.抽样误差只存在于 调查中。
8.从总体中抽取的部分基本单位构成的整体称为 。
二、单项选择题:
1.要了解某市工业企业的生产装备情况,则统计总体是( )。
A、 该市全部工业企业
B、 该市每一个工业企业
C、 该市全部工业企业的某个设备
D、 该市工业企业的全部设备
2.对黄冈师院学生学习成绩进行调查,则总体单位是( )。
A、黄冈师院所有的学生 B、黄冈师院每一位学生
C、黄冈师院所有的学生成绩 D、黄冈师院每一位学生成绩
3.对全国城市职工家庭生活进行调查,则总体单位是( )。
A、所有的全国城市职工家庭
B、所有的全国城市职工家庭生活
C、每一户城市职工家庭
D、每一户城市职工家庭生活
4.在全国人口普查中,总体单位是( )
A、每一户 B、每个人 C、每个地区的人 D、全国总人口
5.下列属于数量变量的是( )
A、性别 B、年龄 C、职称 D、健康状况
6.下列属于品质变量的是( )。
A、工人年龄 B、工人性别 C、工人体重 D、工人工资
7.人口普查规定统一的标准时间是为了( )。
A、避免登记的重复与遗漏 B、确定调查的范围
C、确定调查的单位 D、登记的方便
8.全国人口普查中,调查单位是( )。
A、全国人口 B、每一个人 C、每一户 D、工人工资
9.抽样调查的主要目的是()
A、随机抽取样本单位B、对调查单位作深入研究
C、计算和控制抽样误差 D、用样本指标来推算和估计总体指标
10.要了解上海市居民家庭的收支情况,最适合的调查方式是( )
A、抽样调查 B、重点调查 C、典型调查 D、普查
三、多项选择题:
1.下列属于数量变量的有( )。
A、性别 B、工种 C、工资 D、民族 E、年龄
2.下列属于品质变量的有( )。
A、性别 B、工种 C、工资 D、民族 E、年龄
3.统计一词的含义有( )
A、统计工作 B、统计经验 C、统计资料 D、统计管理 E、统计科学
4.普查一般属于()
A、全面调查 B、非全面调查C、经常性调查 D、一次性调查 E、专门组织的调查
第1章习题答案
一、填空题:
1.人口统计学派
2.统计工作 统计资料
3.连续型变量 离散型变量
4.总体
5.直接数据 间接数据
6.普查 抽样调查
7.抽样调查
8.样本
二、单项选择题:
1.D 2.D 3.D 4.B 5. B 6. B 7. A 8. B 9.D 10.A
三、多项选择题:
1.CE 2.ABD 3.ACE 4.ADE
第二章统计数据的描述
一、填空题:
1.统计分组有等距分组与 两大类。
2.频率是每组数据出现的 与全部次数之和的比值。
3.统计分组的关键在于确定 和组距。
4.统计表从形式上看,主要由 、横行标题、纵栏标题和 四部分组成。
5. 是测度集中趋势最主要的测度指标, 是测度离散趋势最主要的测度指标。
6.当平均水平和计量单位不同时,需要用 来测度数据之间的离散程度。
7. 是一组数据中出现次数最多的变量值。
8.对于一组数据来说,四分位数有 个。
二、单项选择题:
1.次数是分配数列组成的基本要素之一,它是指( )。
A、各组单位占总体单位的比重 B、分布在各组的个体单位数
C、数量标志在各组的划分 D、以上都不对
2.某连续变量数列,其末组为600以上。
又如其邻近组的组中值为560,则末组的组中值为( )。
A、620 B、610 C、630 D、640
3.变量数列中各组频率的总和应该是( )。
A、小于1 B、等于1 C、大于1 D、不等于1
4.某连续变量数列,其首组为500以下。
又如其邻近组的组中值为520,则首组的组中值为( )。
A、460 B、470 C、480 D、490
5.在下列两两组合的指标中,哪一组的两个指标完全不受极端数值的影响()
A、算术平均数和调和平均数 B、几何平均数和众数
C、调和平均数和众数 D、众数和中位数
6.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距应取()
A、9.3 B、9 C、6 D、10
7.一项关于大学生体重的调查显示,男生的平均体重是60公斤,标准差为5公斤;女生的平均体重是50公斤,标准差为5公斤.据此数据可以推断()
A、男生体重的差异较大 B、女生体重的差异较大
C、男生和女生的体重差异相同 D、无法确定
8.某生产小组有9名工人,日产零件数分别为10,11,14,12,13,12,9,15,12.据此数据计算的结果是( )
A、均值=中位数=众数 B、众数>中位数>均值
C、中位数>均值>众数 D、均值>中位数>众数
9.按连续型变量分组,最后一组为开口组,下限值为2000。
已知相邻组的组距为500,则最后一组组中值为()
A、2500 B、2250 C、2100 D、2200
10.下列数据是某班所有学生的统计学考试成绩:
72,90,91,84,85,57,90,84,77,84,69,77,66,87,85,95,86,78,86,45,87,92,73,82。
这些成绩的极差是()
A、78 B、50 C、45 D、40
11. 下列关于众数的叙述中,不正确的是( )
A、一组数据可能存在多个众数 B、一组数据可能没有众数
C、一组数据的众数是唯一的 D、众数不受极端数值的影响
三、多项选择题:
1.下列分组哪些是按品质标志分组?
( )
A、职工按工龄分组 B、科技人员按职称分组
C、人口按民族分组 D、企业按所有制分组
E、人口按地区分组 F、职工按收入水平分组
2.下列分组哪些是按数量标志分组( )。
A、职工按工龄分组 B、科技人员按职称分组
C、人口按民族分组 D、企业按所有志分组
E、人口按地区分组 F、职工按收入水平分组
3.下列哪些属于离散程度的测度指标( )。
A、几何平均数 B、极差 C、中位数 D、方差 E、离散系数
4.下列哪些属于集中趋势的测度指标( )。
A、几何平均数 B、极差 C、中位数 D、方差 E、离散系数
四、计算题:
1.从某大学一年级学生中随机抽取36人,对公共理论课的考试成绩进行调查,结果如下:
67 90 66 80 67 65 74 70 87 85 83 75 58 67 54
65 79 86 89 95 78 97 76 78 82 94 56 60 93 88
76 84 79 76 77 76
要求:
(1)根据以上数据将考试成绩等距分为5组,组距为10,并编制成次数分布表,
绘制次数分布直方图;
(2)根据分组后的数据计算考试成绩的算术平均数。
(写出公式、计算过程,结果保留1位小数)
2.某企业1982年12月工人工资的资料如下:
按工资金额分组(元)
工人数
40~50
50~60
60~70
70~80
80~90
90~100
100~110
30
40
100
170
220
90
50
合计
要求:
(1)计算平均工资;
(2)计算工资的众数、中位数、标准差。
3.某车间有两个小组,每组都是7个工人,各人日产的件数如下:
第一组:
20 40 60 70 80 100 120
第二组:
67 68 69 70 71 72 73
这两个组每人平均日产件数都是70件,试计算工人日产量的变异指标:
(1)全距
(2)标准差,并比较哪一组的平均数代表性大?
第2章习题答案
一、填空题:
1.不等距分组 2.频数 3.组数 4.总标题 数据资料
5.均值 标准差 6.离散系数 7.众数 8. 3
二、单项选择题:
1.B 2.D 3.B 4.C 5.D 6.D 7.B 8.A 9.B 10.B 11.C
三、多项选择题:
1.BCDE 2.AF 3.BDE 4.AC
四、计算题:
1、解:
(1)
组距
频数
频率(%)
向下累计(%)
20~30
2
4.00
4.00
30~40
1
2.00
6.00
40~50
2
4.00
10.00
50~60
2
4.00
14.00
60~70
13
26.00
40.00
70~80
8
16.00
56.00
80~90
12
24.00
80.00
90~100
9
18.00
98.00
100
1
2.00
100.00
合计
50
1
2、解 ΣXiFi 250×15+350×30+450×20+550×20+650×15
X= = =440(万 元)
ΣFi 100
M0=300+(30-15)/(30-15+30-20)×100=360(万元)
ME=400+(50-45)/20×100=425(万元)
第三章抽样分布
一、填空题:
1. 是对样本数量特征的描述。
2.简单随机抽样分为 和 。
3.样本均值的均值等于 。
4.样本均值的方差等于 。
5.不重复抽样的修正系数的表达式为 。
6..抽样调查是用 的指标数值去推断和估计 的指标数值。
7.抽样调查的组织方式有:
简单随机抽样、 、 、整群抽样。
8.在抽样之前先将总体的单位划分为若干层(类),然后从各个层(类)中抽取一定数量的单位组成一个样本,这样的抽样方式称为 ,也叫分类抽样。
二、单项选择题:
1.已知总体X服从均值为40,方差为64的正态分布,现从中随机抽取容量为16的样本,则样本均值的均值是(),样本均值的标准差是()
A、40,4 B、40,2 C、20,4 D、20,2
2.总体均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的均值和标准差分别是():
A、50,8 B、50,1,C、50,4,D、8,8
3.大样本情况下,样本比率的抽样分布服从( )
A、正态分布 B、t分布 C、F分布D、8,不能确定
4.已知总体比率为0.5,现从总体中随机抽取容量为100的样本,则样本比率的均值和标准差分别是( ):
A:
0.5,0.05,B:
0.5,0.5,
C:
0.4,0.05,D:
0.5,0.04
5.抽样分布是指( ):
A:
一个样本各观测值的分布,
B:
总体中各观测值的分布,
C:
样本统计量的概率分布,
D:
样本数量的分布。
6.已知人类智商的得分X服从均值为100,方差为256的正态分布,从总体中抽取一个容量为n的样本,样本均值的标准差为2,则样本容量为()
A:
16 B:
64 C:
8 D:
不确定
7.总体参数通常是未知的,需要用()进行估计
A:
总体均值 B:
总体方差
C:
总体的分布 D:
样本统计量
8.已知总体比率为0.6,现从该总体中抽取一个容量为100的样本,则样本比率的均值和标准差分别是():
A:
0.6,0.05 B:
0.4,0.049
C:
0.6,0.049 D:
0.4,0.05
9.某地区有1000户居民,欲抽取5%进行调查,了解居民户对消费者权益的认知状况,先将居民户按顺序排队并分成50个组,每组20户,第一组随机抽出编号为6号居民户,其它各组抽中的居民户编号依次为26号、46号、……、986号,这种抽样方式是( )。
A、简单随机抽样 B、类型抽样
C、对称等距抽样 D、随机起点等距抽样
三、多项选择题:
1.重复抽样和不重复抽样两种抽样方法的差别有( )。
A、抽样的样本数目不同
B、抽样误差的计算公式不同
C、抽样误差的大小不同
D、标准差不同
2.抽样估计的特点是( )。
A、无偏性
B、在逻辑上运用归纳推理
C、在方法上运用不确定的概率估计法
D、抽样估计存在抽样误差
3.计算抽样平均误差,经常采用( )来代替总体标准差。
A、凭抽样调查者经验估计
B、用样本的标准差
C、用总体方差
D、先组织试验性抽样,用试验样本的标准差
E、用过去同类问题的全面调查或抽样调查的经验数据
第3章习题答案
一、填空题:
1. 样本统计量
2. 重复抽样 不重复抽样
3. 总体均值4.总体方差的1/n
4.
5.. 样本 总体
6. 分层抽样 系统抽样
7. 分层抽样
二、单项选择题:
1.B 2.B 3.A 4.A 5.C
6.B 7.D 8. C 9. D
三、多项选择题:
1.ABCD 2.BCD 3.BD
第四章参数估计
一、填空题:
1.参数估计方法有两种,即 和 。
2. 是根据样本资料以一定可靠程度推断总体参数所在的区间范围。
3.评价估计量优劣的标准有三个,分别是 、 和 。
4. 是为了使抽样误差,不超过所给定的最大允许误差,至少应抽取的样本单位数目。
5.样本量越大,抽样误差越 ,但调查工作量大,成本越 。
6.在参数估计中,用来估计总体参数的统计量,称为 。
二、单项选择题:
1.在抽样调查中,要提高推断的可靠程度即提高概率,必须( )。
A、缩小误差范围 B、确定总体指标所在的范围
C、扩大误差范围 D、是绝对可靠的范围
2.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差( )。
A、前者小于后者 B、前者大于后者
C、两者相等 D、无法确定哪一个大
3.在其他条件同等的情况下,抽选5%和10%的单位样本,那么重置抽样平均误差和不重置抽样平均误差对比关系是( )。
三、多项选择题:
1.关于区间估计,正确的有( )。
A、根据样本指标和抽样平均误差,确定总体指标的可能范围
B、区间估计所表明是一个可能范围
C、区间估计所表明是一个绝对可靠的范围
D、欲提高推断的可靠程度,必须扩大误差范围
E、要提高推断的概率,要缩小误差
2.在区间估计中,如果其他条件保持不变,概率保证程度与精确度之间存在下列关系( )。
A、前者愈低,后者也愈低 B、前者愈高,后者也愈高
C、前者愈低,后者愈高 D、前者愈高,后者愈低
E、两者呈相反方向变化
3.要提高抽样推断的精确度可采用的方法有( )。
A、增加样本数目 B、减少样本数目
C、缩小总体被研究标志的变异程度 D、改善抽样的组织方式
E、改善抽样的方式
4.影响抽样单位数目的因素有()
A、总体方差(或标准差)
B、概率保证程度
C、抽样方法
D、允许误差范围
E、抽样组织方式
四、计算题:
1.某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平,如下表:
月工资水平(元)
124
134
140
150
160
180
200
260
工人人数(人)
4
6
9
10
8
6
4
3
要求:
(1)计算样本平均数;
(2)以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间。
2.某学校共有3000名学生。
该校对学生的电话费月支出进行了一次抽样调查。
随机抽取100名学生调查的结果是:
平均电话费月支出为38元,标准差为15.5元。
试在95%的置信度水平下估计该校学生人均电话费月支出的置信区间。
3.某企业从长期实践得知,其产品直径X是一随机变量,服从标准差为0.05的正态分布。
从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:
厘米)。
在0.95的置信度水平下,试求该产品直径均值的置信区间。
4.已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下:
1510 1450 1480 1460 1520 1480 1490 1460 1480 1510 1530
1470 1500 1520 1510 1470
试在95%的置信度水平下估计这批灯泡平均寿命的置信区间。
5.2008年对悉尼995名成人的随机调查发现,有216人每天都抽烟。
试在90%的置信度水平下估计悉尼成人中每天都抽烟比率的置信区间。
6.根据以往的生产统计,某种产品的合格率约为90%,现要求允许误差为5%,在95%的置信度水平下,应抽取多少个产品作为样本?
第4章习题答案
一、填空题:
1.点估计 区间估计
2.区间估计
3.无偏性 有效性 一致性
4.必要样本数目
5.小 高
6.估计量
二、单项选择题:
1.C 2.B 3.A
三、多项选择题:
1.ABD 2.CDE 3.ACDE 4.ABCDE
四、计算题:
1.解:
根据题意,n=10,1-a=95%,t0.025(9)=2.2622故
最大允许误差=t0.025(9)×s/n1/2=2.2622.×17.136/101/2=12.26
则置信度为95%的总体均值的置信区间为:
791.1-12.26≤X≤791.1+12.26
778.84≤X≤803.36
2.解:
根据题意,n=200,p=60/200=0.3,1-a=95%,Za/2=1.96故
Δp=Za/2·б(p)=1.96×0.032=0.063
则置信度为95%的总体比率的置信区间为:
0.3-0.063≤P≤0.3+0.063
0.237≤P≤0.363
3.解:
已知E=0.05,α=0.05,Zα/2=1.96,当π未知时取为0.5。
在95%的可靠程度下,应抽容量为385的样本。
4.解:
显然有 因此可以用正态分布进行估计 Zα/2=1.645
结论:
在90%的置信度水平下认为悉尼成人中每天都抽烟的比率在19.55%~23.85%之间。
5.解:
已知E=5%,α=0.05,Zα/2=1.96,π=90%。
在95%的置信度水平下,应抽取139个产品作为样本。
第五章假设检验
一、填空题:
1. 就是事先对总体参数作出一个假设,然后利用样本信息判断该假设是否合理。
2.原假设和备择假设的关系是 。
3.假设检验最常用的有三种情况:
双侧检验、 和 。
4.当总体方差已知,正态总体时,样本均值服从正态分布,选择的统计量为 统计量。
5.左侧检验的拒绝区域位于统计量分布的 ,右侧检验的拒绝区域位于统计量分布的 。
6.假设检验中的两类错误是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 习题 答案