高中数学《用样本的频率分布估计总体分布》导学案.docx
- 文档编号:10956104
- 上传时间:2023-02-24
- 格式:DOCX
- 页数:21
- 大小:242.52KB
高中数学《用样本的频率分布估计总体分布》导学案.docx
《高中数学《用样本的频率分布估计总体分布》导学案.docx》由会员分享,可在线阅读,更多相关《高中数学《用样本的频率分布估计总体分布》导学案.docx(21页珍藏版)》请在冰豆网上搜索。
高中数学《用样本的频率分布估计总体分布》导学案
2.2.1 用样本的频率分布估计总体分布
一、用样本估计总体的两种情况
通过随机抽样抽取到具有代表性的样本,对样本数据进行列表,制图、计算分析,从数据中找到它所包含的信息和规律,然后对总体作出估计.估计一般分为两种:
样本的频率分布估计总体的分布;
样本的数字特征(如平均数、标准差等)估计总体的数字特征.
1.频率分布直方图
在频率分布直方图中,纵轴表示
频率/组距,数据落在各小组内的频率用
来表示,各小长方形的面积的总和等于
1.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图
连接频率分布直方图中各小长方形
上端的中点,就得到了频率分布折线图.
(2)总体密度曲线
随着样本容量的增加,作图时所分的
组数增加,组距减小,相应的频率折线图就会越来越接近于一条
光滑曲线,统计中称之为总体密度曲线,它反映了
总体在各个范围内取值的百分比.
二、茎叶图
1.茎叶图的适用范围
当样本数据较少时,用茎叶图表示数据的效果较好.
2.茎叶图的优点
它不但可以
保留所有信息,而且可以
随时记录,给数据的
记录和
表示都能带来方便.
3.茎叶图的缺点
当
样本数据较多时,枝叶就会很长,茎叶图就显得不太方便.
1.判一判(正确的打“√”,错误的打“×”)
(1)频率分布直方图的纵轴表示频率.( )
(2)频率分布折线图是总体密度曲线的特殊情形.( )
(3)茎叶图不能表示一位数.( )
答案
(1)×
(2)√ (3)×
2.做一做
(1)下列关于茎叶图的叙述正确的是( )
A.将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面
B.茎叶图只可以分析单组数据,不能对两组数据进行比较
C.茎叶图更不能表示三位数以上的数据
D.画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可随意同行列出
答案 A
解析 由茎叶图的概念易知选A.
(2)将容量为100的样本数据分为8个组,如下表:
组号
1
2
3
4
5
6
7
8
频数
10
13
x
14
15
13
12
9
则第3组的频率为( )
A.0.03B.0.07C.0.14D.0.21
答案 C
解析 由题意得x=100-(10+13+14+15+13+12+9)=14,所以第3组的频率为
=0.14.
(3)(教材改编P70例题)如图是甲、乙两名篮球运动员某赛季一些场次得分的茎叶图,据图可知( )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
答案 A
解析 由茎叶图可以看出甲的成绩都集中在30~50分,且高分较多.而乙的成绩只有一个高分52分,其他成绩比较低,故甲运动员的成绩好于乙运动员的成绩.
(4)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:
cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有______株树木的底部周长小于100cm.
答案 24
解析 60×(0.015+0.025)×10=24.
探究1 列频率分布表、画频率分布直方图及折线图
例1 为了了解某中学高二女生的身高情况,该校对高二女生的身高(单位:
cm)进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:
分组
频数
频率
[150.5,154.5)
1
0.02
[154.5,158.5)
4
0.08
[158.5,162.5)
20
0.40
[162.5,166.5)
15
0.30
[166.5,170.5)
8
0.16
[170.5,174.5]
m
n
合计
M
N
(1)表中m,n,M,N所表示的数分别是多少?
(2)绘制频率分布折线图;
(3)估计该校女生身高小于162.5cm的百分比.
[解]
(1)由于频率和为1,所以N=1,所以n=1-(0.02+0.08+0.40+0.30+0.16)=0.04,所以M=
=50,m=50-(1+4+20+15+8)=2,故有m=2,n=0.04,M=50,N=1.00.
(2)频率分布折线图如图中的折线:
(3)该校女生身高小于162.5cm的百分比为(0.02+0.08+0.4)×100%=50%.
拓展提升
绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
【跟踪训练1】 美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,
52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,
54,51,60,62,43,55,56,61,52,69,64,46,54,47,70.
(1)将数据分为7组,列出频率分布表,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
解
(1)以4为组距,列频率分布表如下:
分组
频数
频率
[42,46)
2
0.0444
[46,50)
7
0.1555
[50,54)
8
0.1778
[54,58)
16
0.3556
[58,62)
5
0.1111
[62,66)
4
0.0889
[66,70]
3
0.0667
合计
45
1.0000
画出相应的频率分布直方图和频率分布折线图,如图所示.
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁及45岁以下和65岁以上就任的总统所占的比例相对较小.
探究2 频率分布直方图的应用
例2 为了迎接某市作为全国文明城市的复查,爱卫会随机抽取了60位路人进行问卷调查,调查项目是自己对该市各方面卫生情况的满意度(假设被问卷的路人回答是客观的),以分数表示问卷结果,并统计他们的问卷分数,把其中不低于50分的分成五段:
[50,60),[60,70),…,[90,100]后画出如图所示的部分频率分布直方图,观察图形信息,回答下列问题:
(1)求出问卷调查分数低于50分的被问卷人数;
(2)估计全市市民满意度在60分及以上的百分比.
[解]
(1)因为各组的频率和等于1,
故低于50分的频率为
f=1-(0.015×2+0.030+0.025+0.005)×10=0.1,故低于50分的人数为60×0.1=6.
(2)依题意,60分及以上的频率和为
(0.015+0.030+0.025+0.005)×10=0.75,
所以抽样满意度在60分及以上的百分比为75%.
于是,可以估计全市市民满意度在60分及以上的百分比为75%.
拓展提升
频率分布直方图的应用
频率分布指的是一个样本数据在各个小范围内所占比例的大小,一般用频率分布直方图反映样本的频率分布,其中:
(1)频率分布直方图中纵轴表示
;
(2)频率分布直方图中,各个小长方形的面积等于频率,各个小长方形的面积之和为1;
(3)长方形的高的比也就是频率之比.
【跟踪训练2】 从某小学随机抽取100名同学,将他们的身高(单位:
厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
答案 0.030 3
解析 因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为
×10=3.
探究3 茎叶图的绘制及应用
例3 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:
95,81,75,89,71,65,76,88,94,110,107;
乙的得分:
83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
[解] 甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学总体得分情况比甲同学好.
拓展提升
(1)画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较.
(2)绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.
【跟踪训练3】 为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:
h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5
2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4
1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
根据两组数据完成如图所示的茎叶图,从茎叶图看,哪种药的疗效更好?
解 由观测结果可绘制茎叶图如图所示.
从以上茎叶图可以看出,A药疗效的试验结果有
的叶集中在茎2,3上,而B药疗效的试验结果有
的叶集中在茎0,1上,由此可看出A药的疗效更好.
1.频率分布直方图的绘制与特征
(1)频率分布直方图的绘制
①将数据分组时,组数应力求合适,使数据的分布规律能较清楚地呈现出来.一般样本容量越大,所分组数越多,为方便起见,组距的选择力求“取整”,当样本容量不超过120时,按照数据的多少,通常分成5~12组.若
为整数,则
=组数,若
不为整数,则
+1=组数.(注:
[x]表示不大于x的最大整数)
②频率分布直方图中,横轴表示样本数据,纵轴表示频率/组距,在横轴上以数据分组的两个端点所组成的线段为底,在纵轴上以频率/组距为高作小长方形.
(2)频率分布直方图的特征
①频率分布表中的数字和频率分布直方图的形状都与分组数(组距)有关.频率分布直方图的外观和坐标系的单位长度有关.
②频率分布表和频率分布直方图由样本决定,因此它们会随着样本的改变而改变.
③频率分布直方图直观、形象地反映了样本的分布规律.但是从频率分布直方图中得不出原始的数据内容.把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.
2.频率分布折线图和总体密度曲线的特征
频率分布折线图反映了数据的变化趋势.总体密度曲线能够精确地反映总体在各个范围内取值的百分比,能给我们提供更加精细的信息.
3.茎叶图的制作及特征
(1)茎叶图的制作
茎是指中间的一列数,叶就是从茎的旁边生长出来的数,茎叶图通常用来记录两位数的数据,其可用来分析单组数据,也可对两组数据进行比较.
(2)茎叶图的特征
茎叶图能够保留原始数据,并且展示数据的分布情况,便于记录与读取,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便.
1.下列关于样本频率分布折线图与总体密度曲线的关系的说法中,正确的是( )
A.频率分布折线图与总体密度曲线无关
B.频率分布折线图就是总体密度曲线
C.样本容量很大的频率分布折线图就是总体密度曲线
D.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线
答案 D
解析
选项
正误
理由
A
×
当总体个数较多时,随着样本容量的增加,组数增加,组距减小,频率分布折线图趋向于总体密度曲线,所以两者有关
B
×
只有当样本容量很大时,频率分布折线图趋向于总体密度曲线
C
×
总体密度曲线是由频率分布折线图估计的,样本容量越大就越准确
D
√
频率分布折线图在样本容量无限增大,分组的组距无限减小的情况下会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线
2.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:
kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6B.8C.12D.18
答案 C
解析 志愿者的总人数为
=50,
所以第三组人数为50×0.36×1=18,
所以有疗效的人数为18-6=12.
3.一个频率分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为( )
A.14B.15C.16D.17
答案 B
解析 ∵样本中数据在[20,60)内的频率为0.8,
∴样本数据在[20,60)内的频数为30×0.8=24,
∴样本在[40,50),[50,60)内的数据个数共为24-4-5=15.
4.下图是12名同学某次测验的分数的茎叶图,由此可知,这些分数中最低分与最高分之和为________.
答案 147
解析 最低分为53分,最高分为94分,它们之和为147分.
5.从高三参加数学竞赛的学生中抽取50名学生的成绩,成绩的分组及各组的频数如下(单位:
分):
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率分布折线图;
(3)估计成绩在[60,90)分的学生比例;
(4)估计成绩在80分以下的学生比例.
解
(1)频率分布表如下:
(2)频率分布直方图和折线图如图所示.
(3)样本中所求学生的比例为0.20+0.30+0.24=0.74=74%.
由样本估计总体,成绩在[60,90)分的学生约占74%.
(4)所求学生的比例为1-(0.24+0.16)=1-0.4=0.6=60%.由样本估计总体,成绩在80分以下的学生约占60%.
A级:
基础巩固练
一、选择题
1.为了解某地区高一学生的身体发育情况,抽查了该地区100名年龄为17.5~18岁的男生体重(kg),得到频率分布直方图(如图所示).
可得这100名学生中体重在[56.5,64.5)的学生人数是( )
A.20B.30C.40D.50
答案 C
解析 由频率分布直方图易得到体重在[56.5,64.5)的学生的频率为(0.03+0.05+0.05+0.07)×2=0.4,那么学生的人数为100×0.4=40.故选C.
2.下列关于茎叶图的叙述正确的是( )
A.茎叶图可以展示未分组的原始数据,它与频率分布表以及频率分布直方图的处理方式不同
B.对于重复的数据,只算一个
C.茎叶图中的叶是“茎”十进制的上一级单位
D.制作茎叶图的程序是:
第一步:
画出茎;第二步:
画出叶;第三步:
将“叶子”任意排列
答案 A
解析 由茎叶图的概念知A正确,故选A.
3.对某种灯泡随机地抽取200个样品进行使用寿命调查,结果如下:
规定:
使用寿命大于或等于500天的灯泡是优等品,小于300天是次品,其余的是正品.现从灯泡样品中随机地抽取n(n∈N*)个,若这n个灯泡的等级分布情况恰好与从这200个样品中按三个等级分层抽样所得的结果相同,则n的最小值为( )
A.2B.3C.4D.5
答案 C
解析 由频率分布表,得x=200×0.15=30.
灯泡样品中优等品有50个,正品有100个,次品有50个,
∴优等品、正品、次品的比为50∶100∶50=1∶2∶1.
∴按分层抽样方法,随机地抽取灯泡的个数n=k+2k+k=4k(k∈N*)
∴n的最小值为4.故选C.
4.如图是总体密度曲线,下列说法正确的是( )
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百分比
答案 C
解析 总体密度曲线与频率分布折线图关系如下:
当样本容量越大,组距越小时,频率分布折线图越接近于总体密度曲线,但它永远达不到总体密度曲线,在总体密度曲线中,阴影部分的面积代表总体在(a,b)内取值的百分比,因而选C.
5.某教育机构随机抽查某校20个班级,调查各班关注“汉字听写大赛”的学生人数,根据所得数据的茎叶图,以5为组距将数据分组成[0,5),[5,10),[10,15),[15,20),[20,25),[25,30),[30,35),[35,40]时,所作的频率分布直方图如图所示,则原始的茎叶图可能是( )
答案 A
解析 由频率分布直方图知,各组频数统计如下表:
分组
[0,5)
[5,10)
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40]
频数
1
1
4
2
4
3
3
2
结合各选项茎叶图中的数据可知选项A正确.
二、填空题
6.某地为了了解该地区10000户家庭的用电情况,采用分层抽样的方法抽取了500户家庭的月平均用电量,并根据这500户家庭的月平均用电量画出频率分布直方图如图所示,则该地区10000户家庭中月平均用电度数在[70,80)的家庭有________户.
答案 1200
解析 根据频率分布直方图得该地区10000户家庭中月平均用电度数在[70,80)的家庭有10000×0.012×10=1200(户).
7.如图是某学校抽取的n个学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第3小组的频数为18,则n的值是________.
答案 48
解析 根据频率分布直方图得,从左到右的前3个小组的频率和为1-(0.0375+0.0125)×5=0.75.
又∵前三组频率之比为1∶2∶3,
∴第3小组的频率为
×0.75=0.375.
又∵第3小组对应的频数为18,
∴样本容量n=
=48.
8.将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于______.
答案 60
解析 设第一组到第六组的频数分别为2a,3a,4a,6a,4a,a,∴2a+3a+4a=27,∴a=3.
∴2a+3a+4a+6a+4a+a=20a=60.
三、解答题
9.在某杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.
(1)用茎叶图表示这两组数据;
(2)将这两组数据进行比较分析,得到什么结论?
解
(1)茎叶图如图所示
(2)杂志上的文章每个句子的字数集中在10~30之间,而报纸上的文章每个句子的字数集中在20~40之间.还可以看出杂志上的文章每个句子的平均字数比报纸上的文章每个句子的平均字数要少,说明杂志作为科普读物需通俗易懂、简明.
B级:
能力提升练
10.某校高一某班的一次数学测试成绩(满分100分)抽样的茎叶图和频率分布直方图都受到不同程度的污染,可见部分如图1,2所示,据此解答下列问题:
(1)求分数在区间[50,60)内的频率及抽样人数;
(2)求分数在区间[80,90)内的频数,并计算频率分布直方图中[80,90)对应的小长方形的高;
(3)试估计全班成绩在82分以下的学生比例.
解
(1)分数在区间[50,60)内的频率为0.008×10=0.08,由茎叶图知,分数在区间[50,60)内的频数为2,所以抽样人数为
=25.
(2)分数在区间[80,90)内的频数为25-2-7-10-2=4.频率分布直方图中[80,90)对应的小长方形的高为
÷10=0.016.
(3)成绩在82分以下的学生比例即学生成绩不足82分的频率,设相应频率为b,学生成绩在[82,100]内的频率为
×
+0.008×10=0.208,则b=1-0.208=0.792,由此估计全班成绩在82分以下的学生占79.2%.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 用样本的频率分布估计总体分布 高中数学 样本 频率 分布 估计 总体 导学案
![提示](https://static.bdocx.com/images/bang_tan.gif)