222用样本的数字特征估计总体的数字特征.docx
- 文档编号:25636968
- 上传时间:2023-06-11
- 格式:DOCX
- 页数:14
- 大小:729.93KB
222用样本的数字特征估计总体的数字特征.docx
《222用样本的数字特征估计总体的数字特征.docx》由会员分享,可在线阅读,更多相关《222用样本的数字特征估计总体的数字特征.docx(14页珍藏版)》请在冰豆网上搜索。
222用样本的数字特征估计总体的数字特征
§2.2.2用样本的数字特征估计总体的数字特征(2课时)
一、教学目标
(一)知识与技能
(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如众数、中位数、平均数、标准差等等),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
(二)过程与方法
在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
(三)情感、态度与价值观
会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识与现实世界的联系。
二、重点与难点
重点:
用样本平均数和标准差估计总体的平均数和标准差。
难点:
应用相关知识解决简单的实际问题。
三、教学过程
第1课时众数、中位数、平均数
【创设意境】
在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4;
乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?
为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总体的数字特征
(众数、中位数、平均数)
【三数概念】
1、众数在一组数据中,出现次数最多的数据叫做这一组数据的众数。
2、中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。
3、平均数一组数据的总和除以数据的个数所得的值。
【练习】求下面这组数据的众数、中位数、平均数
4、4、4、6、6、6、6、8、8、8
众数为6中位数为6
平均数
也可以说平均数为各个不同数字乘以相应频率之和。
【从频率分布直方图中估计众数】
如何从频率分布直方图中估计众数?
如图:
众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
【思考】频率分布直方图中估计的众数与原始数据中的众数2.3不同,为什么?
在频率分布直方图,我们只能直观地看出数据的大概分布情况,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。
【讨论】众数估计总体情况有什么优缺点?
能够体现样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。
【从频率分布直方图中估计中位数】
如何从频率分布直方图中估计中位数?
分析:
在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。
在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标称为中位数。
上图中,设中位数为x,则
【思考】2.02这个中位数的估计值,与样本数据的中位数2.0不同,为什么?
从频率分布直方图本身得不出原始的数据内容,频率分布直方图已经损失一些样本信息。
【思考】中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?
【对极端值不敏感有利的例子】
考察100位居民的月均用水量表中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中人为操作的失误经常造成错误数据。
【对极端值不敏感有弊的例子】
某人具有初级计算机专业技术水平,想找一份收入好的工作。
这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:
很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。
这里更好的方法是同时用平均数和中位数来作为参考指标,选择平均数较大且中位数较大的公司就业。
【从频率分布直方图中估计平均数】
如何从频率分布直方图中估计平均数?
平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。
【思考】平均数估计总体情况有什么优缺点?
平均数与每一个样本的数据有关,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。
【想一想】某次数学期中考试,毛毛同学得了78分。
全班共30人,其他同学的成绩为1个100分,4个90分,22个80分,以及一个2分和一个10分。
毛毛计算出全班的平均分为77分,所以毛毛回家告诉妈妈说,他这次成绩处于班级“中上水平”。
这种说法对吗?
【探究】课本P73
你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?
以员工平均工资收入水平去描述他们单位的收入情况。
这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,平均数受数据中的极端值的影响大,所以平均数不能反映该单位员工的收入水平。
这个老板的话有误导与蒙骗行为
【三种数字特征的优缺点】
【众数、中位数、平均数的简单应用】
例某工厂人员及工资构成如下:
(1)指出这个问题中周工资的众数、中位数、平均数
(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?
为什么?
分析:
众数为200,中位数为220,平均数为300。
因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。
【课本P74练习】
假设你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2200万元人民币,另外25个项目的投资是20~100万元。
中位数是25万元,平均数是100万元,众数是20万元。
你会选择哪一种数字特征来表示国家对每一个项目投资的平均额?
你选择种数字特征的缺点是什么?
应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息.但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大.
【课堂练习】
1.若M个数的平均数是X,N个数的平均数是Y,则这M+N个数的平均数是多少?
()
2.如果两组数x1,x2,…,xn和y1,y2,…,yn的样本平均数分别是x和y,那么一组数x1+y1,x2+y2,…,xn+yn的平均数是__x+y____.
3.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为(B)
A.4B.5C.6D.7
4.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有(D)
A.a>b>cB.b>c>a
C.c>a>bD.c>b>a
5.下图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数为(B)
79
844647
93
A.84B.85C.86D.87
【小结】
1、如何从样本数据中求众数、中位数、平均数?
2、如何从频率分布直方图中估计众数、中位数、平均数?
3、利用众数、中位数、平均数估计总体的数字特征时各自的优缺点。
【作业】金太阳导学测评(十六)
【反思】
本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计。
第2课时标准差
【引例】有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:
甲78795491074
乙9578768677
如果你是教练,你应当如何对这次射击情况作出评价?
如果这是一次选拔性考核,你应当如何作出选择?
7
7
7
7
7
7
【标准差】
定义:
标准差是样本数据到平均数的一种平均距离,常用s表示.
1、平均距离:
2.标准差
规律:
标准差越大,则a越大,数据的离散程度越大;反之,数据的离散程度越小.
它用来描述样本数据的离散程度。
在实际应用中,标准差常被理解为稳定性。
【思考】标准差的取值范围是什么?
标准差为0的样本数据有什么特点?
标准差是怎样表现数据的离散程度的?
标准差的取值范围:
[0,+∞)
标准差为0的样本数据都等于样本平均数.
标准差表现为:
标准差越大,表明数据的离散程度就越大;反之,标准差越小,表明各数据的离散程度就越小。
标准差的作用:
它用来描述样本数据的离散程度。
在实际应用中,标准差常被理解为稳定性。
例1:
画出下列四组样本数据的条形图,说明它们的异同点。
(1)5,5,5,5,5,5,5,5,5;
(2)4,4,4,5,5,5,6,6,6;
(3)3,3,4,4,5,6,6,7,7;
(4)2,2,2,2,5,8,8,8,8。
例2:
甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:
mm)
从生产的零件内径的尺寸来看,谁生产的质量较高?
结论:
甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高.
【方差的概念】
定义:
标准差的平方叫做方差,即:
【练习】求数据1,2,3,4,5的平均数与标准差。
1.农场种植的甲乙两种水稻,在面积相等的两块稻田中连续6年的年平均产量如下(单位:
500g):
那种水稻的产量比较稳定?
解:
依题意计算可得
x1=900x2=900
s1≈23.8s2≈42.6
甲乙两种水稻6年平均产量的平均数相同,但甲的标准差比乙的小,所以甲的生产比较稳定.
2.一个小商店从一家食品有限公司购进21袋白糖,每袋白糖的标准重量是500g,为了了解这些白糖的重量情况,称出各袋白糖的重量(单位:
g)如下:
486495496498499493493
498484497504489495503
499503509498487500508
求:
(1)21袋白糖的平均重量x是多少?
标准差s是多少?
(2)重量位于x-s与x+s之间有多少袋白糖?
所占的百分比是多少?
解:
(1)平均重量约为496.86g,标准差约为6.55
【小结】
1.标准差
2.方差:
【作业】金太阳导学测评(十六)
【反思】
统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点。
仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的。
用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性。
这种偏差是不可避免的。
虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 222 样本 数字 特征 估计 总体