专题八统计与统计案例.docx
- 文档编号:1269259
- 上传时间:2022-10-19
- 格式:DOCX
- 页数:18
- 大小:215.98KB
专题八统计与统计案例.docx
《专题八统计与统计案例.docx》由会员分享,可在线阅读,更多相关《专题八统计与统计案例.docx(18页珍藏版)》请在冰豆网上搜索。
专题八统计与统计案例
专题八 统计与统计案例
考点一抽样方法:
考点二样本估计总体:
频率分布直方图,面积和为1,众数,中位数,平均数,
极差,标准差(方差)
在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积
乘以小长方形底边中点的横坐标之和.
考点三线性回归方程:
样本点中心:
独立性检验:
分类变量———列联表
利用判断相关关系
概率与统计、统计案例______一大一小共17分
重点考查数据处理能力、应用意识、创新意识
1.(2016·课标全国丙)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是( )
A.各月的平均最低气温都在0℃以上;B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同;D.平均最高气温高于20℃的月份有5个
答案 D
解析 由题意知,平均最高气温高于20℃的有七月,八月,故选D.
2.(2016·山东)某高校调查了200名学生每周的自习时间(单位:
小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56B.60C.120D.140
答案 D
解析 设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.
3.(2016·北京)某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.
学生序号
1
2
3
4
5
6
7
8
9
10
立定跳远(单位:
米)
1.96
1.92
1.82
1.80
1.78
1.76
1.74
1.72
1.68
1.60
30秒跳绳(单位:
次)
63
a
75
60
63
72
70
a-1
b
65
在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则( )
A.2号学生进入30秒跳绳决赛;B.5号学生进入30秒跳绳决赛
C.8号学生进入30秒跳绳决赛;D.9号学生进入30秒跳绳决赛
答案 B
解析 由数据可知,进入立定跳远决赛的8人为:
1~8号,所以进入30秒跳绳决赛的6人需要从1~8号产生,数据排序后可知第3,6,7号必须进跳绳决赛,另外3人需从63,a,60,63,a-1五个得分中抽取,若63分的人未进决赛,则60分的人就会进入决赛,与事实矛盾,所以63分必进决赛.故选B.
4.(2016·上海)某次体检,6位同学的身高(单位:
米)分别为1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是________(米).
答案 1.76
1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等;
2.在概率与统计的交汇处命题,以解答题中档难度出现.
热点一 抽样方法
1.简单随机抽样特点是从总体中逐个抽取.适用范围:
总体中的个体数较少.
2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:
总体中的个体数较多.
3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:
总体由差异明显的几部分组成.
例1
(1)某校要从高一、高二、高三共2012名学生中选取50名组成志愿团,若采用下面的方法选取,先用简单随机抽样的方法从2012人中剔除12人,剩下的2000人再按分层抽样的方法进行,则每人入选的概率( )
A.都相等且为B.都相等且为C.不会相等D.均不相等
(2)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=________.
答案
(1)A
(2)90
解析
(1)根据分层抽样的定义和方法可得,每个个体被抽到的概率都相等,都等于样本容量除以总体容量,所以每个个体被抽到的概率都等于,故选A.
(2)由题意得=,解得n=90.
思维升华
(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;
(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;(3)分层抽样满足:
各层抽取的比例都等于样本容量在总体容量中的比例.
跟踪演练1
(1)要考察某公司生产的500克袋装牛奶中三聚氰胺的含量是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数法抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________.(下面摘取了随机数表第7行至第9行)
84421753315724550688770474476721763350258392120676(第7行)
63016378591695556719981050717512867358074439523879(第8行)
33211234297864560782524207443815510013429966027954(第9行)
(2)利用分层抽样的方法在学生总数为1200人的年级中抽出20名同学,其中有女生8人,则该年级男生的人数约为________.
答案
(1)068
(2)720
解析
(1)由随机数法可知抽取样本个体的编号为331,572,455,068,…,故第4个样本个体的编号为068.
(2)由于样本容量为20,其中的男生人数为12,从而该年级男生人数约为1200×=720.
热点二 用样本估计总体
1.频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距×.
2.频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数
利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.
例2
(1)在某次测量中得到的A样本数据如下:
42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.平均数B.标准差C.众数D.中位数
(2)若五个数1,2,3,4,a的平均数为3,则这五个数的标准差是________.
答案
(1)B
(2)
解析
(1)设样本A中的数据为xi,则样本B中的数据为yi=xi-5,则样本数据B中的众数和平均数以及中位数和A中的众数,平均数,中位数相差5,只有标准差没有发生变化,故选B.
(2)由平均数的定义知=3,所以10+a=15,即a=5;
由标准差的计算公式可得:
s=
=.
思维升华
(1)反映样本数据分布的主要方式:
频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差等.
(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.
跟踪演练2
(1)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为( )
A.117B.118C.118.5D.119.5
(2)某学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n且支出在[20,60]元的样本,其频率分布直方图如图所示,其中支出在[50,60]元的学生有30人,则n的值为( )
A.100B.1000C.90D.900
答案
(1)B
(2)A
解析
(1)22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.
(2)支出在[50,60]元的频率为1-0.1-0.24-0.36=0.3,所以n=30÷0.3=100,故选A.
热点三 统计案例
1.线性回归方程
方程=x+称为线性回归方程,其中=,=-,(,)称为样本点的中心.
2.随机变量K2=,其中n=a+b+c+d.
例3
(1)具有线性相关关系的变量x、y的一组数据如下表所示.若y与x的回归直线方程为=3x-,则m的值是( )
x
0
1
2
3
y
-1
1
m
8
A.4B.C.5.5D.6
(2)2016年3月9日至15日,谷歌人工智能系统“阿尔法”迎战围棋冠军李世石,最终结果“阿尔法”以总比分4比1战胜李世石.许多人认为这场比赛是人类的胜利,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2548名男性中有1560名持反对意见,2452名女性中有1200名持反对意见,在运用这些数据说明“性别”对判断“人机大战是人类的胜利”是否有关系时,应采用的统计方法是( )
A.茎叶图B.分层抽样C.独立性检验D.回归直线方程
答案
(1)A
(2)C
解析
(1)因为=1.5,=,所以样本中心点坐标是(1.5,),又因为回归直线必过样本中心点,所以=3×1.5-,得m=4,故选A.
(2)这是独立性检验,因为这里有两个分类变量,一个是性别分为男女,一个是意见分为支持和反对,这样就构成一个2×2列联表,用独立性检验来验证“性别”对判断“人机大战是人类的胜利”是否有关系.
思维升华
(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(,),应引起关注.
(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入K2求解即可.
跟踪演练3
(1)随机采访50名观众对某电视节目的满意度,得到如下列联表:
单位:
人
满意
不满意
合计
男
10
20
30
女
15
5
20
合计
25
25
50
附表和公式如下:
P(K2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
K2=,其中n=a+b+c+d为样本容量.
根据以上数据可知( )
A.有95%的把握认为对电视节目的满意度与性别无关
B.有99%的把握认为对电视节目的满意度与性别无关
C.有99%的把握认为对电视节目的满意度与性别有关
D.有95%的把握认为对电视节目的满意度与性别有关
(2)春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
做不到“光盘”
能做到“光盘”
男
45
10
女
30
15
附:
P(K2≥k)
0.10
0.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 专题八 统计与统计案例 专题 统计 案例