高中数学 第三章 统计案例 32 独立性检验的基本思想及其初步应用课时训练 理 新人教A版选修23.docx
- 文档编号:296892
- 上传时间:2022-10-08
- 格式:DOCX
- 页数:12
- 大小:121.57KB
高中数学 第三章 统计案例 32 独立性检验的基本思想及其初步应用课时训练 理 新人教A版选修23.docx
《高中数学 第三章 统计案例 32 独立性检验的基本思想及其初步应用课时训练 理 新人教A版选修23.docx》由会员分享,可在线阅读,更多相关《高中数学 第三章 统计案例 32 独立性检验的基本思想及其初步应用课时训练 理 新人教A版选修23.docx(12页珍藏版)》请在冰豆网上搜索。
高中数学第三章统计案例32独立性检验的基本思想及其初步应用课时训练理新人教A版选修23
2019年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用课时训练理新人教A版选修2-3
3.2独立性检验的基本思想及其初步应用
1.分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的__________,像这样的变量称为分类变量.
(2)列联表:
①定义:
列出的两个分类变量的________称为列联表.
②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
总计
总计
从列表中,依据与的值可直观得出结论:
两个变量是否有关系..
2.等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否__________,常用等高条形图表示列联表数据的__________.
(2)观察等高条形图发现__________和__________相差很大,就判断两个分类变量之间有关系.
3.独立性检验
定义
利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验
公式
,其中___________为样本容量.
具体
步骤
①确定,根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定________.
②计算,利用公式计算随机变量的观测值为________.
③下结论,如果_________,就推断“与有关系”,这种推断_____________不超过;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中___________________支持结论“与有关系”
参考答案
1.
(1)不同类别
(2)频数表
2.
(1)相互影响频率特征
(2)
3.
临界值③观测值犯错误的概率没有发现足够证据
重点
了解分类变量的意义,会列出的列联表,会计算,并理解其意义
难点
了解实际推理和假设检验的基本思想
易错
思维不清易出错错把统计当确定
1.列联表和等高条形图的应用
某学校对高三学生作了一项调查发现:
在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.
【答案】详见解析
【解析】作列联表如下:
性格内向
性格外向
总计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
总计
426
594
1020
相应的等高条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.
【名师点睛】1.判断两个分类变量是否有关系的两种常用方法
(1)利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法.
(2)一般地,在等高条形图中,
与
相差越大,两个分类变量有关系的可能性就越大.
2.利用等高条形图判断两个分类变量是否相关的步骤
2.独立性检验
某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
积极参加班级工作
不太主动参加班级工作
合计
学习积极性高
18
7
25
学习积极性一般
6
19
25
合计
24
26
50
(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?
抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(2)试运用独立性检验的思想方法分析:
学生的学习积极性与对待班级工作的态度是否有关系?
并说明理由?
参考公式及数据:
,其中为样本容量.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】详见解析
【解析】
(1)积极参加班级工作的学生有24人,总人数为50人.概率为;不太主动参加班级工作且学习积极性一般的学生有19人,概率为.
(2)由表中数据可得
,
∴有99.9%的把握说学习积极性与对待班级工作的态度有关系.
【名师点睛】独立性检验的步骤:
第一步,确定分类变量,获取样本频数,得到列联表.
第二步,根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值.
第三步,利用公式
计算随机变量的观测值.
第四步,作出判断.
如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
3.思维不清易出错错把统计当确定
试分析下列说法正确与否:
在用独立性检验的方法检验某单位招聘行政工作人员和技术工作人员所招聘的男女人数时,得到了的观测值为,这就证明该单位在两类工作岗位上的招聘中一定存在性别歧视.
【错解】这种说法都是正确的.
【错因分析】统计思维得出的结论是带有随机性的、不能完全确定的结论.错解中依据确定性思维对统计计算的结果给出了错误的解释.
【正解】说法错误.根据独立性检验,当的观测值为时,有95%的把握认为该单位在两类工作岗位上的招聘中存在性别歧视,即该单位在招聘工作中存在性别歧视的嫌疑很大,概率高达95%,即使是这样也不能100%肯定该单位在招聘工作中存在性别歧视.
另一方面,由于男女在选择工作岗位上的心理不同,也会造成各个岗位招聘男女人数的差异,导致计算的的观测值过大,因此,单纯从这个计算结果不能得出该单位在两类工作岗位上的招聘中一定存在性别歧视的结论.
1.下列关于等高条形图的叙述正确的是
A.从等高条形图中可以精确地判断两个分类变量是否有关系
B.从等高条形图中可以看出两个变量频数的相对大小
C.从等高条形图中可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
2.下面是一个2×2列联表:
总计
21
73
8
25
33
总计
46
则表中a、b处的值分别为
A.94、96B.52、50C.52、60D.54、52
3.利用独立性检验来考虑两个分类变量与是否有关系时,通过查阅下表来确定“和有关系”的可信度.如果,那么就有把握认为“与有关系”的百分比为
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.5%B.95%C.2.5%D.97.5%
4.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以下的人,调查结果如下表:
患慢性气管炎
未患慢性气管炎
合计
吸烟
43
162
205
不吸烟
13
121
134
合计
56
283
339
根据列表数据,求得的观测值________.
5.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用列联表和等高条形图判断监督员甲在不在生产现场对产品质量好坏有无影响.
6.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:
出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.
(1)将2×2列联表补充完整.
出生时间
总计
晚上
白天
男婴
女婴
总计
(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?
7.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:
认为作业多
认为作业不多
总数
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
总数
26
24
50
则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.99%B.97.5%
C.95%D.无充分依据
8.两个分类变量X、Y,它们的取值分别为x1、x2和y1、y2,其列联表为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
若两个分类变量X、Y独立,则下列结论:
①;②;③
;④
;
⑤
.
其中正确的序号是________.
9.下表是某地区的一种传染病与饮用水的调查表:
得病
不得病
合计
干净水
52
466
518
不干净水
94
218
312
合计
146
684
830
(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种传染病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.
10.某城市随机抽取一年(365天)内100天的空气质量指数的监测数据,结果统计如下:
空气质量
优
良
轻微污染
轻度污染
中度污染
中度重污染
重度污染
天数
4
13
18
30
9
11
15
记某企业每天由空气污染造成的经济损失为(单位:
元),空气质量指数为.在区间[0,100]对企业没有造成经济损失;在区间对企业造成的经济损失成直线模型(当为150时,造成的经济损失为500元,当API为200时,造成的经济损失为700元);当大于300时造成的经济损失为xx元;
(1)试写出的表达式:
(2)试估计在本年内随机抽取一天,该天经济损失S大于500元且不超过900元的概率;
(3)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面2×2列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关?
非重度污染
重度污染
合计
供暖季
非供暖季
合计
100
附:
P(K2≥k0)
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
1.C【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错,在等高条形图中仅能够找出频率,无法找出频数,故B错.
2.C【解析】∵,∴.又.
3.B
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学 第三章 统计案例 32 独立性检验的基本思想及其初步应用课时训练 新人教A版选修23 第三 统计 案例 独立性 检验 基本 思想 及其 初步 应用 课时 训练 新人 选修 23
![提示](https://static.bdocx.com/images/bang_tan.gif)
链接地址:https://www.bdocx.com/doc/296892.html