《321 独立性检验》 导学案.docx
- 文档编号:20181195
- 上传时间:2023-04-25
- 格式:DOCX
- 页数:18
- 大小:99.24KB
《321 独立性检验》 导学案.docx
《《321 独立性检验》 导学案.docx》由会员分享,可在线阅读,更多相关《《321 独立性检验》 导学案.docx(18页珍藏版)》请在冰豆网上搜索。
《321独立性检验》导学案
《3.2.1独立性检验》导学案
学习目标
1.通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究.了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.
2.过程与方法:
引导学生形成“自主学习”“合作学习”等良好的学习方式,培养学生的归纳概括能力.
重点
了解独立性检验的基本思想.
难点
独立性检验的基本思想、随机变量χ2的含义及独立性检验的步骤.
教学过程
经常上网会影响学习吗?
下表为教育部对1000名中学生进行调查的结果.经常上网影响学习吗?
如何判断?
经常上网
不经常上网
合计
不及格
80
120
200
及格
120
680
800
合计
200
800
1000
问题1:
(1)通过上述数据经常上网的人成绩及格的比例为 60% ,不经常上网的人成绩及格的比例为 85% ,这个数据可以初步判断经常上网对学习成绩是有影响的,但这种说法的把握性有多大,还需要进行独立性检验才知道.
(2)独立性检验的概念
用统计量χ2的大小来研究两个变量是否有关系的方法,称为独立性检验.
问题2:
两个分类变量A和B的2×2列联表
一般地,假设有两个分类变量A和B,它们的可能取值分别为{A1,A2}和{B1,B2},其样本频数列联表(称为2×2列联表)为:
B
A
B1
B2
总计
A1
a
b
a+b
A2
c
d
c+d
总计
a+c
b+d
a+b+c+d
问题3:
统计量χ2的计算公式是怎样的?
若有如下列联表所示的抽样数据:
类1
类2
总计
类A
a
b
a+b
类B
c
d
c+d
总计
a+c
b+d
a+b+c+d
则χ2= (其中n=a+b+c+d).
问题4:
根据χ2判断两变量是否有关联
当χ2≤2.706时, 没有 充分的证据判定变量A、B有关联,可以认为变量A、B是 没有 关联的;
当χ2>2.706时,有 90% 的把握判定变量A、B有关联;
当χ2>3.841时,有 95% 的把握判定变量A、B有关联;
当χ2>6.635时,有 99% 的把握判定变量A、B有关联.
独立性检验的必要性
为什么不能只凭列联表中的数据和由其绘出的图形下结论?
由列联表可以粗略地估计出两个分类变量是否有关(即粗略地进行独立性检验),但2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用独立性检验的方法确认所得结论在多大程度上适用于总体.
学习交流
1.在吸烟与患肺病是否相关的研究中,有下面的说法:
①若χ2=6.7,我们有99%的把握判定吸烟与患肺病有关联,那么在100个吸烟的人中必有99个患肺病;
②从独立性检验可知有99%的把握判定吸烟与患肺病有关联时,若某人吸烟,那么他有99%的可能患有肺病;
③从统计量中求出有95%的把握判定吸烟与患肺病有关联,是指有5%的可能性使得推断出现错误.
其中说法正确的个数为( ).
A.0 B.1 C.2 D.3
【解析】χ2是检测吸烟与患肺病相关程度的量,是一种相关关系,而不是确定关系,只能反映有关和无关的概率.故①②错误,③正确.
【答案】B
2.分类变量X和Y的2×2列联表如下,则( ).
Y
X
Y1
Y2
总计
X1
a
b
a+b
X2
c
d
c+d
总计
a+c
b+d
a+b+c+d
A.其他值一定时,ad-bc越小,说明X与Y的关系越弱
B.其他值一定时,ad-bc越大,说明X与Y的关系越强
C.其他值一定时,(ad-bc)2越大,说明X与Y的关系越强
D.其他值一定时,(ad-bc)2越接近于0,说明X与Y的关系越强
【解析】由统计量χ2的计算公式χ2=可知其他值一定的情况下,(ad-bc)2越大,则χ2的值越大,则X与Y的关系越强,故选C.
【答案】C
3.在对某小学的学生吃零食的调查中,得到数据如下表:
吃零食
不吃零食
总计
男学生
24
31
55
女学生
8
26
34
总计
32
57
89
根据上述数据分析,我们可以得出χ2= .
【解析】χ2=≈3.689.
【答案】3.689
4.某高校《统计》课程的教师随机给出了主修该课程的一些情况,具体数据如下:
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关,根据表中数据,得χ2=≈4.844,若判定主修统计专业与性别有关,则这种判断出错的可能性有多大?
【解析】根据样本数据计算χ2≈4.844>3.841,即有95%以上的把握认为主修统计专业与性别有关,即这种判断出错的可能性为1-0.95=0.05.
5.独立性检验的应用
有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:
冷漠
不冷漠
总计
多看电视
68
42
110
少看电视
20
38
58
总计
88
80
168
请你判断大约有多大的把握认为多看电视与人变冷漠有关系.
【方法指导】利用χ2的公式求出χ2的值,并与临界值进行比较得出结论.
【解析】根据表中的数据,得到
χ2=≈11.377>6.635,所以有99%以上的把握认为多看电视与人变冷漠有关系.
【小结】本题是利用公式求出χ2的值,再利用其与临界值的大小关系来判断独立性.解题时应注意准确地代入数据进行计算.
6.正确推断独立性检验的结果
在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)判断性别与休闲方式是否有关.
【方法指导】
(1)列2×2列联表,统计男、女人数以及看电视、运动的人数,填出表格.
(2)把
(1)中的数据代入公式求出χ2的值,并与临界值比较.
【解析】
(1)2×2列联表如下:
看电视
运动
总计
女
43
27
70
男
21
33
54
总计
64
60
124
(2)计算χ2=≈6.201.
∵6.635>χ2>3.841,
∴有95%以上的把握认为休闲方式与性别有关.
【小结】在日常生活中,我们经常会遇到一些需要推断的问题.推断时,不能仅凭主观意愿作出结论,需要通过实验(或调查)来收集数据,并根据独立性检验的基本思想作出合理的推断.
7.独立性检验与统计的综合应用
某校为了探索一种新的教学模式,进行了一项课题实验,乙班为实验班,甲班为对比班,甲、乙两班均有50人,一年后对两班进行测试,成绩如下表(总分:
150分):
甲班
成绩
[80,90)
[90,100)
[100,110)
[110,120)
[120,130)
人数
4
20
15
10
1
乙班
成绩
[80,90)
[90,100)
[100,110)
[110,120)
[120,130)
人数
1
11
23
13
2
(1)现从甲班成绩位于[90,120)内的试卷中抽取9份进行试卷分析,请问用什么抽样方法更合理,并写出最后的抽样结果;
(2)根据所给数据可估计在这次测试中,甲班的平均分是101.8,请你估计乙班的平均分,并计算两班平均分相差几分;
(3)完成下面2×2列联表,并判断能否有95%以上的把握,认为这两个班在这次测试中成绩的差异与实施课题实验有关.请说明理由.
成绩小于100分
成绩不小于100分
总计
甲班
a=
26
50
乙班
12
d=
50
总计
36
64
100
【方法指导】
(1)先由3组数据存在差异确定抽样方法并计算抽样比,从而确定各区间抽样份数.
(2)累加各组的组中值与频率的积,并计算乙班的平均分,从而得到两班平均分的差.
(3)根据所给的数据得到2×2列联表,由列联表中的数据求出χ2,结合临界值表得出结论.
【解析】
(1)用分层抽样的方法更合理.甲班成绩位于[90,120)内的试卷共有20+15+10=45份,从中抽取9份,抽样比为=,故在[90,100),[90,110),[110,120)各分数段内抽取试卷20×=4份,15×=3份,10×=2份.
(2)估计乙班的平均分为=85×+95×+105×+115×+125×=105.8,105.8-101.8=4,即两班的平均分差4分.
(3)补全列表如下:
成绩小于100分
成绩不小于100分
总计
甲班
a=24
26
50
乙班
12
d=38
50
总计
36
64
100
由表中的数据计算得
χ2==6.25,
因为6.25>3.841,
所以有95%以上的把握认为这两个班在这次测试中成绩的差异与实施课题实验有关.
【小结】近几年高考中较少单独考查独立性检验,而是与频率分布表融合在一起考查,一般需要根据条件列出2×2列联表,计算χ2的值,从而解决问题.
例题应用
研究人员选取170名青年男女大学生作为样本,对他(她)们进行一种心理测验,发现有60名女生对该心理测验的最后一个题目的反应是:
作肯定的18名,否定的42名;男生110名在相同的项目上做出肯定的有22名,否定的有88名.请问性别与态度之间是否存在某种关系?
【解析】根据题目所给数据建立如下2×2列联表:
肯定
否定
总计
男生
22
88
110
女生
18
42
60
总计
40
130
170
由列联表中的数据得
χ2=≈2.158<2.706.
因此,没有充分的证据显示“性别与态度有关”.
为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:
男
女
正常
442
514
色盲
38
6
根据上述数据,试问:
色盲与性别是否是相互独立的?
【解析】由已知条件可得下表:
男
女
总计
正常
442
514
956
色盲
38
6
44
总计
480
520
1000
依据公式得χ2=≈27.139.
由于27.139>6.635,所以有99%以上的把握认为色盲与性别是有关的,从而可以认为色盲与性别不是相互独立的.
电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性,根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
【解析】由所给的频率分布直方图知,
“体育迷”人数为100×(10×0.020+10×0.005)=25.
“非体育迷”人数为75,则据题意完成2×2列联表:
非体育迷
体育迷
合计
男
30
15
45
女
45
10
55
合计
75
25
100
将2×2列联表的数据代入公式计算:
χ2=
=≈3.03.
因为3.03>2.706,所以有90%以上的把握认为“体育迷”与性别有关.
课堂练习
1.2×2列联表如下:
y1
y2
总计
x1
a
21
73
x2
5
25
30
总计
b
46
103
则a,b的值分别为( ).
A.94,99 B.52,57 C.52,47 D.57,52
【解析】a+21=73⇒a=52,故b=52+5=57.
【答案】B
2.为了了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总计
30
30
60
由以上数据,计算得到χ2=9.643,根据临界值表,以下说法正确的是( ).
A.没有充足的理由认为课外阅读量大与作文成绩优秀有关
B.有1%的把握认为课外阅读量大与作文成绩优秀有关
C.有95%的以上把握认为课外阅读量大与作文成绩优秀有关
D.有99%的以上把握认为课外阅读量大与作文成绩优秀有关
【解析】根据临界值表,χ2≈9.643>6.635,在犯错误的概率不超过0.01的前提下,认为课外阅读量大与作文成绩优秀有关系,即有99%以上的把握认为课外阅读量大与作文成绩优秀有关.
【答案】D
3.对于χ2有下列几种取值:
①χ2>12;②χ2>0;③χ2>4;④χ2<2.
其中有把握说两事件无关的是 (填序号).
【解析】根据三个临界值可得,当χ2≤2.706时,可判断两事件无关.
【答案】④
4.研究小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示:
种子灭菌
种子未灭菌
合计
黑穗病
26
184
210
无黑穗病
50
200
250
合计
76
384
460
试按照原试验目的作统计分析推断.
【解析】由列联表得
χ2=
=≈4.804,
由于χ2≈4.804>3.841,
所以有95%以上的把握认为种子灭菌与否与小麦发生黑穗病是有关系的.
5.(2013年·福建卷)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:
[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%以上的把握认为“生产能手与工人所在的年龄组有关”?
【解析】
(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.
所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3人,记为A1,A2,A3;25周岁以下组工人有40×0.05=2人,记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:
(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是:
(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15人,“25周岁以下组”中的生产能手40×0.375=15人,据此可得2×2列联表如下:
生产能手
非生产能手
合计
25周岁以上组
15
45
60
25周岁以下组
15
25
40
合计
30
70
100
所以χ2=
=≈1.79.
因为1.79<2.706,
所以没有90%以上的把握认为“生产能手与工人所在的年龄组有关”.
课后练习
1.如果有95%以上的把握说事件A与事件B有关,那么具体算出的数据应满足( ).
A.χ2>3.841 B.χ2<3.841
C.χ2>6.635D.χ2<6.635
【解析】根据对变量的独立性进行判断的结果知选A.
【答案】A
2.对于独立性检验,下列说法错误的是( ).
A.两事件频数相关越小,χ2就越小
B.两事件频数相关越小,χ2就越大
C.χ2≤2.706时,事件A与事件B无关
D.χ2>6.635时,有99%的把握说事件A与事件B有关
【解析】由χ2及对变量的独立性进行检验可以判断A、C、D正确,B不正确.
【答案】B
3.若由一个2×2列联表中的数据计算得χ2=4.013,那么有 以上的把握认为两个变量有关系.
【答案】95%
4.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下列联表:
合格
不合格
总计
甲线
97
3
100
乙线
95
5
100
总计
192
8
200
请问甲、乙两条生产线生产的产品合格率在多大程度上有关系?
【解析】根据列联表中的数据,可以求得
χ2=≈0.521<2.706.
因此没有充分的证据判定甲、乙两条生产线生产的产品合格率有关系.
5.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,下列说法中正确的是( ).
A.100个吸烟者中至少有99人患有肺癌
B.1个人吸烟,那么这个人99%患有肺癌
C.在100个吸烟者中一定有患肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
【解析】独立性检验的结果是可能值,而不是确定的,故选D.
【答案】D
6.假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其2×2列联表为:
Y
X
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
对同一样本,以下数据能说明X与Y有关的可能性最大的一组为( ).
A.a=5,b=4,c=3,d=2B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5D.a=3,b=2,c=4,d=5
【解析】通过计算可知选D.
【答案】D
7.下列关于χ2的说法中,正确的是 .
①χ2在任何相互独立问题中都可以用于检验是否相关;
②χ2越大,两个事件的相关性越大;
③χ2是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题.
【解析】①错,不是任何相互独立问题都能用χ2检验;②错,χ2的值只能体现把握性的大小,不能体现相关性.
【答案】③
8.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:
性别是否需要志愿者
男
女
需要
40
30
不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%以上的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据
(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?
说明理由.
【解析】
(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要提供帮助的老年人的比例约为=14%.
(2)χ2=≈9.967.
由于9.967>6.635,所以有99%以上的把握认为该地区的老年人是否需要帮助与性别有关.
(3)由
(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样的方法更好.
9.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是 .
①若χ2=6.7,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;
③用独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.
【解析】χ2值是支持确定有多大的把握认为“吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.
【答案】③
10.为检验回答一个问题的对错是否和性别有关,有人做了一次调查,其中女生人数是男生人数的,男生答对人数占男生人数的,女生答错人数占女生人数的.
(1)若有99%以上的把握认为回答结果的对错和性别有关,则男生至少有多少人?
(2)若没有充分的证据显示回答结果的对错和性别有关,则男生至多有多少人?
【解析】设男生人数为x,依题意得2×2列联表如下:
对
错
总计
男生
x
女生
总计
x
(1)若有99%以上的把握认为回答结果的对错和性别有关,则χ2>6.635.由χ2==>6.635,解得x>17.69.
∵,为整数,∴若有99%以上的把握认为回答结果的对错和性别有关,则男生至少有18人.
(2)没有充分的证据显示回答结果的对错和性别有关,则χ2≤2.706.由χ2==≤2.706,解得x≤7.216.
∵,为整数,∴若没有充分的证据显示回答结果的对错和性别有关,则男生至多有6人
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 321 独立性检验 321 独立性检验 导学案 321 独立性 检验