随机抽样.docx
- 文档编号:11457408
- 上传时间:2023-03-01
- 格式:DOCX
- 页数:17
- 大小:93.54KB
随机抽样.docx
《随机抽样.docx》由会员分享,可在线阅读,更多相关《随机抽样.docx(17页珍藏版)》请在冰豆网上搜索。
随机抽样
随机抽样
1.简单随机抽样
(1)定义:
设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:
抽签法和随机数法.
2.系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本.
(1)先将总体的N个个体编号;
(2)确定分段间隔k,对编号进行分段.当
(n是样本容量)是整数时,取k=
;
(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
3.分层抽样
(1)定义:
在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
【思考辨析】
判断下面结论是否正确(请在括号中打“√”或“×”)
(1)简单随机抽样是一种不放回抽样.( √ )
(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × )
(3)系统抽样在起始部分抽样时采用简单随机抽样.( √ )
(4)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( × )
(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )
1.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )
A.33人,34人,33人B.25人,56人,19人
C.20人,40人,30人D.30人,50人,20人
答案 B
解析 因为125∶280∶95=25∶56∶19,
所以抽取人数分别为25人,56人,19人.
2.为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为( )
A.3,2B.2,3
C.2,30D.30,2
答案 A
解析 92被30除余数为2,故需剔除2个数,90÷30=3,
∴间隔为3.
3.将参加英语口语测试的1000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为( )
A.700B.669C.695D.676
答案 C
解析 由题意可知,第一组随机抽取的编号l=15,
分段间隔数k=
=
=20,则抽取的第35个编号为a35=15+(35-1)×20=695.
4.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型产品有16件,那么此样本容量n=________.
答案 80
解析 依题意A、B、C三种不同型号样本个数之比为2∶3∶5,
∴样本中B型产品有24件,C型产品有40件,
∴n=16+24+40=80.
题型一 简单随机抽样
例1 下列抽取样本的方式是否属于简单随机抽样?
(1)从无限多个个体中抽取100个个体作为样本.
(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
(3)从20件玩具中一次性抽取3件进行质量检验.
(4)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
思维点拨 由简单随机抽样的特征判断.
解
(1)不是简单随机抽样.因为被抽取的样本总体的个体数是无限的,而不是有限的.
(2)不是简单随机抽样.因为它是放回抽样.
(3)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.
(4)不是简单随机抽样.因为不是等可能抽样.
思维升华
(1)简单随机抽样需满足:
①被抽取的样本总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.
(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).
(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.08B.07C.02D.01
答案 D
解析 从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.
题型二 系统抽样
例2 将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( )
A.26,16,8B.25,17,8
C.25,16,9D.24,17,9
思维点拨 根据“等距”抽样确定各营区被抽中的人数.
答案 B
解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).
令3+12(k-1)≤300得k≤
,因此第Ⅰ营区被抽中的人数是25;
令300<3+12(k-1)≤495得
结合各选项知,选B. 思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大. (2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔. (3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定. (2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11B.12C.13D.14 答案 B 解析 由 =20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为 = =12(人). 题型三 分层抽样 例3 (2014·广东)已知某地区中小学生人数和近视情况分别如图 (1)和图 (2)所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( ) A.200,20B.100,20 C.200,10D.100,10 答案 A 解析 该地区中小学生总人数为 3500+2000+4500=10000, 则样本容量为10000×2%=200,其中抽取的高中生近视人数为2000×2%×50%=20,故选A. 思维升华 进行分层抽样的相关计算时,常利用以下关系式巧解: (1) = ; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比. (2013·湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于( ) A.9B.10C.12D.13 答案 D 解析 ∵ = ,∴n=13. 五审图表找规律 典例: (12分)某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示: 人数 管理 技术开发 营销 生产 共计 老年 40 40 40 80 200 中年 80 120 160 240 600 青年 40 160 280 720 1200 共计 160 320 480 1040 2000 (1)若要抽取40人调查身体状况,则应怎样抽样? (2)若要开一个25人的讨论单位发展与薪金调整方面的 座谈会,则应怎样抽选出席人? (3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样? 审题路线图 抽取40人调查身体状况 ↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响 ↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓ 要开一个25人的座谈会 ↓(讨论单位发展与薪金调整) 样本人群应受管理、技术开发、营销、生产方面的影响 ↓(表中管理、技术开发、营销、生产分类清楚,人数确定) 要以管理、技术开发、营销、生产人员分层,用分层抽样 ↓ 要抽20人调查对广州亚运会举办情况的了解 ↓(可认为亚运会是大众体育盛会,一个单位人员对情况了解相当) 将单位人员看作一个整体 ↓(从表中数据看总人数为2000人) 人员较多,可采用系统抽样 规范解答 解 (1)按老年、中年、青年分层,用分层抽样法抽取,[1分] 抽取比例为 = .[2分] 故老年人,中年人,青年人各抽取4人,12人,24人.[4分] (2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,[5分] 抽取比例为 = ,[6分] 故管理,技术开发,营销,生产各部门抽取2人,4人,6人,13人.[8分] (3)用系统抽样, 对全部2000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1900,共20人组成一个样本.[12分] 温馨提醒 (1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确. (2)本题易错点是,对于第 (2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样. 方法与技巧 1.简单随机抽样的特点: 总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性;个体间无固定间距. 2.系统抽样的特点: 适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样. 3.分层抽样的特点: 适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样. 失误与防范 进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠. (2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同. A组 专项基础训练 (时间: 25分钟) 1.(2013·课标全国Ⅰ)为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( ) A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样 答案 C 解析 不同的学段在视力状况上有所差异,所以应该按照学段分层抽样. 2.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) A.6B.8C.10D.12 答案 B 解析 设样本容量为N,则N× =6,∴N=14, ∴高二年级所抽学生人数为14× =8. 3.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250 ②5,9,100,107,111,121,180,195,200,265 ③11,38,65,92,119,146,173,200,227,254 ④30,57,84,111,138,165,192,219,246,270 关于上述样本的下列结论中,正确的是( ) A.②、③都不能为系统抽样B.②、④都不能为分层抽样 C.①、④都可能为系统抽样D.①、③都可能为分层抽样 答案 D 解析 因为③为系统抽样,所以选项A不对;因为②为分层抽样,所以选项B不对;因为④不为系统抽样,所以选项C不对,故选D. 4.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为( ) A.13B.19C.20D.51 答案 C 解析 抽样间隔为46-33=13, 故另一位同学的编号为7+13=20,选C. 5.某学校高一、高二、高三三个年级共有学生3500人,其中高三学生是高一学生的两倍,高二学生比高一学生多300人,现在按 的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为( ) A.8B.11C.16D.10 答案 A 解析 设高一学生有x人,则高三学生有2x人,高二学生有(x+300)人,学校共有4x+300=3500(人),解得x=800(人),由此可得按 的抽样比例用分层抽样的方法抽取样本,高一学生应抽取的人数为 ×800=8(人),故应选A. 6.已知某商场新进3000袋奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则61组抽出的号码为________. 答案 1211 解析 每组袋数: d= =20, 由题意知这些号码是以11为首项,20为公差的等差数列,a61=11+60×20=1211. 7.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________. 答案 16,28,40,52 解析 编号组数为5,间隔为 =12, 因为在第一组抽得04号: 4+12=16,16+12=28,28+12=40,40+12=52, 所以其余4个号码为16,28,40,52. 8.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生. 答案 15 解析 抽取比例与学生比例一致. 设应从高二年级抽取x名学生,则x∶50=3∶10.解得x=15. 9.某校共有学生2000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________. 一年级 二年级 三年级 女生 373 x y 男生 377 370 z 答案 16 解析 依题意可知二年级的女生有380人,那么三年级的学生人数应该是2000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64× =16. 10.用系统抽样法从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是________. 答案 11 解析 由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x,则由系统抽样的法则可知,第n组抽出个体的号码应该为x+(n-1)×8,所以第16组应抽出的号码为x+(16-1)×8=123,解得x=3,所以第2组中应抽出个体的号码为3+(2-1)×8=11. B组 专项能力提升 (时间: 15分钟) 11.(2014·湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) A.p1=p2 C.p1=p3 答案 D 解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3. 12.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为( ) A.7B.9C.10D.15 答案 C 解析 由系统抽样的特点知: 抽取号码的间隔为 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729=459+(n-1)×30,解得n=10.所以做问卷B的有10人. 13.某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________. 答案 160 解析 关键是确定样本的抽取比例. 男生人数为560× =160. 14. 200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人. 答案 37 20 解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x人,则 = ,解得x=20. 15.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________. 答案 76 解析 由题意知: m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76. 16.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n. 解 总体容量为6+12+18=36. 当样本容量是n时,由题意知,系统抽样的间隔为 ,分层抽样的比例是 ,抽取的工程师人数为 ×6= ,技术员人数为 ×12= ,技工人数为 ×18= ,所以n应是6的倍数,36的约数,即n=6,12,18. 当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为 ,因为 必须是整数,所以n只能取6.即样本容量n=6.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机 抽样