统原PP第七章抽样估计(下)山西农大.pptx
- 文档编号:30811429
- 上传时间:2024-01-30
- 格式:PPTX
- 页数:28
- 大小:665.20KB
统原PP第七章抽样估计(下)山西农大.pptx
《统原PP第七章抽样估计(下)山西农大.pptx》由会员分享,可在线阅读,更多相关《统原PP第七章抽样估计(下)山西农大.pptx(28页珍藏版)》请在冰豆网上搜索。
第五节成数及其抽样估计,一、成数及其性质是非标志(交替标志):
只有两种标志表现。
成数具有某种标志的单位数在总体单位数中所占的比重。
总体单位数为N,具有某种标志的单位用1表示,单位数为N1,成数为不具有某种标志的单位用0表示,单位数为N0,成数为成数的平均数就是成数本身。
成数的标准差为PQ的几何平均数。
1,二、样本成数的分布,1、样本成数样本单位数为n,具有某种标志者用1表示,单位数为n1,成数为;不具有某种标志者用0表示,单位数为n0,成数为;p+q=12、大数定理:
只要n足够大(n50),样本成数趋于总体成数pP,样本标准差趋于总体标准差3、样本成数的分布数理统计证明,在n不小于50,nP和nQ均不小于5时,样本成数的分布近似于正态分布。
样本成数的均数等于总体成数。
样本成数的标准差,重置抽样不重置抽样,2,三、总体成数的抽样估计,据中心极限定理有极限抽样误差概率度t与置信概率之间的关系查标准正态分布表。
数理统计证明:
pq为PQ的偏误估计量,而是PQ的无偏估计量,即抽样误差:
重置抽样不重置抽样,3,成数抽样估计的步骤,1、据样本资料计算p、q2、检验n50np5nq53、用正态分布表依据确定t4、计算抽样误差重置抽样不重置抽样5、计算极限抽样误差6、计算置信区间7、回答,4,成数抽样估计举例学生7000人,抽取100人,有男生60人,以90%的置信概率估计全部学生中男生人数。
解:
据样本资料可得检验np=605nq=405n=10050均满足条件=90%表正态分布表得t=1.64抽样误差极限抽样误差男生比重置信区间男生总数置信区间,5,例6-3,例3对一批产品4000按不重复抽样方法抽取200件进行检验,发现有废品8件;又知样本容量n为成品总量N的。
当概率为95%时,估计这批成品中废品率的区间范围。
6,例6-5,对5000件零件进行抽样调查,测得样本废品率为1.5%,抽样平均误差为0.5%,现以95%的概率保证,估算全部零件的废品数量。
三、总量指标的抽样推算,7,第六节必要样本容量,一、必要样本容量的意义据大数定理:
样本容量越大,代表性越强,误差越小,估计越可靠,但样本单位数过多,就失去了抽样估计的意义。
反之,样本容量过大,误差太大,也失去了抽样估计的意义。
按事先给定的置信概率和极限抽样误差计算的抽样单位数,称为必要样本容量。
二、影响样本容量的因素1、抽样推断的可靠程度和精度2、允许误差的范围3、总体各单位标志变异程度4、抽样的方法和抽样的组织方式,8,三、必要样本容量的计算公式估计均数重置抽样不重置抽样估计成数重置抽样不重置抽样,9,四、必要样本容量的应用,1、和未知,用历史资料试验性抽样P和Q未知,历史资料或试验抽样用PQ=0.252、np必须满足不少于50,nP、nQ均不小于5的条件,否则增加数量,以至达到规定条件。
3、同时估计和P,若用较大数。
必要样本容量计算练习1、对万亩小麦抽样测产,要求允许误差不超过5公斤,置信概率不低于95%,该抽查多少亩?
(=30公斤)2、对7000名大学生戴眼镜情况进行抽样调查,允许误差不超过5%,置信概率不低于68.27%,该抽多少人?
10,3.某市有职工96,000户,在职工家庭生活费调查中,已知职工家庭每人平均生活费收入的标准差为40元,在概率保证程度为95.45%的条件下,要求抽样极限误差不超过10元,现进行简单随机不重复抽样,其样本容量确定如下:
11,第六节抽样设计,一、抽样设计的目的根据调查对象的特点和调查目的的要求,确定合适的样本抽选方式,并对其产生的抽样误差进行估计的工作抽样方式单阶段抽样简单(纯)随机抽样类型抽样(分类、分层)机械抽样(等距、系统)整群抽样多阶段抽样以上方法的结合应用多阶段对称等距抽样保证随机性、提高代表性、减少抽样误差、以求效果最佳。
12,抽样组织方式(不同于调查的组织方式),阶段抽样另解单阶段抽样抽出的样本单位直接就是总体单位两阶段抽样先将总体进行分组,从中随机抽取一些组,然后再从中选的组中随机抽取总体单位多阶段抽样将总体进行多层次的分组,然后依次在各组中随机抽取,直到抽取总体单位,13,抽样方法,即放回抽样。
比如,要从总体N个单位中随机抽取容量为n的样本,每次从总体中抽取一个单位,把这看作是一次试验,将结果记录后放回总体中,重新参加下一次的抽取;将此过程连续进行n次,即不放回抽样,是指从总体中抽取的单位不再放回去,只从剩下的单位中进行抽取,等距抽样也称为系统抽样,它是按照某种顺序给总体中所有单元编号,然后随机地抽取一个编号作为样本的第一个单元,样本的其它单元则按照某种确定的规则抽取(如等距原则),先将总体按照某种特征或指标分成几个排斥的又是穷尽的子总体,或层,然后在每个层内按照随机的方法抽取元素,先将总体划成许多相互排斥的子总体或群,然后以群为初级抽样单元,按某种概率抽样技术,如简单随机抽样,从中抽取若干个群,对抽中的群内的所有单元都进行调查,第一阶段从所有群中抽取若干群,在每个抽中的群中,再抽取若干单元进行调查,14,二、简单(纯)随机抽样,1、抽样方式对全及总体的所有单位不作任何分组排队的情况下,从中任意抽取样本单位。
直接抽取法抽签法随机数法2、计算公式3、运用特点用于单位少变异小的总体,15,三、类型抽样(分类、分层),1、抽样方式将全及总体各单位按一定标志分成若干类型组,然后在各类型组中抽取样本单位。
(分组与抽样结合)类型比例抽样大组多抽、小组少抽类型最优抽样大组多抽、变异大多抽类型抽样的特点:
提高样本的代表性大小搭配、分布接近降低抽样平均误差数理统计证明了总方差分解原理总方差等于组间方差与平均组内方差之和=+平均组内方差是各组组内方差的平均数。
组间方差是各组平均数之间的方差因各组皆查,故组间方差不影响抽样误差。
估计各组有关特征数,16,2、计算公式,以平均组内方差代替总体方差。
3、运用特点分组时应尽量缩小组内方差。
17,类型抽样的抽样平均误差的计算
(1)平均数的抽样平均误差
(2)成数的抽样平均误差,抽样组织方式,18,抽样组织方式,例6-7,某厂有甲乙两个车间都生产保温瓶胆,乙车间技术先进,其产量是甲车间的2倍,为了调查该厂保温瓶的保温时间,按两车间产量比例共抽查60只瓶胆,其资料如表所示。
现以95.45%的可靠程度推断该厂生产的全部瓶胆的平均保温时间的可能范围。
19,a,20,抽样组织方式,例6-8,某地区有10000居民住户,按城市居民和农村居民的比例采用不重复抽样方法抽取1000户进行手机拥有量的调查,资料如表6.3所示。
现以95%的概率推断该地区手机拥有户的比重范围。
21,22,四、机械抽样,1、抽样方式将全及总体所有单位按某一标志顺序排列后,按相等的距离抽取样本单位。
有关标志排队法无关标志排队法(可视为不重置的简单随机抽样)抽样间隔:
样本单位抽取半距法随机起点法(有系统性误差)2、计算公式特殊类型抽样分组多不重置组抽一重置抽样不重置抽样3、运用特点用于变异大、总体单位少的情况应避免系统性误差常有现成排队可用,23,五、整群抽样,1、抽样方式将全及总体单位划分为若干群体,一群一群地抽取,并对抽中群的所有单位进行全面调查。
只需对群编号样本群抽选可用简单或机械法2、计算公式影响因素的因素样本群的多少。
共分R群、抽出r群。
群间方差(组间)群内方差不影响抽样误差抽样方式皆不重置修正抽样误差均数估计成数估计3、运用特点样本单位集中、调查省人省事分群时尽量缩小群间方差,24,整群抽样的抽样平均误差的计算设总体中的全部单位划分为R群,每群中所包含的单位数为m,现从所有群中抽取r群组成样本。
25,a,26,六、多阶段抽样,1、抽样方式将抽样过程分成若干阶段,逐段抽取样本。
第一阶段:
将总体分成若干组,抽出部分组作为一级样本组。
第二阶段:
将每个一级样本组再分成若干组,抽出部分组作为二级样本组。
中间各阶段方法相同。
最后阶段:
从上级样本组中抽出部分单位作为样本单位。
各阶段都可是纯随机或机械抽样。
2、误差计算:
各阶级抽样误差的累积,较难。
3、运用特点:
克服单位多、地域广的困难。
可用现有行政区划完成。
较前阶段对误差影响也较大,缩小组间方差。
27,优点详解:
便于组织抽样。
它可以按现有的行政区划或地理区域划分各阶段的抽样单元,从而简化抽样框的编制。
可以获得各阶段单元的调查资料,根据最初资料进行逐级抽样推断,得到各级的调查资料。
多阶段抽样的方式比较灵活,各阶段抽样的组织方式应以前述的几种抽样组织方式为依据进行选择。
多阶段抽样在简化抽样工作的同时,又因抽样单位的分布较广,而具有较强的代表性。
28,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- PP 第七 抽样 估计 山西 农大