抽样分布与参数估计概述.pptx
- 文档编号:30840833
- 上传时间:2024-01-31
- 格式:PPTX
- 页数:101
- 大小:1.08MB
抽样分布与参数估计概述.pptx
《抽样分布与参数估计概述.pptx》由会员分享,可在线阅读,更多相关《抽样分布与参数估计概述.pptx(101页珍藏版)》请在冰豆网上搜索。
统计学导论,曾五一肖红叶主编,3-1,第五章抽样分布与参数估计,第一节抽样的基本概念与数学原理第二节抽样分布第三节参数估计第四节样本容量的确定第五节EXCEL在参数估计中的应用,2,第一节抽样的基本概念与数学原理,一、有关抽样的基本概念二、大数定理与中心极限定理,3,一、有关抽样的基本概念,
(一)样本容量与样本个数1.样本容量。
样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。
一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。
2.样本个数。
样本个数又称样本可能数目,它是指从一个总体中可能抽取多少个样本。
4,
(二)总体参数与样本统计量1.总体参数。
总体分布的数量特征就是总体的参数,也是抽样统计推断的对象。
常见的总体参数有:
总体的平均数指标,总体成数(比例)指标,总体分布的方差、标准差等等。
它们都是反映总体分布特征的重要指标。
5,2.样本统计量。
样本统计量是样本的一个函数。
它们是随机变量。
我们利用统计量来估计和推断总体的有关参数。
常见的样本统计量有:
样本平均数,样本比例,样本的方差、标准差。
6,(三)概率抽样及其组织形式所谓概率抽样,就是要求对总体的每一次观察(每一次抽取)都是一次随机试验,并且有和总体相同的分布。
按这样的要求对总体观测(抽取)n次,可得到容量为n的样本。
7,8,9,(四)放回抽样与不放回抽样,10,11,(五)抽样分布从总体中可以随机地抽取许多样本,由每一个样本都可以计算样本统计量的观测值,所有可能的样本观测值及其所对应的概率便是所谓的抽样分布。
因此,抽样分布也可以称为样本统计量的概率分布。
抽样分布可能是精确地服从某种已知分布(所谓已知分布,例如我们在第四章介绍过的各种常见分布),也可能是以某种已知分布为极限分布。
在实际应用中,后者更为多见。
12,13,14,表5-310人中有放回抽二人的全部可能样本,15,表5-4任职年限样本均值分布数列,16,17,二、大数定理与中心极限定理,18,大数定理表明:
尽管个别现象受偶然因素影响,有各自不同的表现。
但是,对总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,消除由个别偶然因素引起的极端性影响,从而使总体平均数稳定下来,反映出事物变化的一般规律。
19,20,从正态分布的再生定理可以看出,只要总体变量服从正态分布,则从中抽取的样本,不管n是多少,样本平均数都服从正态分布。
但是在客观实际中,总体并非都是正态分布。
对于从非正态分布的总体中抽取的样本平均数的分布问题,需要由中心极限定理来解决。
21,22,23,第二节抽样分布,一、样本平均数的抽样分布二、样本比例的抽样分布,24,一、样本平均数的抽样分布,
(一)样本平均数的期望值与方差,25,26,27,28,
(二)样本平均数的分布规律,29,30,31,例题,1、某地区职工家庭的人均年收入平均为60000元,标准差为8000元。
若知该地区家庭的人人均年收入服从正态分布,现采用重复抽样从总体中随机抽取25户进行调查,求:
(1)样本平均数的数学期望、样本平均数的标准差。
(2)样本平均数等于或超过62000元的可能性有多大?
32,例题,2、某公司1000名职工的人均年奖金为20000元,标准差5000元,从中不放回随机抽取36人作为样本进行调查,求:
(1)样本平均数的数学期望和标准差
(2)样本的人均年奖金在1900022000元的概率有多大?
33,二、样本比例的抽样分布,
(一)样本比例的期望值与方差,34,35,36,37,
(二)样本比例的分布规律,38,表5-5用正态分布来近似时对样本量的要求,39,例:
某企业生产的一种产品,根据以往的经验,合格率为95%。
现从生产线上随机抽取100件产品进行检验,问样本合格率大于等于90%的概率是多少?
40,例:
一种电子元件的合格率是98%。
随机抽取800个元件,其合格率超过96%的概率是多少?
如果在这次抽样中发现样本合格率低于96%,你对这种元件的生产会做出怎样的判断?
41,练习题1:
某商场推销一种洗发水。
据统计,本年度购买此种洗发水的有10万人,其中6万是女性。
如果按不重复随机抽样方法,从购买者中抽出100人进行调查,问样本中女性比例超过50%的可能性有多大?
42,(三)样本方差的抽样分布,43,44,第三节参数估计,一、参数估计概述二、总体均值的估计三、总体比例的估计四、总体方差的估计,45,一、参数估计概述,
(一)参数估计的定义与种类所谓参数估计,就是用样本统计量去估计总体的未知参数(或参数的函数)。
例如,估计总体均值,估计总体比例和总体方差等等。
参数估计有两种基本形式:
点估计和区间估计。
前者是用一个数值作为未知参数的估计值,后者则是给出具体的上限和下限,把包括在这个区间内。
下面分别介绍点估计与区间估计的有关概念。
46,
(二)点估计点估计就是根据总体参数与样本统计量之间的内在联系,直接以样本统计量作为相应总体参数的估计量,点估计又称为定值估计.,47,(三)估计量的优良标准,2.有效性。
又称最小方差性。
48,49,50,4.充分性。
估计量包含了样本中关于的全部信息。
51,(四)区间估计与估计的精度和可靠性,52,53,54,二、总体均值的估计,55,56,57,58,59,60,61,62,例:
为了研究居民用于报刊消费的支出,某城市的统计部门抽取了64户居民进行调查,得到平均用于报刊的消费支出为290元/年,假设总体服从正态分布,且总体的标准差为100元/年.。
对该城市居民户均用于报刊的消费支出做区间估计(置信水平为95%)。
63,例:
某大学为了估计学校在校学生的平均体重,随机抽取了64名学生,测得平均体重为69千克,假设总体服从正态分布,且标准差为12千克。
以95%的置信水平求该学校在校学生的平均体重的置信区间。
64,
(二)总体方差2未知的情形,65,2.区间估计,66,67,68,【例5-4】在例5-3中,若总体方差未知,但通过抽取的6个样本测得的样本方差为0.0025,试在0.95的置信度下,求该产品直径的均值置信区间。
69,例:
某大学为了估计学校在校学生的平均体重,随机抽取了64名学生,测得平均体重为69千克,假设总体总体服从正态分布,且样本标准差为8千克。
以95%的置信水平求该学校在校学生的平均体重的置信区间。
70,三、总体比例的估计,71,72,73,某工厂要估计一批总数5000件的产品的废品率,于是随机抽出400件产品进行检测,发现有32件废品。
试给出该批产品的废品率的区间估计(置信度90%)。
74,三、总体方差的估计,75,
(二)区间估计,76,77,第四节样本容量的确定,一、问题的提出二、估计总体均值时样本容量的确定三、估计总体比例时样本容量的确定四、使用上述公式应注意的问题,78,由前面的论述,我们已知参数估计中的精度要求与可靠性要求常常是一对矛盾,但是,通过增加样本容量n有可能降低样本平均数的标准差,从而实现既保证一定的估计精度,又具有较高的置信度的目的。
这时,需要考虑在给定的置信度与极限误差的前提下,样本容量n究竟取多大合适?
这就是所谓样本容量的确定问题。
一、问题的提出,79,二、估计总体均值时样本容量的确定,80,81,82,三、估计总体比率时样本容量的确定,83,四、使用上述公式应注意的问题,1计算样本容量时,总体的方差与成数常常是未知的,这时可用有关资料替代:
一是用历史资料已有的方差与成数代替;二是在进行正式抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体方差;三是比率方差在完全缺乏资料的情况下,就用比例方差的最大可能值0.25代替。
84,2.如果进行一次抽样调查,需要同时估计总体均值与比率,可用上面的公式同时计算出两个样本容量,取其中较大的结果,同时满足两方面的需要。
85,3.上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最小整数代替。
例如计算得到:
n=56.03,那么,样本容量取57,而不是56。
86,87,88,89,90,第五节Excel在参数估计中的应用,【例5-9】用Excel完成本章思考与练习计算题的第1题。
解:
操作步骤如下。
1构造工作表。
如图5-3所示,A、B列为原始输入数据,A2:
A16存放的是关于最大飞行速度的数据,图中未完全显示出来。
C、D列为计算结果,分别在C2、D2单元格存放置信下限和上限。
91,2定义变量名。
将A列命名为“x”,将B2单元格命名为“置信水平”。
3计算置信上、下限。
分别在C2、D2中输入如下的公式:
=AVERAGE(x)-TINV(1-置信水平,COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x)=AVERAGE(x)+TINV(1-置信水平,COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x),92,本章小结,93,94,5所谓估计就是构造适当的样本统计量,来充当总体参数的估计量。
好的统计量的理想性质包括:
无偏性、有效性、一致性和充分性。
6估计包括点估计与区间估计。
7在给定的置信度与极限误差的前提下,样本容量n可利用极限误差、临界值与抽样标准差三者间的数量关系去计算。
8在Excel中可使用各种函数按照有关公式实现区间估计的运算。
95,1、某地区职工家庭的人均年收入平均为60000元,标准差为8000元。
若知该地区家庭的人人均年收入服从正态分布,现采用重复抽样从总体中随机抽取25户进行调查,求:
(1)样本平均数的数学期望、样本平均数的标准差。
(2)样本平均数等于或超过62000元的可能性有多大?
96,2、某公司1000名职工的人均年奖金为20000元,标准差5000元,从中随机抽取36人作为样本进行调查,求:
(1)样本平均数的数学期望和标准差
(2)样本的人均年奖金在1900022000元的概率有多大?
97,3、在某天生产的500袋食品中,按重复抽样方法随机抽取25袋进行调查,测得平均每袋的重量为996克。
已知该种袋装食品的重量服从正态分布,且标准差为20克。
试以95%的置信度估计该种食品平均重量的置信区间。
98,4、某工厂要估计一批总数5000件的产品的废品率,于是不放回地随机抽出400件产品进行检测,发现有32件废品。
试给出该批产品的废品率的区间估计(置信度是90%)。
99,例:
为了研究居民用于报刊消费的支出,某城市的统计部门抽取了64户居民进行调查,得到平均用于报刊的消费支出为290元/年,假充总体的标准差是100元/年,置信水平为95%。
对该城市居民户均用于报刊的消费劫支出做区间估计。
100,某大学经济系的学生,为了估计学校在校学生的平均体重,随机抽取了64名学生,测得平均体重为69千克,假设总体标准差为12千克。
以95%的置信水平求该学校在校学生的平均体重的置信区间。
101,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 分布 参数估计 概述