抽样和抽样分布.pptx
- 文档编号:30840838
- 上传时间:2024-01-31
- 格式:PPTX
- 页数:89
- 大小:1.05MB
抽样和抽样分布.pptx
《抽样和抽样分布.pptx》由会员分享,可在线阅读,更多相关《抽样和抽样分布.pptx(89页珍藏版)》请在冰豆网上搜索。
第四章抽样和抽样分布,第一节随机事件及其概率第二节随机变量的概率分布第三节抽样分布第四节正态分布和正态逼近,一.抽样二.试验三.样本空间四.事件及其概率,第一节随机事件及其概率,一、抽样1.概念从总体中抽取部分单位,并进行实际调查,以推断总体。
2.抽样的两种方法:
重置抽样和不重置抽样,两种抽样方法,重置抽样1.概念:
也称有放回的抽样,从总体中抽取一个单位,登记后再放回总体参加下一次的抽取,连续试验n次。
2.重置抽样排列数:
从总体N个单位,抽取样本容量为n个单位的重置试验,可能抽取的样本点个数:
不重置抽样1.概念:
也称无放回的抽样,每次总体中抽取一个单位,登记后不再放回原总体,不参加下一次抽选,下一次继续从总体余下的单位抽取样本单位,这样继续进行n次试验。
有n个单位的样本是由n次连续试验构成的,但因每次抽出不重置,所以实质上等同于同时从总体中抽取n个样本单位。
不重置抽样排列数:
不重置抽样又分为考虑顺序和不考虑顺序的情况(排列与组合)。
从10个同学中抽三个担任不同职务,有:
从10个同学中抽三个考察其平均成绩,则:
二、试验1.概念:
在相同条件下,对事物或现象所进行的观察。
例如:
掷一枚骰子,观察其出现的点数;产品质量检验,考察其是否是合格品等。
2.试验具有以下特点:
可以在相同的条件下重复进行;每次试验的可能结果不止一个,但试验的所有可能结果在试验之前是确切知道的;在试验结束之前,不能确定该次试验的确切结果;,1.基本事件如果一个事件不能分解成两个或更多个事件,则这个事件称为基本事件,也称为样本点。
通常样本点不止一个单位,而是由许多单位构成,这时就要连续n次试验的结果构成一个样本点。
2.样本空间以全部样本点为元素的集合,称为样本空间。
三、样本空间,练习题,写出随机试验的样本空间1.记录某班一次统计学测试的平均分数2.某人骑自行车在公路上行驶,观察该骑车人在遇到第一个红灯停下来以前已经遇到的绿灯个数。
3.生产产品,直到有10件正品为止,记录生产产品的总件数。
1.事件:
随机试验的每一个可能结果(任何样本点集合)例如:
掷一枚骰子出现的点数为32.随机事件:
每次试验可能出现也可能不出现的事件例如:
掷一枚骰子可能出现的点数3.必然事件:
每次试验一定出现的事件,用表示。
例如:
掷一枚骰子出现的点数小于74.不可能事件:
每次试验一定不出现的事件,用表示。
例如:
掷一枚骰子出现的点数大于6,四、事件及其概率,5.事件的概率,
(1)事件A的概率是对事件A在试验中出现的可能性大小的一种度量
(2)表示事件A出现可能性大小的数值,事件A的概率表示为P(A)(3)概率的定义有:
古典定义、统计定义和主观概率定义,6.概率的统计定义,在相同条件下进行n次随机试验,事件A出现m次,则比值m/n称为事件A发生的频率。
随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为,例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数n的增大,出现正面和反面的频率稳定在1/2左右,第二节随机变量及其分布,一、随机变量的概念二、离散型随机变量的概率分布三、连续型随机变量的概率分布,一、随机变量的概念,1.概念随机事件的数量表现就称为随机变量。
例如:
投掷两枚硬币出现正面的数量;从班级同学中抽10个,抽中女生的人数。
2.分类根据取值情况的不同分为离散型随机变量和连续型随机变量,
(1)离散型随机变量,如果随机变量X的取值都可以逐个列举出来X1,X2,则X称为离散型随机变量离散型随机变量的一些例子,
(2)连续型随机变量,如果X的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点,则称该随机变量为连续型随机变量连续型随机变量的一些例子,二、离散型随机变量的概率分布,1.离散型随机变量X的所有可能取值及其取这些值的概率按顺序排列起来就形成概率分布。
2.通常用下面的表格来表示,3.概率分布的性质:
随机变量取值的概率是非负的,即pi0;随机变量所有取值的概率总和等于1,即,(i1,2,n),4.离散型随机变量的概率分布(实例),【例】如规定打靶中域得3分,中域得2分,中域得1分,中域外得0分。
今某射手每100次射击,平均有30次中域,55次中域,10次中,5次中域外。
则考察每次射击得分为0,1,2,3这一离散型随机变量,其概率分布为,5.离散型随机变量的数学特征,离散型随机变量的数学期望离散型随机变量的方差,离散型随机变量的数学期望,
(1)在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其相对应的概率pi乘积之和。
(2)计算公式为,(3)性质第三章所讲的平均数的性质也完全适合于数学期望。
对于抽样分布通常要考虑多个变量的情况,所以还要补充两条性质。
n个随机变量代数和的数学期望等于它们的数学期望之和。
n个独立随机变量连乘积的数学期望等于它们数学期望的乘积,离散型随机变量的方差,
(1)随机变量X的每一个取值与期望值的离差平方的数学期望,记为D(X),或Var(X),或它用来描述离散型随机变量取值的分散程度
(2)计算公式为,离散型随机变量的方差(实例),【例】投掷一枚骰子,出现的点数是个离散型随机变量,其概率分布为如下。
计算数学期望和方差,解:
数学期望为:
方差为:
三、连续型随机变量的概率分布,连续型随机变量可以取某一区间或整个实数轴上的任意一个值。
它取任何一个特定的值的概率都等于0,所以不能列出每一个值及其相应的概率,通常研究它取某一区间值的概率,
(一)密度函数f(x),1.f(x)表示随机变量X在点x上的概率密度,所以称为密度函数。
2.f(x)不是概率。
3.通常把密度函数的图形称为分布曲线。
在平面直角坐标系中画出f(x)的图形,则对于任何实数ab,P(aXb)是该曲线下从a到b的面积,概率是曲线下的面积,
(二)密度函数具有以下性质:
1.密度函数是非负函数,即2.随机变量X落在区间内的概率等于它的密度函数在该区间上的定积分。
即:
其几何意义就是概率等于区间上分布曲线和X轴围成的面积。
3.由于是必然事件,所以,(三)分布函数,1.连续型随机变量的概率也可以用分布函数F(x)来表示2.分布函数定义为,根据分布函数,P(aXb)可以写为,分布函数与密度函数的图示,1.密度函数曲线下的面积等于12.分布函数是曲线下小于x0的面积,(四)连续型随机变量的期望和方差,1.连续型随机变量的数学期望为2.方差为,第三节抽样分布,基本概念重置抽样分布及其数值特征不重置抽样分布及其数值特征,一、基本概念1.抽样分布:
从一个总体中抽取样本容量相同的所有可能样本之后,计算样本统计量的值及取该值的相应概率,就组成了样本统计量的概率分布,简称抽样分布。
主要样本统计量,平均数比率(成数)方差,.参数和统计量(总体指标和抽样指标),总体参数(总体指标)(parameter)根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指标称为全及指标。
全及指标值具有唯一性。
常用的全及指标有总体平均数()(或总体成数P)、总体标准差(或总体方差2)。
统计量(抽样指标),由抽样总体各单位标志值计算出来反映样本特征,用来估计总体的综合指标称为统计量(抽样指标)。
它是一个随机变量。
3.统计量的特点,统计量(抽样指标)是随机变量,随着抽到的样本单位不同其取值也会有变化。
统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应。
要了解本班男同学的身高,从总共30名男同学中抽取5名同学测量他们的身高,用这5名同学的平均身高来估计本班男同学的身高。
样本点:
样本空间:
样本统计量:
4.统计量的计算,样本平均数:
样本方差:
样本成数:
二、重置抽样分布,
(一)样本平均数的分布样本平均数的分布是总体中全部样本平均数的可能取值和与之相应的概率组成。
下面用一个例子来说明该问题,某班组5个工人的日工资为34、38、42、46、50元。
现用重置抽样的方法从5人中随机抽2个构成样本。
共有52=25个样本。
样本平均数的均值、方差及标准差:
抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,又称为抽样平均误差,用表示。
(二)两个重要结论:
1.重置抽样的样本平均数的平均数等于总体平均数,即2.重置抽样的抽样平均数的标准差等于总体标准差除以样本单位数的平方根。
即,样本抽样分布,原总体分布,以上两个结论具有普遍意义,其一般推导见课本p113。
这一等式可以看出两项重要事实
(1)抽样平均误差比总体标准差小的多,仅为其。
例如一个县的粮食亩产高低悬殊,亩产标准差为80公斤,如果随机抽取100亩求平均亩产,那么样本平均亩产量的差异就显著减小,平均误差只及总体亩产标准差的,即所以用样本平均亩产来代表总体平均亩产是更有效的.,
(2)抽样平均误差与总体标准差成正比变化,而与样本容量n的平方根成反比变化。
例如在同一个总体中,如果抽样单位数扩大原来的4倍,则抽样平均误差就缩小一半,如果抽样平均误差增加一倍,则样本单位数只需要原来的1/4。
(三)总体成数的估计总体成数p是指具有某种特征的单位在总体中的比重。
在前面我们已经知道,成数是一个特殊平均数,设总体单位总数目是N,总体中有该特征的单位数是N1。
设X是0、1变量,即:
总体单位有该特征,则X取1,否则取0,则有:
现从总体中抽出n个单位,如果其中有相应特征的单位数是n1,则样本成数是:
成数P也是一个随机变量,利用样本平均数的分布性质结论,即有:
例题,Eg.已知某批零件的一级品率为80,现用重置抽样方法从中抽取100件,求样本一级品率的抽样平均误差。
三、不重置抽样分布,
(一)样本平均数的分布,某班组5个工人的日工资为34、38、42、46、50元。
现用不重置抽样的方法从5人中随机抽2个构成样本。
共有20个样本。
不重置抽样样本平均数的平均数、方差及标准差:
(二)两个重要结论:
1.不重置抽样分布虽然与重置抽样分布不同,但它们的样本平均数的平均数仍等于总体平均数,即:
2.抽样平均数的标准差也是反映样本平均数与总体平均数的平均误差程度。
即:
所以抽样平均数的标准差也可称为抽样平均误差,或抽样标准误差,不重置抽样的抽样平均误差等于重置抽样的平均误差乘以修正因子,n/N称为抽样比。
(三)样本成数的分布,抽样平均误差为:
对于(0,1)分布的总体,总体平均数为:
总体方差为:
从总体中抽取容量为n的样本,样本成数p的分布实质是样本平均数的分布。
有:
抽样平均误差公式汇编,回顾,某企业生产一批灯泡,共10,000只,随机抽取500只做耐用试验。
测算结果平均使用寿命为5,000小时,由历史经验得知总体标准差为300小时,500之中发现10只不合格。
求平均数和成数的抽样平均误差。
第四节正态分布和正态逼近,一、正态分布二、正态分布再生定理三、中心极限定理四、抽样分布的正态逼近,一、正态分布,
(一)正态分布概述:
1.定义一个连续型随机变量X,如果其密度函数为那么我们称X服从参数为x和正态分布。
连续型随机变量的一种重要分布,它是统计推断的基础,2.密度函数f(x)的性质,
(1)对称性;
(2)非负性;(3)最大值;(4)拐点;,f(x),(5)x和的意义;,位置参数,形状参数,
(1)变动平均数
(2)变动标准差,改变分布中心位置;表现为图形的平移。
分布疏密程度表现为图形的拉伸或压缩,
(二)正态分布函数的标准化,1.标准正态分布定义数学期望为0,方差为1的正态分布,称为标准正态分布。
用N(0,1)来表示。
变量X服从标准正态分布记为:
标准正态分布其几何意义是将分布曲线的中心移到原点,使得离差化为以为单位的相对离差。
2.标准正态分布的特点:
(1)分布的平均数(数学期望)为0;
(2)分布的方差为1。
(3)密度函数为:
(4)分布函数:
3.非标准正态分布标准化,
(1)为什么要把不同的正态分布变换为具有相同参数的标准正态分布:
N(0,1)?
为了计算的方便!
计算服从标准正态分布的变量取值在某个区间的概率只需查标准正态概率分布表
(2)如何进行标准化?
标准正态分布表的两种形式:
本教材后附表是这种形式,-Z,形式1,形式2,在统计推断中,常常需要
(1)求随机变量Z距中心的绝对值不超过z的概率。
即变量落在区间(z,z)的概率。
(2)给定F(z),求随机变量Z距中心的距离z。
记住,4.标准正态分布表的使用:
例题:
例题:
二、正态分布再生定理,三、中心极限定理P126,随着n的增大而趋近于,中心极限定理,大样本n30,n,小结:
正态分布再生定理:
限定总体服从正态分布,对样本容量n无要求;中心极限定理:
总体分布可不为正态分布,甚至可以不知道总体的分布。
要求样本单位数n很大(至少n30),则样本平均数就趋近于正态分布。
四、抽样分布的正态逼近,正态逼近应用于样本统计量取值某个区间的概率总体分布类型不清楚时,只要样本容量相当大,就可以用正态分布来近似地估计样本平均数和样本成数取值某个区间的概率一般认为,时为大样本,抽样分布接近正态。
-0.401.2,思考与练习(P130132),思考题:
4.64.74.114.124.13,练习题:
4.22,34.244.25,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 分布