统计学大题13要点.docx
- 文档编号:25258
- 上传时间:2022-10-01
- 格式:DOCX
- 页数:18
- 大小:337.11KB
统计学大题13要点.docx
《统计学大题13要点.docx》由会员分享,可在线阅读,更多相关《统计学大题13要点.docx(18页珍藏版)》请在冰豆网上搜索。
统计学大题13要点
一,根据以下数据,分别计算:
算术平均数,中位数,众数,标准差。
抽取零售企业105家的销售收入如下表:
月销售额(万元)
分销店(个)
组中值
40以下
40—60
Me60—80
80—100
100—120
120以上
15
19
Mo26
20
14
11
30
50
70
90
110
130
解:
先求出组中值,如上表所示。
直接按计算器,可得:
算术平均数=76.09
标准差=30.65
中位数=60+{(105/2)-34/26}*20=74.23
众数=60+{(26-19)/(26-19)+(26-20)}*20=70.77
附:
计算器按法:
开机→mode→2→shift→mode→1→=→
输入数据(30shift,15M+50shift,19M+……)→shift→2
→计算器即显示各个指标,1为平均数,2为总体标准差,3为样本标准差
2,区间估计
求置信区间的方法与步骤:
第一步根据中心极限定理,构造一个含未知参数的分布
第二步对给定的置信度,1-α查表得到标准分zα/2
第三步利用不等式变形,求出未知参数1-α置信区间.
二,总体均值的区间估计
①正态总体,方差已知,(大、小)样本
例1,某种零件长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为21.4mm。
已知总体标准差=0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。
解:
已知X-N(,0.152),x=2.14,n=9,1-=0.95,Z/2=1.96
总体均值的置信区间为
结论:
我们可以95%的概率保证该种零件的平均长度在21.302~21.498mm间。
当
时,需要修正,
例2,某企业生产某种产品的工人有1000人,某日采用非重复抽样抽取100人调查他们的当日产量,样本人均产量为35件,如果总体产量的标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。
②正态总体,大样本,当方差未知时,以样本方差替代即可
③总体比例的区间估计
重复抽样VS不重复抽样:
例:
某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。
在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。
试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。
解:
已知n=200,
=0.7,
=0.95,Z/2=1.96
结论:
我们可以95%的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%~76.4%之间。
68.26%
1
80%
1.28
90%
1.645
95%
1.96
95.45%
2
99%
2.58
99.73%
3
④T分布:
正态总体、当样本容量n<30,总体标准差σ未知时,用样本标准差S代替。
自由度为(n-1)置信区间为:
例:
某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:
克)分别为789、780、794、762、802、813、770、785、810、806,如果袋装重量服从正态分布,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。
三,样本容量的计算
估计总体均值时样本容量的确定:
①根据均值区间估计公式可得样本容量n为
②根据比例区间估计公式可得样本容量n为
(若总体比例P未知时,可用样本比例来代替)
例:
某超级市场欲估计每个顾客平均每次购物的金额,根据过去的经验,标准差大约为160元,现要求以95%的置信度估计每个顾客的购物金额,并要求允许误差不超过20元,应抽多少顾客作样本?
总体方差未知时样本容量的确定
例1,某品牌电脑公司,准备将电脑销售市场转入拉美地区,事先派出有关人员到该地区查询资料,以便估计一下该地区有电脑的家庭所占的比例。
公司希望这一比例的估计允许误差不超过0.05,且置信度为95%。
问:
要抽取多大容量的样本?
(事先对总体一无所知)。
解:
已知=0.05,=0.05,Z/2=1.96,当p未知时用最大方差0.25代替
应抽取的样本容量为
例2,某企业对一批产品进行质量检查,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%、和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?
4.假设检验
步骤:
1、提出原假设和备择假设
原假设:
有待检验的假设备择假设:
拒绝原假设后可供选择的假设。
原则:
(1)“不轻易拒绝原假设
(2)原假设总是与等号连在一起。
假设的三种形式:
(1)双侧检验:
(2)左侧检验:
如果指标越大越好以及要求指标是否明显降低。
(3)右侧检验:
如果指标越小越好以及要求指标是否明显增加
2、选择适当的统计量,并按照中心极限定理确定其分布形式
3、选择选择显著性水平,确定临界值。
显著性水平
表示H0为真时拒绝H1的概率,即拒绝原假设的风险。
(
总是与H1相对应)
4、抽取样本,计算样本统计量,比较统计量与临界值的大小。
5、作出统计结论和经营管理决策结。
例题1:
(右侧检验)
根据过去大量资料,某厂生产的产品的使用寿命服从正态分布N(1020,1002),
现从最近生产的一批产品中随机抽取16件,测得样本平均寿命为1080小时。
试
在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?
例题2:
(左侧检验)
一个生产宇航飞行器的工厂需要经常购买一种耐高温的零件,要求抗热的
平均温度是1250℃,在过去,供货商提供的产品都符合要求,并从大量的
数据获知零件抗热的标准差为150℃,在最近的一批进货中随机测试了100
个零件,其平均的抗热为1200℃,能否接受这批产品?
工厂希望对实际产
品符合要求而错误地加以拒绝的风险为0.05。
例题3:
(t-检验)
相关知识:
正态总体、方差未知、小样本时服从t分布
某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准
重量为1000克。
某日随机抽查9包,测得样本平均重量为986克,样本标准差
为24克。
试问在0.05的检验水平上,能否认为这天自动包装机工作正常?
例题4:
(Z-检验)
相关知识:
对总体比例的假设检验通常是在大样本的条件下进行的,根据
正态分布来确定临界值,即采用Z-检验法。
某研究者估计本市居民家庭的电脑拥有率为30%。
现随机抽查了200个家庭,
其中68个家庭拥有电脑。
试问该研究者的估计是否可信(
=10%)?
5.相关与回归分析:
相关知识:
(1)相关系数的计算公式:
一般用表示总体相关系数,用r表示样本相关系数。
相关系数r的平方等于可决系数。
(2)估计标准误差:
用来说明回归方程代表性大小的统计分析指标。
若估计标准误差小,表明回归方程代表性大;反之,若估计标准误差大,表明回归方程代表性小。
例题:
现有8个企业的月产量和生产费用资料如下表:
月产量(吨)
1.2
2
3.1
3.8
5
6.1
7.2
8
生产费用(万元)
62
86
80
110
115
132
135
160
求:
(1)计算相关系数,指出两者之间的相关程度;
(2)计算判定系数,并解释;
(3)用最小平方法配合生产费用对月产量的回归直线模型;指出回归系数的经济含义;
(4)求可决系数,并解释。
(4)估计回归的标准误差;
(3)回归系数的经济含义为当月产量每变动1吨时,生产费用同方向平均变动
12.9万元。
(2分)
(4)r2=0.9697=0.940生产费用的增加94%是由于月产量的增加,有6%是其他因素引起的。
(注意:
不确定是不是这样答)
(5)
={(104214-51.305×880-12.9×4544.6)÷6}0.5
=233.47
6.统计指数:
计算原则:
(1)在计算综合指数时,同度量因素必须固定在同一期。
(2)在计算质量指标综合指数时,同度量因素选择数量,且必须固定在报告期。
(3):
在计算数量指标综合指数时,同度量因素选择质量,且必须固定在基期。
例题:
设某粮油商店2006年和2007年三种商品的零售价格和销售量资料如表。
计算三种商品的价格综合指数和销售量综合指数。
并利用指数体系分析价格和销售量变动对销售额的影响
某粮粮油商店三种商品的价格和销售量
商品名称
计量
单位
销售量
单价(元)
2006
2007
2006
2007
粳米
公斤
1200
1500
3.6
4.0
标准粉
公斤
1500
2000
2.3
2.4
花生油
公斤
500
600
9.8
10.6
计算过程:
商品名称
计量
单位
销售量
单价(元)
销售额(元)
2006
q0
2007
q1
2006
p0
2007
p1
2006
p0q0
2007
p1q1
p0q1
p1q0
粳米
标准粉
花生油
kg
kg
kg
1200
1500
500
1500
2000
600
3.6
2.3
9.8
4.0
2.4
10.6
4320
3450
4900
6000
4800
6360
5400
4600
5880
4800
3600
5300
合计
—
—
—
—
—
12670
17160
15880
13700
(1)价格综合指数为:
(2)销售量综合指数为:
(3)
结论∶与2006年相比,三种商品的零售价格平均上涨了8.06%,销售量平均上涨了25.34%,销售额平均上涨了35.44%。
绝对变动:
分析:
三者之间的相对数量关系135.44%=108.06%×125.34%
三者之间的绝对数量关系4490(元)=1280(元)+3210(元)
结论:
2007年与2006年相比,三种商品的销售额增长35.44%,增加销售额4490元。
其中由于零售价格变动使销售额增长8.06%,增加销售额1280元;由于销售量变动使销售额增长25.34%,增加销售额3210元。
7.填表
相关知识:
发展速度=
(1)环比发展速度:
(2)定基发展速度:
二者关系:
(1)观察期内各环比发展速度的连乘积等于最末期的定基发展速度
(2)两个相邻的定基发展速度,用后者除以前者,等于相应的环比发展速度
增长速度=
环比增长速度=
=环比发展速度-100%
定基增长速度=
=定基发展速度-100%
注意:
定基增长速度与环比增长速度之间不存在直接的换算关系。
通常要先将增长速度转化为发展速度,再进行计算。
已知:
年份
出口总值(万美元)
差额对比(万美元)
环比(%)
定基比(%)
逐期
累计
发展速度
增长速度
发展速度
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 13 要点