完整word版秋季多元统计分析考试答案.docx
- 文档编号:7762381
- 上传时间:2023-01-26
- 格式:DOCX
- 页数:19
- 大小:226.06KB
完整word版秋季多元统计分析考试答案.docx
《完整word版秋季多元统计分析考试答案.docx》由会员分享,可在线阅读,更多相关《完整word版秋季多元统计分析考试答案.docx(19页珍藏版)》请在冰豆网上搜索。
完整word版秋季多元统计分析考试答案
《多兀统计分析》课程试卷答案
2009年秋季学期
开课学院:
理
学号
考试方式闭卷、开卷、一纸开卷、其它考试时间:
120分钟
题号
-一一
-二二
^三
四
五
六
七
八
九
十
总分
得分
阅卷人
姓名
班级
但不得将试卷撕散,
说明:
本试卷后附有两张白纸,后一张为草稿纸,可以撕下,散卷作废。
/、
X1
"111"
(15分)设X=
X2
〜N3(巴£),其中卜=
-3
,送=
132
/3>
<1丿
J22>
1.
求3X1-2X2+X3的分布;
线
辽'
(111)
*3'
:
其中:
CP=(3-211
-3
=13,CSC'=(3-21)|132
-2
:
1
U丿
b22丿
.1丿
=9。
(4分)
匕3
(1分)
所以3xi-2X2+x3〜N(13,9)
其中:
互独立,只要
…(1分)
2、Ho:
卩
在原假设成立的条件下,检验统计量为:
(3分)
T^(X-
(20分)据国家和地区的女子田径纪录数据,数据如下表:
表3.1国家和地区的女子田径纪录数据
国家和地区
100米
(秒)
200米
(秒)
400米
(秒)
800米
(分)
1500米
(分)
3000米
(分)
马拉松
(分)
阿根廷
11.61
22.94
54.50
2.15
4.43
9.79
178.52
澳大利亚
11.20
22.35
51.08
1.98
4.13
9.08
152.37
奥地利
11.43
23.09
50.62
1.99
4.22
9.34
159.37
比利时
11.41
23.04
52.00
2.00
4.14
8.88
157.85
美国
10.79
21.83
50.62
1.96
3.95
8.50
142.72
苏联
11.06
22.19
49.19
1.89
3.87
8.45
151.22
西萨摩亚
12.74
25.85
58.73
2.33
5.81
13.04
306.00
基于相关矩阵对上述数据进行因子分析,利用SPSS软件所得部分运算结果如下:
表3.2DescriptiveStatistics
Mean
Std.DeviationAn
alysisN
100米(秒)
11.6185
.45221
55
200米(秒)
23.6416
1.11106
55
400米(秒)
53.4058
2.67834
55
800米(分)
2.0764
.10822
55
1500米(分)
4.3255
.33243
55
3000米(分)
9.4476
.82434
55
马拉松(分)
173.2533
30.42954
55
I.838
表3.3KMOandBartlett'sTestKaiser-Meyer-OlkinMeasure
ofSamplingAdequacy.
Bartlett'sTestofSphericity
Approx.Chi-Square
605.335
df
21
Sig.
.000
表3.4ComponentMatrix
Component
1
2
100米(秒)
.888
.396
200米(秒)
.880
.434
400米(秒)
.919
.199
800米(分)
.927
-.126
1500米(分)
.938
-.291
3000米(分)
.937
-.281
马拉松(分)
.884
-.298
表3.5RotatedComponentMatrix
Component
1
2
100米(秒)
.400
.886
200米(秒)
.370
.909
400米(秒)
.555
.760
800米(分)
.776
.522
1500米(分)
.894
.405
3000米(分)
.887
.413
马拉松(分)
.859
.364
表3.6ComponentScoreCoefficientMatrix
Component
1
2
100米(秒)
-.288
.555
200米(秒)
-.328
.597
400米(秒)
-.084
.333
800米(分)
.247
-.038
1500米(分)
.417
-.226
3000米(分)
.406
-.214
马拉松(分)
.417
-.240
求:
1.写出正交因子模型;
2.
的原假设和备择假设,对
给出表3.3中Bartlett'sTestofSphericity此结果做出解释;
3.根据上述运算结果,试填写下表
原始变量
旋转因子载荷
共同度
*
f1
f2*
100米(秒)
200米(秒)
400米(秒)
800米(分)
1500米(分)
3000米(分)
马拉松(分)
累积贡献率
并对两个旋转因子的含义做出解释;
4.解释共同度及累计贡献率的含义;
5.写出两个旋转因子的因子得分表达式。
解:
1.X=卩+Af+£
E(f)=0
D(f)=lk
yov(f3)=0k邓
E(e)=0卫的协方差阵甲"iagd…,屮2)
令:
f\
X1
卩1〕
X=
b
■
■
h
■
■
£=
:
1
1&丿
f=
1
:
1.
〔fk丿
—特殊因子
—因子载荷矩阵
(5分)
2.
Ho:
P=lp,HrPHIp,由卩值<0.05,所以拒绝原假设,即相关矩阵不是单位矩阵。
(2分)
3.(7分)
原始变量
旋转因子载荷
共同度
*
f1
f;
100米(秒)
.400
.886
0.94536
200米(秒)
.370
.909
0.962756
400米(秒)
.555
.760
0.884162
800米(分)
.776
.522
0.926929
1500米(分)
.894
.405
0.964525
3000米(分)
.887
.413
0.95693
马拉松(分)
.859
.364
0.87026
累积贡献率
0.504427
0.922777
f1表示长跑耐力因子,f2表示短跑速度因子。
4.共同度表示提取的前k个公因子反映第i个原始变量的信息程度。
累计贡献率表示提取的前k个公因子对所有原始变量的解释程度。
(2分)
5.
X2-23.6416X3-53.4058
+0.597+0.333
1.111062.67834
X5-4.3255Xe-9.4476X7-173.2533
-0.226-0.214-0.240
0.332430.8243430.42954
(4分)
四、(20分)文件Poverty.sav是美国1960-1970年随机选择的30个城市的人口调查结果,其中丫表示该郡低于贫困线的家庭比例,X1表示1960-1970年间人口变化,X2表示从事农业人口数,X3表示居住与农场税率,X4表示住宅电话拥有率,X5表示农村人口比率,X6表示人口年龄中位数。
利用spss进行多元线性回归分析,结果如下:
表4.1DescriptiveStatistics
Mean
Std.Deviation
N
丫
23.010
6.4266
30
X1
7.867
10.3323
30
X2
1548.6667
2038.38633
30
X3
.7187
.20270
30
X4
74.8333
10.00718
30
X5
70.727
24.0216
30
X6
30.280
2.8848
30
表4.2ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.Errorofthe
Estimate
1
.733
.538
.521
4.4456
2
.836
.699
.677
3.6532
表4.3ANOVA
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
644.346
1
644.346
32.603
.000
Residual
553.381
28
19.764
Total
1197.727
29
2
Regression
837.381
2
418.690
31.372
.000
Residual
360.346
27
13.346
Total
1197.727
29
表4.4Coefficients
Model
UnstandardizedCoefficients
Standardized
Coefficients
t
Sig.
Correlations
B
Std.
Error
Beta
Zero-order
Partial
1
(Constant)
58.259
6.226
9.357
.000
X4
-.471
.082
-.733
-5.710
.000
-.733
-.733
2
(Constant)
52.496
5.336
9.837
.000
X4
-.366
.073
-.569
-4.993
.000
-.733
-.693
X1
-.270
.071
-.434
-3.803
.001
-.649
-.591
求:
1.解释表4.2中“R”,“RSquare”及“AdjustedRSquare”的含义;
2.写出表4.3Model2所检验的原假设和备择假设,当显著性水平a=0.05时,
给出检验的结论;
3.给定检验的显著性水平a=0.05,显著,解释原因;
4.当X1=10.7,X2=185QX3=0.93,
测值;
5.解释表4.4中偏相关系数的含义,释。
多元线性回归方程的回归系数t检验是否
X4=74,X5=70.6,X6=28.7时,写出y的预
并对Model2中偏相关系数的结果进行解
解:
1.R为复相关系数,衡量作为一个整体的X1,X2…,XP与丫的线性关系的大小。
RSquare称为判定系数或决定系数,它反映了回归方程的拟合程度,其值越大,说明回归
AdjustedRSquare为R;=1-一P—1),与RSquare一起反映回归方程的拟合
4分)
SST(n-1)
程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。
(
2•令匕,P2分别表示自变量Xi,X4对应的的回归系数的表4.3Model2所检验的原
假设和备择假设为
H0:
p1=p2=0,VS比邛1邛2中至少有一个不为零。
(4分)
X4对丫的线性影响显著,因为t
检验的卩值=0.000va=0.05。
(4分)
4.多元线性回归方程为:
0=52.496-0.27X4-0.366X4,X1=10.7,X2=1850,
X3=0.93,X4=74,X5=70.6,X6=28.7时丫^=52.496-0.27x10.7-0.366x74=22.523。
(4分)
5.偏相关系数指其它变量都在模型里时,所研究自变量对因变量的影响。
X1在模型时,X4与丫的偏相关系数是-.693,对丫的影响是负影响。
X4在模型时,
X1与丫的偏相关系数是-.591,对丫的影响是负影响。
二者对丫的影响程度大致相当。
(4分)
五、(15分)五个样品间的距离矩阵如下
412
试用最短距离法对样品进行聚类。
画出聚类图,并给出聚为两类时的结果。
1
2
3
45
G
6
145
1
0
1
1G6
0
2
4
0
1
11
4
0
4
5
12
0
3
7
3
0
5
11
18
60
4
12
8
5
0
1
5
.18
14
11
60>
G745
G7
4
5
0
50
1160
(4)将4和Gz合并成G8,计算2类之间的距离
Gg5
G8
5
0
60
(5)画聚类图
(3分)
(2分)
G2
G3
G4
G5
Gz
G9
(3分)
(3分)
六、(16分)对破产企业收集他们在破产前两年的年度数据,对财务良好企业也收集同一时期的数据。
数据涉及四个变量,X1=现金流量/总债务,X2=净收入/
总资产,X3=流动资产/流动债务,X4=流动资产/净销售额。
数据列于表6.1
表6.1企业财务数据
Gi:
破产企业
G2:
非破产企业
序号
Xi
X2
X3
X4
序号
X1
X2
X3
X4
1
-0.45
-0.41
1.09
0.45
1
0.51
0.10
2.49
0.54
2
b
■
-0.56
h
■
-0.31
b
■
1.51
b
■
0.16
h
■
2
b
■
0.08
b
■
0.02
h
■
2.01
b
■
0.53
b
■
■
21
■
-0.28
■
-0.27
■
1.27
■
0.51
■
25
■
0.58
■
0.04
■
5.06
■
0.13
利用SPS软件计算结果如下:
表6.2GroupStatistics
GROUP
1
Mean
Std.Deviation
ValidN(listwise)
Unweighted
Weighted
1
X1
-6.8095E-02
.2099
21
21.000
X2
-8.1429E-02
.1449
21
21.000
X3
1.3667
.4053
21
21.000
X4
.4381
.2111
21
21.000
2
X1
.2352
.2169
25
25.000
X2
5.560E-02
4.874E-02
25
25.000
X3
2.5936
1.0231
25
25.000
X4
.4272
.1625
25
25.000
Total
X1
9.674E-02
.2608
46
46.000
X2
-6.9565E-03
.1240
46
46.000
X3
2.0335
1.0065
46
46.000
X4
.4322
.1842
46
46.000
表6.3TestsofEqualityofGroupMeans
Wilks'
Lambda
F
df1
df2
Sig.
X1
.657
22.976
1
44
.000
X2
.690
19.765
1
44
.000
X3
.623
26.610
1
44
.000
X4
.999
.039
1
44
.844
表6.4CovarianeeMatrices
GROUP
>
X1
X2
X3
X4
1
X1
4.407E-02
2.846E-02
3.452E-02
4.094E-03
X2
2.846E-02
2.100E-02
2.602E-02
3.412E-03
X3
3.452E-02
2.602E-02
.164
3.281E-02
X4
4.094E-03
3.412E-03
3.281E-02
4.458E-02
2
X1
4.705E-02
8.507E-03
7.493E-02
-6.568E-03
X2
8.507E-03
2.376E-03
8.583E-03
2.080E-04
X3
7.493E-02
8.583E-03
1.047
3.334E-02
X4
-6.568E-03
2.080E-04
3.334E-02
2.640E-02
Total
X1
6.801E-02
2.773E-02
.150
-2.522E-03
X2
2.773E-02
1.536E-02
5.878E-02
1.249E-03
X3
.150
5.878E-02
1.013
2.897E-02
X4
-2.522E-03
11.249E-03
2.897E-02
3.392E-02
表6.5PooledWithin-GroupsMatrices
X1
X2
X3
X4
Covarianee
X1
4.569E-02
1.758E-02
5.656E-02
-1.722E-03
X2
1.758E-02
1.084E-02
1.651E-02
1.664E-03
X3
5.656E-02
1.651E-02
.646
3.310E-02
X4
-1.722E-031
.664E-03
3.310E-02
3.466E-02
表6.6StandardizedCanonical表6.7Unstandardized
DiscriminantFunctionCoefficientsCanonicalDiscriminantFunction
Coefficients
表6.8ClassificationFunction
Coefficients
GROUP
1
2
X1
4.063
5.257
X2
-18.414
-9.944
X3
1.607
3.303
X4
12.192
9.910
(Constant)
-5.073
-7.435
表6.9ClassificationResults
GROUP
PredictedGroup)Membership
Total
1
2
Original
Count
1
18
3
21
2
1
24
25
%
1
85.7
1体3
100.0
2
4.0
196.0
100.0
1.指出表6.3的作用,并对表6.3的结果做评价;
2.写出Fisher判别法的线性判别函数f的表达式;
3.假定某企业的财务数据X1=0.08,X2=0.02,X3=2.01,x^0.53,那么,
该企业是否面临破产?
(分别用Fisher判别法和Bayes判别法给出判别结
果);
4.
根据表6.9的输出结果,你对本题中的判别方法有何评价?
值为
(3分)
0.844>0.05,则可以认为变量X4在两组的均值没有显著差别。
因此两组的均值有显
著性差异。
f2
=—5.073+4.063X0.08-18.414X0.02+1.607咒2.01+12.192^0.53=4.57559
=—7.435+5.257X0.08-9.9440.02+3.303咒2.01+9.910^0.53=4.67801
把某企业的财务数据代入Fisher判别法的线性判别函数得:
f=-0.03
计算临界值为:
F=-0.084。
由于f>口,说明该企业不面临破产。
(4分)
5.由表6.9可知,运用此判别方法有42个观测判别正确,判别正确的百分比为
42
——=91.3%。
G1中有18个观测判断正确,判对率为85.7%,G2中有24个观测判断正确,
46
(4分)
判对率为96%。
由此可以认为本题中所使用的判别方法判别效果较好。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整 word 秋季 多元 统计分析 考试 答案