实验报告 因子分析多元统计.docx
- 文档编号:29602895
- 上传时间:2023-07-25
- 格式:DOCX
- 页数:14
- 大小:75.53KB
实验报告 因子分析多元统计.docx
《实验报告 因子分析多元统计.docx》由会员分享,可在线阅读,更多相关《实验报告 因子分析多元统计.docx(14页珍藏版)》请在冰豆网上搜索。
实验报告因子分析多元统计
实验报告
主成分分析(综合性实验)
(Principalcomponentanalysis)
实验原理:
主成分分析利用指标之间的相关性,将多个指标转化为少数几个综合指标,从而达到降维和数据结构简化的目的。
这些综合指标反映了原始指标的绝大部分信息,通常表示为原始指标的某种线性组合,且综合指标间不相关。
利用矩阵代数的知识可求解主成分。
实验题目一:
将彩色胶卷在显影液下处理后在不同情形下曝光,然后通过红、绿、蓝三种滤色片并在高、中、低三种密度下进行测量,每个胶卷有高红、高绿、高蓝、中红、…、低蓝等九个指标(分别记为X1-X9九个变量)。
试验了108个胶卷,由数据已算得如下协差阵:
(S2a1)
17717995965332-7-4-3
419245131181127-214
302601091424411
15810242432
13796456
128228
343133
3939
48
实验要求:
(1)试从协差阵出发进行主成分分析;
(2)计算方差累积贡献率;
(3)作Scree图,并结合
(2)的结果确定主成分的个数;
(4)试对结果进行解释。
实验题目二:
下表中给出了不同国家及地区的男子径赛记录:
(t8a6)
Country
100m(s)
200m(s)
400m(s)
800m(min)
1500m(min)
5000m(min)
10,000m(min)
Marathon(mins)
Argentina
10.39
20.81
46.84
1.81
3.7
14.04
29.36
137.72
Australia
10.31
20.06
44.84
1.74
3.57
13.28
27.66
128.3
Austria
10.44
20.81
46.82
1.79
3.6
13.26
27.72
135.9
Belgium
10.34
20.68
45.04
1.73
3.6
13.22
27.45
129.95
Bermuda
10.28
20.58
45.91
1.8
3.75
14.68
30.55
146.62
Brazil
10.22
20.43
45.21
1.73
3.66
13.62
28.62
133.13
Burma
10.64
21.52
48.3
1.8
3.85
14.45
30.28
139.95
Canada
10.17
20.22
45.68
1.76
3.63
13.55
28.09
130.15
Chile
10.34
20.8
46.2
1.79
3.71
13.61
29.3
134.03
China
10.51
21.04
47.3
1.81
3.73
13.9
29.13
133.53
Columbia
10.43
21.05
46.1
1.82
3.74
13.49
27.88
131.35
CookIslands
12.18
23.2
52.94
2.02
4.24
16.7
35.38
164.7
CostaRica
10.94
21.9
48.66
1.87
3.84
14.03
28.81
136.58
Czechoslovakia
10.35
20.65
45.64
1.76
3.58
13.42
28.19
134.32
Denmark
10.56
20.52
45.89
1.78
3.61
13.5
28.11
130.78
DominicanRepublic
10.14
20.65
46.8
1.82
3.82
14.91
31.45
154.12
Finland
10.43
20.69
45.49
1.74
3.61
13.27
27.52
130.87
France
10.11
20.38
45.28
1.73
3.57
13.34
27.97
132.3
German(D.R.)
10.12
20.33
44.87
1.73
3.56
13.17
27.42
129.92
German(F.R.)
10.16
20.37
44.5
1.73
3.53
13.21
27.61
132.23
GreatBrit.&N.Ireland
10.11
20.21
44.93
1.7
3.51
13.01
27.51
129.13
Greece
10.22
20.71
46.56
1.78
3.64
14.59
28.45
134.6
Guatemala
10.98
21.82
48.4
1.89
3.8
14.16
30.11
139.33
Hungary
10.26
20.62
46.02
1.77
3.62
13.49
28.44
132.58
India
10.6
21.42
45.73
1.76
3.73
13.77
28.81
131.98
Indonesia
10.59
21.49
47.8
1.84
3.92
14.73
30.79
148.83
Ireland
10.61
20.96
46.3
1.79
3.56
13.32
27.81
132.35
Israel
10.71
21
47.8
1.77
3.72
13.66
28.93
137.55
Italy
10.01
19.72
45.26
1.73
3.6
13.23
27.52
131.08
Japan
10.34
20.81
45.86
1.79
3.64
13.41
27.72
128.63
Kenya
10.46
20.66
44.92
1.73
3.55
13.1
27.38
129.75
Korea
10.34
20.89
46.9
1.79
3.77
13.96
29.23
136.25
D.P.RKorea
10.91
21.94
47.3
1.85
3.77
14.13
29.67
130.87
Luxembourg
10.35
20.77
47.4
1.82
3.67
13.64
29.08
141.27
Malaysia
10.4
20.92
46.3
1.82
3.8
14.64
31.01
154.1
Mauritius
11.19
22.45
47.7
1.88
3.83
15.06
31.77
152.23
Mexico
10.42
21.3
46.1
1.8
3.65
13.46
27.95
129.2
Netherlands
10.52
20.95
45.1
1.74
3.62
13.36
27.61
129.02
NewZealand
10.51
20.88
46.1
1.74
3.54
13.21
27.7
128.98
Norway
10.55
21.16
46.71
1.76
3.62
13.34
27.69
131.48
PapuaNewGuinea
10.96
21.78
47.9
1.9
4.01
14.72
31.36
148.22
Philippines
10.78
21.64
46.24
1.81
3.83
14.74
30.64
145.27
Poland
10.16
20.24
45.36
1.76
3.6
13.29
27.89
131.58
Portugal
10.53
21.17
46.7
1.79
3.62
13.13
27.38
128.65
Rumania
10.41
20.98
45.87
1.76
3.64
13.25
27.67
132.5
Singapore
10.38
21.28
47.4
1.88
3.89
15.11
31.32
157.77
Spain
10.42
20.77
45.98
1.76
3.55
13.31
27.73
131.57
Sweden
10.25
20.61
45.63
1.77
3.61
13.29
27.94
130.63
Switzerland
10.37
20.46
45.78
1.78
3.55
13.22
27.91
131.2
Taipei
10.59
21.29
46.8
1.79
3.77
14.07
30.07
139.27
Thailand
10.39
21.09
47.91
1.83
3.84
15.23
32.56
149.9
Turkey
10.71
21.43
47.6
1.79
3.67
13.56
28.58
131.5
USA
9.93
19.75
43.86
1.73
3.53
13.2
27.43
128.22
USSR
10.07
20
44.6
1.75
3.59
13.2
27.53
130.55
WesternSamoa
10.82
21.86
49
2.02
4.24
16.28
34.71
161.83
(数据来源:
1984年洛杉机奥运会IAAF/AFT径赛与田赛统计手册)
实验要求:
(1)试求主成分,并对结果进行解释;
(2)试用方差累积贡献率和Scree图确定主成分的个数;
(3)计算各国第一主成分的得分并排名。
实验题目一分析报告:
(1)>sj.cov<-matrix(c(177,179,95,96,53,32,-7,-4,-3,179,419,245,131,181,127,-2,1,4,95,245,302,60,109,142,4,4,11,96,131,60,158,102,42,4,3,2,53,181,109,102,137,96,4,5,6,32,127,142,42,96,128,2,2,8,-7,-2,4,4,4,2,34,31,33,-4,1,4,3,5,2,31,39,39,-3,4,11,2,6,8,33,39,48),9,9)
>sj.cor<-cor(sj.cov)#相关系数矩阵
>round(sj.cor,2)
[,1][,2][,3][,4][,5][,6][,7][,8][,9]
[1,]1.000.840.620.780.660.44-0.84-0.80-0.80
[2,]0.841.000.860.720.910.78-0.79-0.77-0.73
[3,]0.620.861.000.430.780.91-0.68-0.68-0.59
[4,]0.780.720.431.000.790.42-0.80-0.80-0.85
[5,]0.660.910.780.791.000.85-0.79-0.79-0.77
[6,]0.440.780.910.420.851.00-0.70-0.71-0.62
[7,]-0.84-0.79-0.68-0.80-0.79-0.701.000.980.96
[8,]-0.80-0.77-0.68-0.80-0.79-0.710.981.000.98
[9,]-0.80-0.73-0.59-0.85-0.77-0.620.960.981.00
答:
根据相关系数矩阵可以看出:
相关性较大,可以做主成分分析.
(2)>sj.cov#协方差矩阵
[,1][,2][,3][,4][,5][,6][,7][,8][,9]
[1,]17717995965332-7-4-3
[2,]179419245131181127-214
[3,]95245302601091424411
[4,]961316015810242432
[5,]5318110910213796456
[6,]321271424296128228
[7,]-7-24442343133
[8,]-414352313939
[9,]-3411268333948
>pca.sj<-princomp(covmat=sj.cov)#主成分分析
>pca.sj$loadings#载荷
Loadings:
Comp.1
Comp.2
Comp.3
Comp.4
Comp.5
Comp.6
Comp.7
Comp.8
Comp.9
[1,]
0.305
0.486
0.412
0.287
0.358
0.464
0.263
[2,]
0.653
0.151
0.183
-0.648
-0.105
-0.270
[3,]
0.483
-0.588
0.236
0.115
0.425
-0.390
0.126
[4,]
0.261
0.491
-0.457
-0.108
0.461
-0.350
-0.346
-0.121
[5,]
0.324
-0.495
-0.280
-0.159
0.146
0.674
0.259
[6,]
0.271
-0.373
-0.269
-0.234
0.154
0.696
-0.130
-0.331
-0.158
[7,]
-0.256
0.438
-0.818
0.252
[8,]
-0.266
0.505
0.147
0.257
-0.761
[9,]
-0.282
0.558
0.103
0.516
-0.296
0.483
>summary(pca.sj)
Importanceofcomponents:
Comp.1
Comp.2
Comp.3
Comp.4
Standarddeviation
29.6398250
14.0034242
11.34209441
10.17006418
ProportionOfVariance
0.6092366
0.1359888
0.08921158
0.07172691
CumulativeProportion
0.6092366
0.7452255
0.83443705
0.90616396
Comp.5
Comp.6
Comp.7
Comp.8
Standarddeviation
9.01449265
6.15214060
2.641284332
2.388822159
ProportionOfVariance
0.05635304
0.02624746
0.004837991
0.003957331
CumulativeProportion
0.96251699
0.98876445
0.993602443
0.997559774
Comp.9
Standarddeviation
1.875847965
ProportionOfVariance
0.002440226
CumulativeProportion
1.000000000
答:
由结果可得前三个样本主成分提取的信息达83.44%
(3)>screeplot(princomp.ap,type="lines")#Scree图
答:
由Scree图可以看出:
坡度从第三个主成分开始逐渐变缓;由
(2)的结果可得:
从第三个主成分后开始累计贡献率为83.44%>80%,结合两者可以得出主成分的个数为3个。
(4)答:
第一主成分表达式:
y1=0.305x1+0.653x2+0.483x3+0.261x4+0.324x5+0.271x6
第二主成分表达式:
y2=0.486x1+0.151x2-0.588x3+0.491x4-0.495x5-0.373x6
第三主成分表达式:
y3=0.412x1+0.183x2+0.236x3-0.457x4-0.280x5-0.269x6-0.256x7-0.266x8-0.282x9
第一主成分反映了低密度的红绿蓝滤色片在胶卷曝光中应用较少;
第二主成分为对比成分,反映了中高密度的红色滤色片对彩色胶卷曝光影响较大,运用在风景照或建筑摄影时,可以制作出“风暴似”的云彩,月光及树木,营造出超写实的特效,这种滤色片是绝对必要的,而中高密度的蓝色滤色片强调山谷中的山岚及穿透水面与烟雾的光线等方式,来达到凸显天空层次的效果对彩色胶卷;
第三主成分为综合成分,反映了同样是红绿蓝三种颜色滤色片,只有在高密度下才对胶卷曝光起到决定作用,密度越高,说明对红绿蓝三种颜色吸收越多,从而影响到照片的色彩。
实验题目二分析报告:
所有的表格经过Excel表格处理及保留小数点三位。
(1)
>AFT=read.csv("D:
AFT.csv",head=T)#导入数据
>AFT=AFT[-1,]#去掉第一行缺失值
>AFT1=AFT[,-1]#去掉第一列名字
>Sigma.ap=var(AFT1)#算出数据的方差
>P.ap=cor(AFT1)#算出数据的协方差
>P.ap
>princomp.ap=princomp(AFT1,cor=T)#用相关系数做主成分分析
>summary(princomp.ap)#汇总统计
>princomp.ap$loadings#主成分分析
Comp.1为综合能力
Comp.2为极限能力(即瞬间爆发力和耐力)
(2)
>summary(princomp.ap)#汇总统计
最后一列为方差累计贡献率,可以取Comp.1和Comp.2为主成分。
>screeplot(princomp.ap,type="lines")#画出了scree图
根据图可以得出,取Comp.1和Comp.2为主成分
(3)
>y=princomp.ap$scores[,1]#计算主成分得分
>y
在Excel中整理并排序:
Country
Point
CookIslands
10.653
WesternSamoa
7.298
Mauritius
4.298
PapuaNewGuinea
3.945
Singapore
3.151
Thailand
2.787
Indonesia
2.773
Guatemala
2.697
CostaRica
2.318
Philippines
2.090
Burma
1.990
DominicanRepublic
1.731
Malaysia
1.724
D.P.RKorea
1.699
Taipei
0.959
Bermuda
0.746
Israel
0.439
China
0.413
Turkey
0.269
Argentina
0.264
Luxembourg
0.223
Korea
0.209
India
-0.167
Greece
-0.383
Chile
-0.385
Columbia
-0.394
Mexico
-0.685
Austria
-0.815
Norway
-0.819
Ireland
-0.892
Portugal
-0.925
Denmark
-1.123
Rumania
-1.208
Hungary
-1.216
Japan
-1.249
Czechoslovakia
-1.385
Spain
-1.494
Netherlands
-1.570
Brazil
-1.573
NewZealand
-1.614
Sweden
-1.618
Switzerland
-1.654
Finland
-1.708
Canada
-1.762
Poland
-2.019
Belgium
-2.060
Kenya
-2.188
France
-2.192
Australia
-2.469
German(F.R.)
-2.576
German(D.R.)
-2.614
USSR
-2.651
Italy
-2.752
GreatBrit.&N.Ireland
-3.052
USA
-3.462
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验报告 因子分析多元统计 实验 报告 因子分析 多元 统计