SAS统计分析与应用.docx
- 文档编号:8678406
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:11
- 大小:167.47KB
SAS统计分析与应用.docx
《SAS统计分析与应用.docx》由会员分享,可在线阅读,更多相关《SAS统计分析与应用.docx(11页珍藏版)》请在冰豆网上搜索。
SAS统计分析与应用
SAS统计分析与应用
姓名:
班级:
学号:
摘要
SAS系统是世界公认的权威性统计软件之一,是一个大型集成信息分析管理系统。
本次论文是用SAS系统对2005年度全国百强县(市)社会经济综合发展指数作统计分析,并解释结果。
(原始数据见附录)。
选出46个县(市)的情况作为统计分析数据,其中分析的项目为:
发展水平、发展活力、发展潜力。
运用SAS软件,运用主成分分析的方法对数据进行处理:
(一)对于所选取的统计数据用MEANS过程进行简单描述统计分析,得出数据平均值、数据标准差等。
(二)对于所选取的统计数据用INSIGHT模块做主成分分析计算协方差矩阵的特征值或是计算相关系数矩阵的特征值(Eigenvalue)、上下特征值之差(Difference)、各主成分的方差贡献率(Proportion)以及累积贡献率(Cumulative)、简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相关系数矩阵的特征向量。
系统默认计算相关系数矩阵的特征值和特征向量。
(三)由相关系数矩阵的两个最大特征值的特征向量,可以写出第一主成分的得分。
从以上结论分析可以知道百强县(市)的综合经济实力,经济增长水平、经济发展活力、城乡居民生活水平、社会公共事业服务能力等方面取得了新进展。
从而明确的了解百强县经济发展进入了持续快速健康发展的新阶段。
关键字:
主成分分析、简单统计量、相关系数矩阵、相关系数矩阵的特征值及其特征向量、方差贡献率。
目录
摘要1
一、基本介绍1
1.1、研究目的1
1.2、采用方法1
1.3、理论知识1
二、数据的预处理2
三、运行结果及分析3
3.1.使用INSIGHT模块做主成分分析3
3.2.主成分的结果分析5
四、结果分析6
五、参考文献8
六、附录9
2005年度全国百强县(市)社会经济综合发展指数测评结果9
一、基本介绍
1.1、研究目的:
通过SAS软件的分析,对全国百强县(市)社会经济情况的最新信息;有利于国家的宏观调控,从而可以促进百强县经济发展进入了持续快速健康发展的新阶段。
1.2、采用方法:
①描述统计量:
MEANS
②检验:
使用INSIGHT模块主成分分析
1.3、理论知识:
①MEANS过程(均值过程)用于对数值型变量产生针对单个变量的简单描述性统计.procmeans过程统计量参数缺省时输出N(样本数据)、Mean(数据平均值)、StdDev(数据标准差)、Minimum(最小值)、Maximum(最大值)五种统计值,但means过程可计算16种统计量。
②主成份分析(PrincipalComponentsAnalysis)是研究如何将多个变量指标间的问题化为较少的几个新指标问题。
这些新的指标是彼此既互不相关,又能综合反映原来多个指标的信息,是原来多个指标的线性组合。
多指标的主成份分析常被用来寻找判断某种事物或现象的综合指标,并给综合指标所蕴藏的信息以恰当解释,以便更深刻地揭示事物内在的规律。
这种处理问题的方法就称为主成份分析或主分量分析,综合后的新指标则称为原来指标的主成份或主分量。
主分量分析还可用于揭示变量间的共线性。
二、数据的预处理
对于数据较少的程序可以用DATA步创建永久SAS数据集。
永久SAS数据集,由定义逻辑库与定义数据集两个步骤完成。
逻辑库定义通过LIBNAME语句完成,数据集定义应用DATA实现。
LIBNAME语句语法格式:
LIBNAME逻辑库名称“子目录路径”;
DATA语句语法格式:
DATA逻辑库名.数据集名称;
LIBNAME语句把磁盘中的子目录与用户定义的逻辑库名连接起来。
用此种方法根据已知的数据就可以建立生成以下的数据集:
三、运行结果及分析
3.1.使用INSIGHT模块做主成分分析
(1)在INSIGHT模块中打开数据集L;选择菜单“Analyze”“Multivariate(YX)(多元分析)”,打开“Multivariate(YX)”对话框;
(2)将做主成分分析的变量x1~x3选为Y变量,将变量x0选为Label变量,如图所示。
(3)单击“Method”按钮,在打开的对话框中可以选择计算协方差矩阵的特征值或是计算相关系数矩阵的特征值。
系统默认计算相关系数矩阵的特征值和特征向量,单击“OK”按钮返回。
(4)单击“Output”按钮,在打开的对话框包括“DescriptiveStatistics”选项、“BivariatePlots”选项以及各种多元分析的选项。
选中“PrincipalComponentAnalysis”复选框,单击下面的“PrincipalComponentOptions”按钮,打开“PrincipalComponentOptions”对话框,选中“Eigenvectors”复选框,取消“Correlations(Structure)”复选框,如图所示。
3.2.主成分的结果分析
输出的数字分析结果有4个部分:
简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相关系数矩阵的特征向量。
(1)下图给出相关系数矩阵的特征值(Eigenvalue)、上下特征值之差(Difference)、各主成分的方差贡献率(Proportion)以及累积贡献率(Cumulative)
相关系数矩阵的特征值即各主成分的方差,可以看出,第一主成分为这组数据。
(2)图表给出相关系数矩阵的两个最大特征值的特征向量,据此可以写出第一主成分的得分:
Prin1=0.8832x1*+0.6022x2*+0.7712x3*
相关系数的绝对值越大,说明该主成分受该指标的影响就越大。
因此,从以上数据可以得出,决定第一主成分Prin1大小的主要是X1,X2,X3。
并且影响其中综合指数经济的按大到小分别是发展水平、发展潜力和发展活力。
由此得知昆山市发展水平高,发展活力大,发展潜力强,发展实力雄厚。
四、结果分析
通过用主成分分析的方法得知全国百强县(市)社会经济情况的最新信息;通过发展水平、发展潜力、以及发展活力的测量可以得出各县市的综合指数情况,按综合指数进行排名,发展水平高、发展潜力大、发展活力强的县市越靠前;从地区分布来看,百强县中有46个县属于长三角地区,15个县属于珠三角地区,21个县属于环渤海地区,百强县主要集中在长三角、珠三角以及环渤海三大经济圈的格局保持不变。
浙江、山东、江苏三省的百强县个数占全国三分之二以上。
其中,浙江30个,与上年持平;山东20个,比上年增加4个;江苏18个,比上年增加2个。
分析结果表明,农业生产大县在百强县中占有重要地位。
百强县经济总量可观,在国民经济中占有重要地位;百强县的生活水平接近小康社会的标准。
凭借雄厚的经济基础,百强县近年来在农村基础设施和社会保障体系建设方面取得突出的成就。
有利于国家的宏观调控,从而可以促进百强县经济发展进入了持续快速健康发展的新阶段。
五、参考文献
[1].沈其君主编,《SAS统计分析》,东南大学出版社,2001年4月出版;
[2].薛富波,张文彤等主编《SAS8.2统计应用教程》兵器工业出版社,2004年8月;
[3].曲庆云赵晓梅等,《统计分析方法--SAS实例精选》,清华大学出版社,2004年10月;
[4].高惠璇等编译,《SAS系统:
SAS/STAT软件使用手册》,(上下册)中国统计出版社,2001年3月;
[5].彭昭英主编,《世界统计与分析全才-SAS系统应用开发指南》,北京希望电子出版社,2000年6月。
6、附录
2005年度全国百强县(市)社会经济综合发展指数测评结果:
县 名
名 次
综合指数
发展水平
发展活力
发展潜力
昆山市
1
124.821
143.001
99.598
67.398
顺德区
2
120.427
134.72
93.677
77.221
张家港市
3
116.446
135.218
89.379
59.237
江阴市
4
115.855
133.701
88.859
61.505
南海区
5
114.82
128.847
89.6
72.058
常熟市
6
110.889
126.468
95.968
57.674
萧山区
7
100.726
112.619
91.563
57.338
武进区
8
96.297
104.885
90.769
62.76
太仓市
9
96.0724
104.862
97.834
57.94
吴江市
9
96.0721
104.472
99.502
58.459
绍兴县
10
94.735
103.655
91.39
58.901
鄞州区
11
93.867
100.685
99.71
60.867
义乌市
12
87.49
93.672
86.455
60.883
荣成市
13
87.063
91.869
91.577
62.784
慈溪市
14
86.427
91.829
94.194
58.094
余杭区
15
85.384
91.363
86.419
58.495
龙口市
16
84.223
87.255
89.59
66.853
晋江市
17
82.8
87.768
91.408
55.838
余姚市
18
81.891
84.371
99.685
60.11
文登市
19
81.003
85.918
87.327
55.518
宜兴市
20
79.289
84.739
81.916
53.805
三水区
21
78.965
81.365
89.329
61.962
石狮市
22
78.946
83.582
78.55
60.934
海宁市
23
77.219
79.044
97.161
57.189
诸暨市
24
76.656
80.426
85.52
54.474
东胜区
25
76.226
78.378
84.475
66.22
胶州市
26
75.253
77.794
95.837
52.033
嘉善县
27
75.098
74.833
99.36
62.612
平湖市
28
75.09
75.552
98.346
59.262
桐乡市
29
75.082
76.966
87.933
58.587
富阳市
30
75.05
78.103
81.18
57.323
胶南市
31
73.545
75.833
87.845
54.605
海盐县
32
73.522
76.045
81.892
57.839
玉环县
33
73.38
76.054
87.217
53.125
温岭市
34
72.583
76.585
81.042
49.841
增城市
35
72.564
74.135
92.316
53.826
高明区
36
71.896
73.038
90.023
59.036
迁安市
37
71.408
72.844
70.822
64.858
即墨市
38
71.286
72.835
96.305
50.077
德清县
39
70.963
71.619
90.895
56.106
乐清市
40
70.671
73.462
75.346
54.947
寿光市
41
70.331
70.699
87.622
58.179
瑞安市
42
70.322
73.541
79.364
50.441
蓬莱市
43
70.29
71.436
86.994
55.006
扬中市
44
70.155
72.333
74.893
60.851
上虞市
45
69.945
71.84
83.749
53.001
用统计软件的若干方法分析下列数据,并解释结果。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 统计分析 应用