我国水资源分布及其现状的分析.docx
- 文档编号:27040284
- 上传时间:2023-06-26
- 格式:DOCX
- 页数:20
- 大小:34.78KB
我国水资源分布及其现状的分析.docx
《我国水资源分布及其现状的分析.docx》由会员分享,可在线阅读,更多相关《我国水资源分布及其现状的分析.docx(20页珍藏版)》请在冰豆网上搜索。
我国水资源分布及其现状的分析
学号:
多元
论文题目:
学生姓名:
专业班级:
学院:
指导教师:
HEBEIUNITEDUNIVERSITY
统计分析论文
对我国水资源分布及其现状的分析
基于主成分分析和聚类分析
2014年12月12日摘要:
水资源是人类赖以生存的资源,近年来,随着经济的增长,人们对于水的需求越来越大,而水资源总量在不断减少,我国大部分地区已经出现了水资源不足的现象,局部地区水资源极度缺乏,这警示我们需要防患于未然,对我国水资源基本情况进行了解,据此,本文将对我国的水资源分布及其现状进行分析。
本文主要采用多元统计分析中的主成分分析和聚类分析的分析方法,借助于SPSS软件,初步了解影响水资源的因素,寻找所得因素在我国各个省市中的数据,进行分析,通过分析结果来了解我国的水资源在我国各个省市的分布情况及其现状,进一步给出针对我国水资源分布及其现状的合理意见及建议。
关键词:
水资源分布及现状省市主成分分析聚类分析
Abstract:
Wateristhesurvivalofhumanresources.Recently,Asthegrowthoftheeconomy,People*sofdemandforwaterisgrowing.However,thenumberofwaterisbecominglessandless.HostareasinChinahasappearedthephenomenonofinsufficientwaterresources・Moreover,someareasextremelackofwaterresources,whichwarnusneedtonipinthebudtounderstandthebasicwaterresourcessituationinourcountry.Onthebasisofitthisarticlewillanalyzethedistributionofwaterresourcesanditsstatusofourcountry・
Thisarticle,mainlyadoptingprincipalcomponentanalysisandclusteranalysisinmultivariatestatisticalanalysis,withtheaidofSPSSsoftware,preliminaryunderstandingoftheinfluencingfactorsofwaterresources.Findingthefactorsofdatainvariousprovincesandcitiesinourcountry,andthen,analyzing.Byanalyzingtheresultstogettoknowthedistributionofourcountry'swaterresourcesanditspresentsituationinvariousprovincesandcitiesinourcountry,eventually,wewillgivereasonableopinionsandsuggestions,aimingatthedistributionofourcountry'swaterresourcesanditspresentsituation.
摘要(Error!
Bookmarknotdefined.)
Abstract(Error!
Bookmarknotdefined.)
1.引言
(1)
2•研究对象
(1)
3.数据分析
(2)
3.1描述性统计分析
(2)
3-2主成份分析(4)
3.3聚类分析(8)
4•结论(10)
对我国水资源分布及其现状的分析
基于主成分分析和聚类分析
1引言
水是人类赖以生存的资源,在人类的生产生活中必不可少。
我国是一个严重缺水的国家,且水资源区域分布不均。
据统计我国的淡水资源总量为28000亿立方米,占全球水资源的6陰然而人均水资源总量只有2300立方米,仅为世界平均水平的1/4,在世界排名中占地121位。
因此,深刻剖析其现状,寻求保护以及充分利用水资源的有效之法刻不容缓。
水资源的水量、水质以及可持续利用性等等,关系着国民的日常生活。
而在对水资源的分析过程中,影响因素种类繁多,若就其单一因素对我国的水资源现状进行分析,结果必定会存在着很大的误差。
本文将从影响水资源的众多指标中,选取最具代表性,最具科学的指标,运用多元的知识(主成分分析,因子分析)进行分析,得出我国的水资源现状。
2研究对象
由于在水资源的影响因素中,地表水量,地下水量,重复计算量,水资源总量,年产水模数,年降水量,年径流深,年降水总量,年径流量等8个指标影响意义极为重大。
因此,本文将采用上述指标在18个省市中的数据为样本,分析我国的水资源现状。
水资源在各个地区的分布有一定的差异,我们从历年的数据中,找到了我们关于上述变量的数据如下
城市
地表水量
(
108
立方米)
地下水量(10*立方
米)
重复计算量
(1O8
立方
米)
水资源总量
(108
立方
米)
年产水模数
(104立方米/IO?
公里)
年降水量(毫
米)
年径流深(毫
米)
年降水总量
(1O8
立方
米)
径量方}年流—10s立米
北京
25.3
26.2
10.7
40.8
24.29
625
150.6
105
25.3
天津
10.8
5.8
2
14.6
12.91
604.2
95.5
68.3
10.8
河北
167
145.8
75.9
236.9
12.62
550.9
89
1034
167
山西
115
94.6
66.1
143.5
9.18
531.8
73.6
831
115
内蒙古
371
248.3
112.6
56.7
4.39
275.9
32.2
3183
371
辽宇
325
105.5
67.3
363.2
24.96
687.3
223.4
1000
325
上海
18.6
12
3.7
26.9
43.49
1052.5
300.7
65.1
18.6
江苏
249
115.3
38.9
325.4
31.88
996.3
243.9
1017
249
安徽
617
166.6
106.8
676.8
48.49
1139.2
442.1
1590
617
江西
1416
322.6
316.2
1422.4
85.08
1591.1
847
2660
1416
河南
311
198.9
102.2
407.7
24.41
772.5
186.2
1290
311
湖北
946
291.3
256.1
981.2
52.78
1165.1
508.9
2166
946
广东
2111
545.9
522.8
2134.1
100.66
1772.1
995.7
3757
2111
四川
3131
801.6
798.8
3133.8
55.21
1037.5
□51.6
5889
3131
贵州
1035
258.9
258.9
1035
58.76
1188.9
587.6
2094
1035
云南
2221
738
738
2221
57.86
1256.7
578.6
4824
2221
西藏
4482
1094.3
1094.3
4482
37.31
593.7
373.1
7132
4482
青海
623
258.1
251.9
626.2
8.66
285.5
86.2
2064
623
3数据分析
3.1描述性统计分析
根据上面的原始数据,下面我们运用SPSS软件进行描述性统计分析,山描述性统计过程得到:
描述统计量
N
极小值
极大值
均值
标准差
地表水量
18
10.80
4482.00
1009.7056
1239.39670
地下水量
18
5.80
1094.30
301.6500
302.13680
重复计算量
18
2.00
1094.30
268.1222
316.96481
水资源总量
18
14.60
4482.00
1018.2333
1239.72957
年产水模数
18
4.39
100.66
38.4967
26.89184
年降水量
18
275.90
1772.10
895.9000
418.01330
年径流深
18
32.20
995.70
353.6611
279.02111
年降水总量
18
65.10
7132.00
2264.9667
2016.69720
年径流量
18
10.80
4482.00
1009.7056
1239.39670
描述统计量
N
极小值
极大值
均值
标准差
地表水量
18
10.80
4482.00
1009.7056
1239.39670
地下水量
18
5.80
1094.30
301.6500
302.13680
重复计算量
18
2.00
1094.30
268.1222
316.96481
水资源总量
18
14.60
4482.00
1018.2333
1239.72957
年产水模数
18
4.39
100.66
38.4967
26.89184
年降水量
18
275.90
1772.10
895.9000
418.01330
年径流深
18
32.20
995.70
353.6611
279.02111
年降水总量
18
65.10
7132.00
2264.9667
2016.69720
年径流量
18
10.80
4482.00
1009.7056
1239.39670
有效的N(列表状态)
18
由上表可以看到上述9个指标中,样本的极大值和极小值均存在着较大差异,这表明我国的水资源在各省市中存在着时空分布不均的现象。
再看表中的极小值,地下水量,年产水模数的极小值仅为5.80和4.39,可见我国局部地区水资源紧缺现象严重。
其中,地表水量,降水总量,年降水总量标准差显著偏高,表明我国的水资源地区分布严重不平衡。
为了更好的说明问题,我们运用SPSS对上述数据进行相关性检验
相关矩阵
地表水量
地下水量
重复计算量
水资源总量
年产水模数
年降水量
年径流深
年降水总量
年径流
量
相关
地表水量
1.000
.980
.986
.998
.491
.299
.546
.955
1.000
地下水量
.980
1.000
.993
.974
.422
.237
.485
.982
.980
重复计算量
.986
.993
1.000
.982
.451
.265
.513
.963
.986
水资源总量
.998
.974
.982
1.000
.505
.321
.558
.938
.998
年产水模数
.491
.422
.451
.505
1.000
.961
.991
.399
.491
年降水量
.299
.237
.265
.321
.961
1.000
.936
.206
.299
年径流深
.546
.485
.513
.558
.991
.936
1.000
.470
.546
水降量年总
.955
.982
.963
.938
.399
.206
.470
1.000
.955
年径流量
1.000
.980
.986
.998
.491
.299
.546
.955
1.000
山上表可知,部分指标之间的相关系数很大,表明这些变量存在着某些相关性,例如地表水量和地下水量的相关系数为0.980,这说明地表水量和地下水量存在着较强的关联性。
而实际上我们也知道,地表水量在很大程度上受地下水量的影响。
因此有必要对这9个变量进行降维处理。
3.2主成分分析
考虑到上述指标之间的相关性较大,在此,我们构造新的衡量指标衡量城市的水资源量,对此我们进行主成分分析,其分析结果如下表所示:
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
6.742
74.910
74.910
6.742
74.910
74.910
2
2.124
23.599
98.509
2.124
23.599
98.509
3
.077
.854
99.364
4
.033
.370
99.733
5
.017
.188
99.921
6
.004
.047
99.969
7
.002
.025
99.994
8
.001
.006
100.000
9
2.946E-16
3.273E-15
100.000
提取方法:
主成份分析。
山上表可知,前两个主成分的累积贡献值达到了98.509%>90%,因此我们选择前两个主分量。
成份矩阵.
成份
1
2
地表水量
.972
-.218
地下水量
.952
288
重复计算量
.960
257
水资源总量
.972
197
年产水模数
.670
.740
年降水量
.502
.855
年径流深
.719
.686
年降水总量
.929
302
年径流量
.972
-.218
提取方法:
主成分分析法。
a.已提取了2个成份。
我们知道上表是因子荷载阵,而不是主成份的系数矩阵,我们将上表转化成主成分系数矩阵,将上表中的笫i列的每个元素分别除以笫i个特征根的平方根VI,得到结果如下表所示
主成份的系数矩阵
Fl
F2
X1
0.374
-0.150
x2
0.367
-0.198
x3
0.370
-0.176
x4
0.374
-0.135
x5
0.258
0.508
x6
0.193
0.587
x7
0.277
0.471
x8
0.358
-0.207
x9
0.371
-0.150
山此,我们可以得到如下结果:
F1二0・374x1+0.367x2+0.370x3+0.374x4+0.258x5+0.193x6+0.277x7+0.358x8+0.
374x9
F2二-0・150x1-0.198x2-0.176x3-0.135x4+0.508x5+0.587x6+0.471x7-0.207x8-0・150x9
根据上表,我们可看出2个新变量和9个原始变量的关系,其中第一主成份包含地表水量,地下水量,重复计算量,水资源总量,年降水总量,年径流量;第二主成份包含年产水模数,年降水量。
根据上述变量的样本数据我们利用SPSS汁算其Z得分如下表所示:
Z地表水量
Z地下水量
Z重复
计算量
Z水资源总量
Z年产水模数
Z年降水量
Z年径流深
Z年降水总量
Z年径流量
-0.794
-0.912
-0.812
-0.788
-0.528
-0.648
-0.728
-1.071
-0.794
-0.806
-0.979
-0.84
-0.81
-0.951
-0.698
-0.925
-1.089
-0.806
-0.68
-0.516
-0.606
-0.63
-0.962
-0.825
-0.949
-0.61
-0.68
-0.722
-0.685
-0.637
-0.706
-1.09
-0.871
-1.004
-0.711
-0.722
-0.515
-0.177
-0.491
-0.776
-1.268
-1.483
T.152
0.455
-0.515
-0.552
-0.649
-0.634
-0.528
-0.503
-0.499
-0.467
-0.627
-0.552
-0.8
-0.959
-0.834
-0.8
0.186
0.375
-0.19
-1・091
-0.8
-0.614
-0.617
-0.723
-0.559
-0.246
0.24
-0.393
-0.619
-0.614
-0.317
-0.447
-0.509
-0.275
0.372
0.582
0.317
-0.335
-0.317
0.328
0.069
0.152
0.326
1.732
1.663
1.768
0.196
0.328
-0.564
-0.34
-0.523
-0.492
-0.524
-0.295
-0.6
-0.483
-0.564
-0.051
-0.034
-0.038
-0.03
0.531
0.644
0.556
-0.049
-0.051
0.889
0.808
0.803
0.9
2.312
2.096
2.301
0.74
0.889
1.712
1.655
1.674
1.706
0.622
0.339
0.709
1.797
1.712
0.02
-0.141
-0.029
0.01-1
0.754
0.701
0.838
-0.085
0.02
0.977
1.444
1.482
0.97
0.72
0.863
0.806
1.269
0.977
2.802
2.623
2.607
2.794
-0.044
-0.723
0.07
2.413
2.802
-0.312
-0.144
-0.042
-0.316
-1.11
-1.46
-0.959
-0.1
-0.312
根据两个主成份的累积贡献率得到各权至分配如下:
F二74.910F1+23.599F2
山此再根据各城市相关数据进行转换得到因子得分表如下表所示:
F1
F2
北京
-2.37013
-0.101723
天津
-2.60208
-0.410254
河北
-2.046526
-0.795806
山西
-2.273154
-0.831052
内蒙古
-1.69165
-1.77072
辽宁
-1.663037
-0・161639
上海
-1.880978
1.135626
江苏
-1.509898
0.468021
安徽
-0.516164
1.059577
江西
1.77655
2.465369
河南
-1.455411
-0.226988
湖北
0.321854
0.952565
广东
3.498539
2.645927
四川
4.211007
-0.889295
贵州
0.48924
1.231944
云南
3.201747
0.01849
西藏
5.800436
-3.10925
青海
-1.289551
-1.679725
根据因子得分表,从而,我们可以得到各个省市的综合评价值如下:
省市
综合评价值
排名
西藏
361.1355
1
广东
324.5168
2
四川
294.4601
3
云南
240.2792
4
江西
191.2616
5
贵州
65.72161
6
湖北
46.58966
7
安徽
-13.6609
8
江苏
-102.062
9
上海
-114.104
10
河南
-114.382
11
辽宁
-128.393
12
青海
-136.24
13
内蒙古
-168.509
14
河北
-172.085
15
北京
-179.947
16
山西
-189.894
17
天津
-204.603
18
山最后结果可知,从整体上看,我国东南部水资源量高于其他地区,而局部分析数据,可以看出,我国西藏地区水资源量最为充足,广东,四川等地局于后位。
而北京,天津,山西,内蒙古等地出现了严重的缺水现象。
根据以上分析过程,我们可以看出,我国的水资源总量不足,地区分布步不均,部分地区出现了极度缺水的现象,水资源短缺现象已经成为我国面临的重大问题。
接下来,我们运用聚类分析,对问题做进一步的说明。
3.3聚类分析
利用SPSS对各个省市之间进行聚类分析,以此进行指标的重要性的评判,我们采用组间联接的聚类方法,以欧式距离为判断标准,进行分析,下面是我们的分析过程:
聚类表如下:
聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
群集1
群集2
1
3
4
.070
0
0
5
2
12
15
.157
0
0
8
3
6
11
.190
0
0
6
4
1
2
.227
0
0
5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 我国 水资源 分布 及其 现状 分析