多元统计分析实验报告.docx
- 文档编号:24445355
- 上传时间:2023-05-27
- 格式:DOCX
- 页数:16
- 大小:204.60KB
多元统计分析实验报告.docx
《多元统计分析实验报告.docx》由会员分享,可在线阅读,更多相关《多元统计分析实验报告.docx(16页珍藏版)》请在冰豆网上搜索。
多元统计分析实验报告
《应用多元统计分析》
课程实验报告
项目名称:
数据分析
学生姓名:
辛岩
学生学号:
3108010664
指导教师:
邓志民
完成日期:
2011年4月28日
一、引言
数据说明
1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金绩效平价规则》。
其中,竞争性工商业指标体系包括下面八大基本指标:
净资产收益率、总资产报酬率、资产负债率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率和资本累计率。
所以我们借助这一指标体系对我国上市公司的运营情况进行分析,数据来自35家上市公司2000年年报数据,这35家上市公司分别来自电力、煤气及水的生产和供应业,房地产业,信息技术业。
二、数据分析
1.散点图分析
散点图可以很直观的看出两个变量之间的关系,所以为了大致了解这8个指标体系之间存在的关系,可以对35家公司的8个指标体系的数据做散点图,如图1所示。
图18个指标体系间的散点图
从图1中可以明显的看出净资产收益率与总资产收益率之间有近似的线性关系,而且也是显而易见,净资产收益率增加了则总资产收益率必然会增加。
而其他的变量之间则基本看不出来有什么关系。
2.箱线图分析
箱线图是利用数据中的五个统计量:
最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有对称性,分布的分散程度等信息。
还可以直观明了地识别出数据中的异常值。
对数据做箱线图,如图2所示。
图28个指标体系的箱线图
从图中我们可以看到总资产周转率和流动资产周转率两个指标的箱线图由于过小而无法看清楚,是因为这两个指标的取值过小而引起的,我们可以将这两个取值相对较小的指标单独做一次箱线图,如图3所示。
图3总资产周转率和流动资产周转率箱线图
从图2、图3我们就可以看出:
净资产收益率的数据还算比较集中,但是分布不是很均匀,还有1个温和的异常值;
总资产收益率的数据相对比较集中,有2个温和的异常值;
资产负债率的数据分布不是太集中,而且数据分布的也不均匀,可以看到中位数偏小,但没有异常值;
总资产周转率的数据不是很集中,分布也不均匀,有2个温和的异常值和1个极端异常值;
流动资产周转率的数据不是很集中,分布也不均匀,有2个温和的异常值;
已获利息倍数的数据分布不均匀,中位数偏小,有2个温和异常值;
销售增长率的数据分布相对来说比较均匀,且没有异常值;
资本积累率的数据分布很不均匀,中位数偏小,有2个温和的异常值和1个极端异常值。
3.正态性检验
用SPSS对这8个指标进行正态性检验,得到数据表1。
TestsofNormality
Kolmogorov-Smirnova
Shapiro-Wilk
Statistic
df
Sig.
Statistic
df
Sig.
净资产收益率%
.152
35
.039
.944
35
.077
总资产报酬率%
.137
35
.095
.942
35
.064
资产负债率%
.144
35
.065
.939
35
.052
总资产周转率
.235
35
.000
.683
35
.000
流动资产周转率
.159
35
.026
.850
35
.000
已获利息倍数
.172
35
.011
.880
35
.001
销售增长率%
.116
35
.200*
.982
35
.836
资本积累率%
.252
35
.000
.695
35
.000
a.LillieforsSignificanceCorrection
*.Thisisalowerboundofthetruesignificance.
表1正态性检验
我们可以看到表中给出了两种检验方法的数据,一种是KolmogorovSmirnov检验方法,另一种是Shapiro-Wilk检验方法。
SPSS规定:
当样本量
时,结果以Shapiro-Wilk检验为准,当样本量
时,结果以KolmogorovSmirnov检验为准,因为这里的样本量
,所以结果以Shapiro-Wilk检验为准。
在
的条件下,总资产周转率、流动资产周转率、已获利息倍数、资本累计率这4个指标的p值(Sig值)小于
。
也就是我们可以以
的把握说净资产收益率、总资产报酬率、资产报酬率、销售增长率这4个指标的数据服从正态分布,而总资产周转率、流动资产周转率、已获利息倍数、资本累计率这4个指标的数据不服从正态分布。
我们也可以从指标数据的直方图中很直观的看出来是否服从正态分布,在这就以销售增长率、资本积累率这两个指标的直方图为例看一看,如图4、图5所示。
从图中我们可以看到销售增长率的直方图呈中间多、两头少,跟正态分布的曲线很接近,可以认为近似服从正态分布;而资本累计率的直方图我们可以看到跟正态分布的曲线完全没联系,就可以认为不服从正态分布。
图4销售增长率的直方图
图5资本积累率的直方图
4.描述性统计量
4.1均值向量
通过均值向量可以了解到每个指标的平均取值情况,进一步了解这些企业的平均发展状况。
在这我们了计算了信息技术行业当中的每个指标的平均值,如表2所示。
DescriptiveStatistics
N
Mean
净资产收益率%
9
13.3898
总资产报酬率%
9
8.7911
资产负债率%
9
46.8900
总资产周转率
9
.8911
流动资产周转率
9
1.1756
已获利息倍数
9
8.4744
销售增长率%
9
44.2956
资本积累率%
9
24.5311
ValidN(listwise)
9
表2信息技术行业的均值向量
我们从表中的数据可以看到,信息技术行业中一共有9家公司,其每个指标的均值分别为:
净资产收益率:
13.3898%、总资产报酬率:
8.7911%、资产负债率:
46.89%、总资产周转率:
89.11%、流动资产周转率:
117.56%、已获利息倍数:
8.4744、销售增长率:
44.2956%、资本累计率:
24.5311%;
其中流动资产周转率平均达到了117.56%,说明信息技术行业中的企业流动资产的周转速度是相当快的,而销售增长率也达到了44.2956%,说明信息技术行业中的企业的整体经营状况都很好,而且市场占有能力也很强。
4.2协差阵
协方差用于衡量两个变量的总体误差,如果说两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值,另外一个却小于自身的期望值,则这两个变量之间的协方差就是负值;若两个变量是相互独立的,则协方差就是0。
表3中就计算了8个变量,每两个变量之间的的协方差,组成一个矩阵,称为协方差阵,简称协差阵。
净资产收益率%
总资产报酬率%
资产负债率%
总资产周转率
流动资产周转率
已获利息倍数%
销售增长率%
资本累计率%
净资产收益率%
51.833
26.589
57.937
4.925
4.756
1.882
184.536
100.574
总资产报酬率%
26.589
15.070
2.919
2.290
2.577
3.935
89.114
40.536
资产负债率%
57.937
22.919
192.867
3.589
3.081
-42.103
178.892
-39.183
总资产周转率
4.295
2.290
3.589
0.454
0.514
-0.027
10.023
6.018
流动资产周转率
4.756
2.577
3.081
0.514
0.616
0.367
11.456
8.188
已获利息倍数%
1.882
3.935
-42.103
-0.027
0.367
21.333
59.002
72.438
销售增长率%
184.536
89.114
178.892
10.023
11.456
59.002
1223.792
771.603
销售增长率%
100.574
40.536
-39.183
6.018
8.188
72.438
771.603
868.694
表3协差阵
从表3的数据中我们可以看到,协差阵就是一个对角矩阵,因为A、B的协方差和B、A的协方差显然是相等的。
我们可以看到有3组指标之间的协方差是负的,分别是资产负债率和已获利息倍数、资产负债率和销售增长率、总资产周转率和已获利息倍数这3组指标之间的协方差,可以初步说明这3组指标变量之间的变化趋势是相反的。
这也复合经济意义,负债率提高了,则获得的利息、销售额必然会减少。
4.3相关系数矩阵
相关系数是衡量两个变量之间相关程度的指标,样本相关系数用
表示,其取值范围是
。
值越大,说明变量之间的线性相关程度越高;
值越小,说明变量之间的线性相关程度越低。
其中:
时称为正相关;
时称为完全正相关;
时称为负相关;
时称为完全负相关;
完全正相关或负相关时,此两个变量间的散点图呈一条直线。
一般来说,可以将相关程度分为以下几个等级:
时,认为高度相关;
时,认为中度相关;
时,认为低度相关;
时,认为相关程度极弱。
现将各指标之间的相关系数计算得到一个相关系数矩阵,如表4所示:
净资产收益率%
总资产报酬率%
资产负债率%
总资产周转率
流动资产周转率
已获利息倍数%
销售增长率%
资本累计率%
净资产收益率%
1
0.951
0.579
0.886
0.841
0.057
0.733
0.474
总资产报酬率%
0.951
1
0.425
0.876
0.845
0.219
0.656
0.354
资产负债率%
0.579
0.425
1
0.384
0.283
-0.656
0.368
-0.096
总资产周转率
0.886
0.876
0.384
1
0.973
-0.009
0.425
0.303
流动资产周转率
0.841
0.845
0.283
0.973
1
0.101
0.417
0.354
已获利息倍数%
0.057
0.219
-0.656
-0.009
0.101
1
0.365
0.532
销售增长率%
0.733
0.656
0.368
0.425
0.417
0.365
1
0.748
销售增长率%
0.474
0.354
-0.096
0.303
0.354
0.532
0.748
1
表4相关系数矩阵
从表4的数据我们可以看到,相关系数矩阵也是一个对角阵。
其中有3组指标的相关系数为负值,说明这3组指标之间成负相关性,分别是资产负债率和已获利息倍数、资产负债率和销售增长率、总资产周转率和已获利息倍数这3组指标,这与协差阵里协方差为负值的3组指标是一样的,这就再一次确认了这3组指标之间的变化趋势的相反的。
这一点可以从图1的散点图中得到证实。
为表示方便,现将净资本收益率、总资产报酬率、资产负债率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率和资本累计率这8个指标分别表示为:
,将各个指标间的相关程度进行分类:
5.各行业的均值向量、协差阵进行比较
由于不同行业的企业规模、盈利等方面往往都不一样,现在就来看看不同行业的企业的8项指标的均值是否有差异。
用SPSS求解得到表5。
MultivariateTestsc
Effect
Value
F
Hypothesisdf
Errordf
Sig.
Intercept
Pillai’sTrace
.958
71.296a
8.000
25.000
.000
Wilks’Lambda
.042
71.296a
8.000
25.000
.000
Hotelling’sTrace
22.815
71.296a
8.000
25.000
.000
Roy’sLargestRoot
22.815
71.296a
8.000
25.000
.000
行业
Pillai’sTrace
1.110
4.054
16.000
52.000
.000
Wilks’Lambda
.191
4.034a
16.000
50.000
.000
Hotelling’sTrace
2.671
4.006
16.000
48.000
.000
Roy’sLargestRoot
1.788
5.811b
8.000
26.000
.000
a.Exactstatistic
b.ThestatisticisanupperboundonFthatyieldsalowerboundonthesignificancelevel.
c.Design:
Intercept+行业
表5各行业均值向量的检验
从表中数据,我们可以看到对不同行业均值向量的检验的HotellingsTrace的p值(Sig值)为远小于0.05,说明这3个行业中8项指标之间有显著的差异,我们可以求出这3个行业的各项指标的均值来得到证实,如表6所示:
净资产收益率%
总资产报酬率%
资产负债率%
总资产周转率
流动资产周转率
已获利息倍数%
销售增长率%
资本累计率%
电力、煤气行业
12.3200
10.1082
37.6745
0.3382
1.0818
14.1609
16.4455
20.2245
房地产行业
5.5349
4.2073
54.1760
0.2127
0.3020
3.9173
3.3540
4.6973
信息技术行业
13.3898
8.7911
46.8900
0.8911
1.1756
8.4744
44.2956
24.5311
总体
9.6872
7.2406
47.1163
0.4266
0.7717
8.3086
17.9963
14.6774
表6各行业各指标平均值
从表6的数据我们可以看到,各行业各指标的均值是有较大的差异,其中房地产行业的各项指标中除资产负债率外,其余指标均偏低。
对各行业各指标数据的协差阵是否有显著差异进行检验,得到表7:
Box'sTestofEqualityofCovarianceMatricesa
Box'sM
260.786
F
2.152
df1
72
df2
2050.869
Sig.
.000
Teststhenullhypothesisthattheobservedcovariancematricesofthedependentvariablesareequalacrossgroups.
a.Design:
Intercept+行业
表7各行业各指标协差阵的检验
从表中的数据,我们看到p值(Sig值)远小于0.05,所以说这3个行业之间的各项指标的协差阵是有显著差异的。
三、结束语
本文主要利用SPSS和多元统计的方法,对上市的35家公司,涉及电力、煤气及水的生产和供应业,房地产业,信息技术业这3个行业,的运营情况进行了分析。
主要是从净资产收益率、总资产报酬率、资产负债率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率和资本累计率这8个指标进行了分析。
通过分析我们得到:
1.净资产收益率、总资产报酬率、资产报酬率、销售增长率这4个指标的数据服从正态分布;
2.总资产周转率、流动资产周转率、已获利息倍数、资本累计率这4个指标的数据不服从正态分布;
3.总资产周转率与流动资产周转率、净资产收益率与总资产报酬率之间存在着高度的线性关系;
4.3个行业在8个指标方面的均值、协差阵都有显著的差异。
其中房地产行业在除了在资产负债率这一指标均值最高外,其余7个指标在3个行业中都是最低的,而且和其他2个行业的差距较大。
存在的缺点:
没有处理异常值。
在箱线图中我们看到:
资本积累率、总资产周转率这两个指标各存在1个极端异常值,但是在后面的具体分析没有考虑到这一点,因为这两个极端异常值有可能会影响分析的结果。
没有对3个行业指标进行系统的分析,只是对数据做了简单的一些检验。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 实验 报告