运用计量经济学多元线性回归和多元统计分析方法分析中的因子分析.docx
- 文档编号:6301836
- 上传时间:2023-01-05
- 格式:DOCX
- 页数:21
- 大小:406.65KB
运用计量经济学多元线性回归和多元统计分析方法分析中的因子分析.docx
《运用计量经济学多元线性回归和多元统计分析方法分析中的因子分析.docx》由会员分享,可在线阅读,更多相关《运用计量经济学多元线性回归和多元统计分析方法分析中的因子分析.docx(21页珍藏版)》请在冰豆网上搜索。
运用计量经济学多元线性回归和多元统计分析方法分析中的因子分析
基于省会城市和计划单列市经济发展水平的统计分析
摘要运用计量经济学多元线性回归和多元统计分析方法分析中的因子分析,对中国2012年省会城市和计划单列市(由于上海,济南,太原,宁波和拉萨等5个地区数据有残缺,故省去对其分析)15个主要经济发展指标数据进行分析,首先利用相关分析对地区第二和第三产业,客运和货运量,城乡居民储蓄款年末总额, 在岗职工平均工资 ,年末邮局数 ,年末固定电话用户数 ,社会消费品零售总额进行了简单相关分析,以及控制了地区生产总值对地区第二,第三产业进行了偏相关分析和年末总人口对客运和货运量等进行了偏相关分析;接着利用各种经济指标对地区生产总值进行多元线性回归,利用逐步回归方法获知社会消费品零售总额,第二产业,第三产业,年末总人口和地区生产总值有显著关系。
最后利用因子分析对各地区进行因子分析,通过采用传统回归评分函数和深度函数,获得各地区综合排名,其中北京,重庆,深圳,广州,天津位列前五。
关键词地区生产总值;深度函数;相关分析;偏相关分析;回归分析;因子分析
1研究背景及目的的
中国地域辽阔,自古以来各地区经济发展水平差异较大,定量的分析影响各地区经济发展不平衡的因素,是制定切实可行的促进地区间经济快速,协调,可持续发展方针的前提。
一直以来,城市经济发展水平的好坏就受到各级政府,各行各业人们的高度关注。
一个地区城市经济发展水平的好坏,直接关系着这个城市的人民生活水平,教育,医疗,城市建设甚至影响全国贫富差距。
随着经济全球化进程的加速,关注城市经济发展水平更有意义。
通过对描述我国各主要城市经济竞争力的各种指标进行各种分析,一方面找出用来衡量我国城市经济竞争力的各个指标之间的内在联系,建立数学模型,进行定量分析影响城市经济发展水的因素,另一方面找出各城市经济竞争力的差异,为城市的经济发展提供政策建议。
2研究方法
本研究采用的数据是《中国2010年省会城市和计划单列市主要经济指标统计(包括直辖市)》,数据摘自《中国统计年鉴2011》12-2C。
该研究采用的指标主要有:
年末总人口、地区生产总值、第二产业、第三产业、客运量、货运量、地方财政预算内收入、地方财政预算内支出、固定资产投资总额、城乡居民储蓄年末余额、在岗职工平均工资、年末邮政局数、年末固定电话用户数、社会商品零售总额、货物进出口总额等15个重要衡量指标。
数据分析方法主要有回归分析、相关分析、偏相关分析,因子分析等。
基本思路是:
首先使用回归分析、相关分析,偏相关分析等分析方法研究构成城市经济竞争力的各个指标之间的关系并建立数学模型;然后使用因子分析对构成城市经济竞争力的各个指标提取公因子;最后使用一些简单的EXCEL方法进行计算和SPSS数据处理技巧,并依据提出的公因子对各城市进行分类及排序。
3实证分析
由于从国家统计局网站下载的数据为EXCEL格式,可以将数据导入成SPSS数据,我们设置了共16个变量,分别是“城市名称”、“年末总人口”、“地区生产总值”、“第二产业”、“第三产业”、“客运量”、“货运量”、“地方财政预算内收入”、“地方财政预算内支出”、“固定资产投资总额”、“城乡居民储蓄年末余额”、“在岗职工平均工资”、“年末邮政局数”、“年末固定电话用户数”、“社会商品零售总额”、“货物进出口总额”等变量。
样本是中国2012年省会城市和计划单列市主要经济指标统计的相关数据。
数据参见附表1。
3.1相关分析
对于相关分析,主要有以下几个部分:
第一,对“地区生产总值”的两个组成部分:
“第二产业”和“第三产业”进行简单相关分析;
第二,在控制“地区生产总值”的前提下,对“第二产业”、“第三产业”进行偏相关分析;
第三,对“客运量”和“货运量”进行简单相关分析;
第四,在控制“年末总人口”的前提下,对“客运量”和“货运量”进行偏相关分析;
第五,对“地方政府预算内收入”和“地方政府预算内支出”进行简单相关分析;
六,在控制“年末总人口”的前提下,对“地方政府预算内收入”和“地方政府预算内支出”进行偏相关分析;
第七,城乡居民储蓄款年末总额,在岗职工平均工资,年末邮局数,年末固定电话用户数,社会消费品零售总额进行简单相关分析。
第八,对货物进出口总额和固定投资总额进行简单相关分析。
3.1.1地区生产总值的简单相关分析
通过使用主菜单Analyze下的correlate工具条,可以获得分析结果,见表1。
表1相关分析结果
有表1显示结果可以得到,“第二产业”和“第三产业”间相关关系非常显著。
表2偏相关分析结果
从分析结果可以看出,在控制“地区生产总值”的前提下,“第二产业”和“第三产业”的相关关系依然显著。
但相关系数却变成了负值,这是由于总额是一定,故出现此消彼长的关系。
表3相关分析结果
从分析结果可以看出,“客运量”和“货运量”相关关系非常显著。
表4偏相关分析结果
从分析结果可以看出,在控制“年末总人口”的前提下,“客运量”和“货运量”相关关系不显著。
表5相关分析结果
从分析结果可以看出,“地方财政预算内收入”和“地方财政预算内支出”相关关系非常显著。
表6偏相关分析结果
从分析结果可以看出,在控制“年末总人口”的前提下,“地方财政预算内收入”和“地方财政预算内支出”之间的相关系数很大,而且相关关系非常显著。
表7相关分析结果
从分析结果可以看出,除了“在岗职工平均工资”和“年末邮局数”相关关系不显著外,其余变量相关关系都非常显著。
表8相关分析结果
从分析结果可以看出,“货物进出口额”和“固定投资总额”相关关系不显著。
3.2回归分析
对于回归分析,以“地区生产总值”为被解释变量,“年末总人口”、“客运量”、“货运量”、“地方财政预算内收入”、“地方财政预算内支出”、“固定资产投资总额”、“城乡居民储蓄年末余额”、“在岗职工平均工资”、“年末邮政局数”、“年末固定电话用户数”、“社会商品零售总额”、“货物进出口总额”等为解释变量,进行多元线性回归,采用逐步回归法。
得到输出结果参见表9—表11所示。
表9模型拟合情况表
表10方差分析表
表11回归系数表
综上所述,我们可以得到:
(1)最终模型的表达式为:
地区生产总值=14.961+0.00001331*社会商品零售总额+1.001*第二产业+0.912*第三产业+0.235*年末总人口
(2)最终模型的拟合优度非常完美,修正后可决系数为1;
(3)模型中各自变量系数的显著性p值都小于0.05,回归方程的线性关系显著;
(4)Dubin-Watson值为1.881,几乎接近2,可以认为回归模型残差不存在自相关性。
(4)分析结论:
经过以上多元线性回归分析,可以发现我国城市的地区生产总值与社会商品零售总额,第二产业,第三产业,年末总人口,与其他变量之间的关系并不显著。
表12残差统计表
图1标准化残差直方图
表12给出了回归分析的残差统计结果,可以看出预测值及标准化的预测值、残差及残差预测值的最小值、最大值、均值、标准差和样本数。
这些数据中无离群值,可以认为模型是健康的。
除了分析残差统计外,还可以直接做出标准残差的直方图和正态P-P图来观察其是否服从正态分布。
从图1和图2可以看出残差具有正态分布的趋势,因此可以认为回归模型是恰当的。
图2标准化残差正态P-P图
表13KMO和Bartlett的检验结果
(1)利用spss软件,先对15个指标的原始数据进行标准化处理,已消除量纲和数量级的影响,并得到各指标之间的相关系数矩阵R.
(2)KMO判断标准:
0.9 非常适合。 0.8 适合。 0.7 一般。 0.6 不太适合。 KMO<0.5: 不适合。 (3)KMO和Bartlett的检验,如表10所示,KMO的取值为0.834,表明变量间有较强的相关性,数据很适合做因子分析。 Bartlett检验的显著性为0.000,说明数据来自正态总体,适合进一步分析。 表14变量共同度 (4)变量共同度,指的是按照所选标准提取相应数量主成分后,各变量中信息分别被提取的比例。 如表11所示,除了“客运量”的共同度较低之外,大多数变量共同度都在90%以上,由于变量共同度越高,因子分析模型的解释能力就越高,所以提取这几个公因子对各变量有较强的解释力。 (3)解释的总方差,由表12中可以看出,“初始特征值”一栏显示只有前两个特征值大于1,所以只选取了前两个公因子;“提取平方和载入”一栏显示第一公因子的方差贡献率是49.854%,前两个公因子的方差总和占所有主成分方差的86.010%,可见选取前量个因子可以替代原来的变量。 (6)碎石图,是按照特征根大小排列的主成分散点图,图中纵坐标为特征值,横坐标是因子数。 从图中可以看到,有两个成分的特征值超过1,其他的主成分特征根都很小。 (7)主成分因子与原始指标之间的关联程度有因子载荷阵体现,由于初始因子载荷阵因子含义不明显,为此利用方差最大正交旋转,得到旋转后的因子载荷阵。 (如表)根据表,可将指标分为两类。 第一个因子在指标第三产业,客运量,地区生产总值,地方财政预算内收入,地方财政预算内支出,城乡居民储蓄年末余额,在岗职工平均工资,年末固定电话用户数,社会商品零售总额,货物进出口总额上有较大的载荷,命名为A因子(第三产业和存量因子)。 第二个因子在年末总人口,第二产业、货运量、年末邮政局数、年末固定电话用户数有较大的载荷,命名为B因子(第二产业和流量因子)。 (8)成分得分系数矩阵 表15解释总方差 图3碎石图 表16成分矩阵 表17旋转成分矩阵 表18成分得分系数矩阵 如表所示的是因子得分系数矩阵,通过此表就可以得到用各个变量的线性组合表达的主成分,表达式如下: F1(A因子)=-0.162*年末总人口+0.101*地区生产总值+0.001*第二产业+0.167*第三产业+0.063*客运量+(-0.122)*货运量+0.118*地方财政预算内收入+0.052*地方财政预算内支出+(-0.088)*固定投资总额+0.142*城乡居民储蓄年末总额+0.218*在岗职工平均工资+(-0.073)*年末邮局总数+0.104*年末固定电话用户数+0.111*社会消费品零售总额+0.196*货物进出口总额。 F2(B因子)的得分也可类似求出。 表19成分得分协方差矩阵 通过表16可见,各因子之间是正交的,即相互之间彼此独立。 3.4因子分析后续分析 (1)各地区因子综合得分及排序如表 (2)从2个因子得分看出,由于银川的3个因子明显处于最低水平,利用这个特点,以银川的因子Z为深度中心,定义这里的深度函数为: PD(Zi,Z)=1/(1+d(Zi,Z)/MAD(Z))i=1,31 其中d(Zi,Z)为定义的加权欧式距离,即 其中yi,k为样本Zi在主成分Fk上的得分,wk为第k个主成分的方差贡献率(旋转后的) 即数列{d(Zi,Z)}的中位数。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运用 计量 经济学 多元 线性 回归 统计分析 方法 分析 中的 因子分析