实用回归分析小论文.docx
- 文档编号:29270270
- 上传时间:2023-07-21
- 格式:DOCX
- 页数:19
- 大小:39.96KB
实用回归分析小论文.docx
《实用回归分析小论文.docx》由会员分享,可在线阅读,更多相关《实用回归分析小论文.docx(19页珍藏版)》请在冰豆网上搜索。
实用回归分析小论文
影响成品钢材量的多元回归分析
理论上成品钢材的需求量的影响因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。
在此,收集的数据选择与其相关的四个因素:
原油产量、生铁产量、原煤产量、发电量,1980-1997的有关数据如下表。
原始数据(中国统计年鉴)
年份
y
Xi
X
X3
X4
1980
2716.20
10595.00
3802.40
6.20
3006.20
1981
2670.10
10122.00
3416.60
6.20
3092.70
1982
2902.00
10212.00
3551.00
6.66
3277.00
1983
3072.00
10607.00
3738.00
7.15
3514.00
1984
3372.00
11461.30
4001.00
7.89
3770.00
1985
3693.00
12489.50
4384.00
8.72
4107.00
1986
4058.00
13068.80
5064.00
8.94
4495.00
1987
4356.00
13414.00
5503.00
9.28
4973.00
1988
4689.00
13704.60
5704.00
9.80
5452.00
1989
4859.00
13764.10
5820.00
10.54
5848.00
1990
5153.00
13830.60
6238.00
10.80
6212.00
1991
5638.00
14009.20
6765.00
10.87
6775.00
1992
6697.00
14209.70
7589.00
11.16
7539.00
1993
7716.00
14523.00
8739.00
11.51
8395.00
1994
8482.00
14608.20
9741.00
12.40
9281.00
1995
8979.80
15004.94
10529.27
13.61
10070.30
1996
9338.02
15733.39
10722.50
13.97
10813.10
1997
9978.93
16074.14
11511.41
13.73
11355.53
将中国成品钢材的需求量设为y,作为被解释变量,而原油产量生铁产量X2、原煤产量対、发电量X4作为解释变量,通过建立这些经济变量的线性模型来研究影响成品钢材需求量的原因。
模型的设定
设因变量y与自变量Xi、X2、X3、
X4的一般线性回归模型为
0+iXi
2X23X34X4
是随机变量,通常满足
o;Var()=
二参数估计
系数&
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
170.287
494.572
.344
.736
原油(万吨)
041
.090
031
457
.655
生铁(万吨)
.554
.170
.608
3.267
.006
原煤(万吨)
-17.818
115.468
-.018
154
.880
发电量(亿千瓦时)
.389
.199
.438
1.952
.073
a.因变量:
成品钢材(万吨)
再用SPSS做回归线性,根据系数表得岀回归方程为:
$170.2870.041%0.554x217.818x30.389xt
再做回归预测,得出如下截图:
¥
XI
k2
x3
[)(4
PREJ
RES1
2716.20
3802.40
e.so
3006.20
2e?
S.0S76G
-182.83766
2G70.10
10122.0C
3416.60
G.20
3092.70
2736.53110
-60.43110
2902.00
10212.00
3651.00
6.66
3277.00
2072,91514
2919ZaG
3072.00
10607.00
3738.00
7J5
3514.00
3043.62443
2837557
3372.00
11461.30
4001.00
A89
3770.00
3240.51684
131.48416
369300
12489,50
4384.00
372
4107.00
3526,63541
1B6.3&459
4056.00
13068.0C
50B4.00
8.94
449500
4C2£.56ei9
3143381
4356.00
13414.00
5503.00
9.28
4973.00
A435.52677
-79.52677
4689.00
13704.6C
5704.00
9.80
5452.00
4712.05819
■23.05819
4059.00
137E4W
582C.00
1054
5346.00
4914.91371
-55.61371
5153.00
13630.60
623B.CD
IQ.BO
621200
5250.70360
-127.703S0
5638.00
14009.20
5765.00
1187
6775.00
5733.19465
6E970Q
14209.70
7599.03
11.16
753900
6623.64790
173.3K21D
771E.00
1462300
9739.00
1151
8395.00
7474.00431
241.19660
848200
14608,20
3741,00
12.40
0281.00
S356.43425
126.65676
9979.80
15004.94
10529.27
1361
10070.30
9051.44M
-81.64200
933S.02
15733.39
107Z2.50
13.97
10013.10
9421.11147
-63.09147
9978.93
1607J14
11511.41
1373
11355.63
10059.53741
-80.60741
1622586
12044.54
1367
12334.69
10P27.33875
■
17453.00
12445.96
14.54
13457.00
11323.07164
故当原油产量为16225.86万吨,生铁产量为12044.54万吨,原煤产量为13.87万吨以及发电量为12334.89亿千瓦时时,成品钢材量预测值为10727.33875万吨;当原油产量为17453万吨,生铁产量为12445.96万吨,原煤产量为14.54万吨以及发电量为13457亿
千瓦时时,成品钢材量预测值为10727.33875万吨。
三回归方程检验
均值
标准偏差
N
成品钢材(万吨)
5465.0028
2460.34926
18
原油(万吨)
13190.6372
1875.78873
18
生铁(万吨)
6489.9544
2700.79676
18
原煤(万吨)
9.9683
2.54018
18
发电量(亿千瓦时)
6220.8794
2768.11191
18
相关性
成品钢材(万吨)
原油(万吨)
生铁(万吨)
原煤(万吨)
发电量(亿千瓦
时)
Pearson相关性成品钢材(万吨)
原油(万吨)
生铁(万吨)
原煤(万吨)
发电量(亿千瓦时)
1.000
.909
.998
.961
.997
.909
1.000
.912
.973
.920
.998
.912
1.000
.962
.997
.961
.973
.962
1.000
.971
.997
.920
.997
.971
1.000
Sig.(单侧)成品钢材(万吨)
原油(万吨)
生铁(万吨)
原煤(万吨)
发电量(亿千瓦时)
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
N成品钢材(万吨)
原油(万吨)
生铁(万吨)
原煤(万吨)
发电量(亿千瓦时)
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
18
由相关系数表看岀,因变量与各个自变量的相关系数都很高,都在
0・9以上,说明变量间的线性相关程度很高,适合做多元线性回归模型。
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.999*
.997
.997
140.71641
a.预测变量:
(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)
b.因变量:
成品钢材(万吨)
由F=0.997以及调整之后的R2=0.997矢口,模型对样本观测数据的拟合度很
Anova
模型
平方和
df
均方
F
Sig.
1
回归
1.026E8
4
2.566E7
1296.001
.000a
残差
257414.404
13
19801.108
总计
1.029E8
17
a.预测变量:
(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)
b.因变量:
成品钢材(万吨)
由F二1296.001P值二0.000〈=0.05,故拒绝原假设,认为自变量联合起
来对因变量有显著影响,通过F检验。
系数“
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
170.287
494.572
.344
.736
原油(万吨)
041
.090
031
457
.655
生铁(万吨)
.554
.170
.608
3.267
.006
原煤(万吨)
-17.818
115.468
-.018
-154
.880
发电量(亿千瓦时)
.389
.199
.438
1.952
.073
a•因变量:
成品钢材(万吨)
因为ts=-0.154P值=0.880远远大于二0.05,故接受原假设,认为X3对因变
量y没有显著影响,故应剔除匕。
用后退法剔除变量后,再做回归线
性,得如下表:
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
170.287
494.572
.344
.736
原油(万吨)
041
.090
031
457
.655
生铁(万吨)
.554
.170
.608
3.267
.006
原煤(万吨)
-17.818
115.468
-.018
154
.880
发电量(亿千瓦时)
.389
.199
.438
1.952
.073
2
(常量)
197.734
445.099
.444
.664
原油(万吨)
053
.045
041
-1.172
.261
生铁(万吨)
.564
.150
.620
3.760
.002
发电量(亿千瓦时)
.371
.153
.417
2.417
.030
3
(常量)
-309.403
105.079
-2.944
.010
生铁(万吨)
.591
.150
.649
3.937
.001
发电量(亿千瓦时)
.311
.147
.350
2.125
.051
a.因变量:
成品钢材(万吨)
AndWtf(万吨),生铁(万吨)
模型
平方和
df
均方
F
Sig.
1
回归
1.026E8
4
2.566E7
1296.001
.000a
残差
257414.404
13
19801.108
总计
1.029E8
17
2
回归
1.026E8
3
3.422E7
1857.513
.000°
残差
257885.884
14
18420.420
总计
1.029E8
17
3
回归
1.026E8
2
5.131E7
2718.023
.000c
残差
283174.324
15
18878.288
总计
1.029E8
17
a.预测变量:
(常量),发电量(亿千瓦,原油(万吨),原煤(万吨),生铁(万吨)。
时)
b.预测变量:
(常量),发电量(亿千瓦时)
C.预测变量:
(常量),发电量(亿千瓦时)d.因变量:
成品钢材(万吨)
最后剔除Xi、X3两个自变量,得出新的回归方程为:
$309.4030.59%0.31lx,
F=2718.023P值=0.000故拒绝原假设,通过F检验
四基本假定检验
1、异方差检验
等级相关系数检验
做abs(e)与x的等级相关系数,得出表如下
相关系数
原油(万吨)
生铁(万吨)
原煤(万吨)
发电量(亿千瓦
时)
abse
Spearman的rho原油(万吨)相关系数
Sig.(双侧)
N
1.000
18
**
.998
.000
18
**
.994
.000
18
**.994
.000
18
.263
.291
18
生铁(万吨)相关系数
Sig.(双侧)
N
**.998
.000
18
1.000
18
**
.989
.000
18
**
.988
.000
18
.294
.236
18
原煤(万吨)相关系数
Sig.(双侧)
N
**.994
.000
18
**
.989
.000
18
1.000
18
**.997
.000
18
.227
.365
18
发电量(亿千瓦时)相关系数
Sig.(双侧)
N
**.994
.000
18
**
.988
.000
18
**
.997
.000
18
1.000
18
.212
.399
18
abse相关系数
Sig.(双侧)
N
.263
.291
18
.294
.236
18
.227
.365
18
.212
.399
18
1.000
18
**•在置信度(双测)为0.01时,相关性是显著的
由表中P值全大于0.01,故接受原假设,模型中不存在异方差
2、自相关检验
模型汇总'
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.999•
.997
.997
140.71641
.922
a.预测变量:
(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)
b.因变量:
成品钢材(万吨)
DW=0.992n=18k=5,查表得出dio.82,du1.87,故DW落入无法确定的领域。
自相关性不明显,由此也看岀DW检验的局限性。
3、多重共线性
系数°
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1(常量)
170.287
494.572
.344
.736
原油(万吨)
041
.090
031
457
.655
.041
24.672
生铁(万吨)
.554
.170
.608
3.267
.006
.006
180.105
原煤(万吨)
-17.818
115.468
-.018
154
.880
.014
73.861
发电量(亿千瓦时)
.389
.199
.438
1.952
.073
.004
261.480
a•因变量:
成品钢材(万吨)
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
原油(万吨)
生铁(万吨)
原煤(万吨)
发电量(亿千瓦
时)
1
1
4.878
1.000
.00
.00
.00
.00
.00
2
.118
6.435
.02
.00
.00
.00
.00
3
.004
37.106
.36
.03
.03
.09
.00
4
.001
88.718
.57
.46
.28
.21
5
.000
137.100
.05
.51
.68
.70
a.因变量:
成品钢材(万吨)
据得出,匕、X3、X4之间存在多重共线性。
故先剔除变量X4,再做线性回归,得岀表如下:
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1(常量)
59.520
538.378
.Ill
.914
原油(万吨)
108
.092
082
-1.178
.258
.047
21.142
生铁(万吨)
.871
.054
.956
16.144
.000
.066
15.176
原煤(万吨)
118.233
100.887
.122
1.172
.261
.021
46.956
a•因变量:
成品钢材(万吨)
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
原油(万吨)
生铁(万吨)
原煤(万吨)
1
1
3.917
1.000
.00
.00
.00
.00
2
.079
7.042
.02
.00
.06
.00
3
.003
33.686
.33
.04
.66
.13
4
.001
87.743
.64
.96
.28
.87
a•因变量:
成品钢材(万吨)
由于模型中仍然存在多重共线性,故继续剔除VIF最大的变量X3,再做线性回归,
得出表如下
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
-282.131
458.218
-.616
.547
原油(万吨)
-.017
.049
-.013
345
.735
.168
5.967
生铁(万吨)
.920
.034
1.010
26.871
.000
.168
5.967
a・因变量:
成品钢材(万吨)
共线性诊断&
模型
维数
特征值
条件索引
方差比例
(常量)
原油(万吨)
生铁(万吨)
1
1
2.922
1.000
.00
.00
.00
2
.076
6.204
.03
.00
.19
3
.002
38.315
.97
1.00
.81
a•因变量:
成品钢材(万吨)
系数'
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准
误差
试用版
容差
VIF
1
(常量)
-282.131
458.218
-.616
.547
原油(万吨)
-.017
.049
-.013
345
.735
.168
5.967
生铁(万吨)
.920
.034
1.010
26.871
.000
.168
5.967
a•因变量:
成品钢材(万吨)
由于剔除变量匕后,VIF值都小于10,故多重共线性得以消除,得岀新的回归方程:
$282.1310・017x】0.92X2
4、异常值和强影响值
残差统计量
极小值
极大值
均值
标准偏差
N
预测值
2738.5310
10059.5371
5465.0028
2457.27013
18
标准预测值
-1.110
1.870
.000
1.000
18
预测值的标准误差
53.220
117.717
72.288
17.057
18
调整的预测值
2770.4775
10140.2559
5485.8900
2473.44774
18
残差
-182.88765
241.19569
.00000
123.05293
18
标准残差
-1.300
1.714
.000
.874
18
Student化残差
-1.710
1.887
057
1.022
18
已删除的残差
-316.76953
292.42792
-20.88723
173.80682
18
Student化已删除的残差
-1.867
2.128
045
1.070
18
Mahalo距离
1.487
10.953
3.778
2.417
18
Cook的距离
.002
.523
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实用 回归 分析 论文
![提示](https://static.bdocx.com/images/bang_tan.gif)