应用回归分析课程设计SAS版.docx
- 文档编号:29276938
- 上传时间:2023-07-21
- 格式:DOCX
- 页数:20
- 大小:319.70KB
应用回归分析课程设计SAS版.docx
《应用回归分析课程设计SAS版.docx》由会员分享,可在线阅读,更多相关《应用回归分析课程设计SAS版.docx(20页珍藏版)》请在冰豆网上搜索。
应用回归分析课程设计SAS版
《应用回归分析》
课程设计报告
学院
专业
学号
分数
二○一一年十二月
关于居民家庭人均可支配收入与消费支出的一元回归分析
【摘要】实行改革开放的三十多年里,全国经济发展迅速,经济的发展也带动着人民生活的提高,居民家庭人均可支配收入逐年提高,人民生活环境不断优化。
与此同时,人民生活水平的提高也反作用于经济的发展,人均可支配收入的增加也拉动国的商品消费,促进经济的发展。
为了进一步深入了解居民家庭人均可支配收入与消费支出的关系,本文选择通过一元回归分析的方法,在已有数据的基础上挖掘居民家庭人均可支配收入与消费支出的明确关系。
一、问题提出:
改革开放三十多年里,随着经济的发展,居民家庭人均可支配收入不断提高,而居民家庭人均可支配收入的提高又反作用于商品消费,不断促进着国商品消费的发展,拉动国家经济的发展。
由此可见在居民家庭人均可支配收入与消费支出之间必然存在着一定的联系,我们将尝试通过已有的数据,进行分析总结,挖掘出二者之间的数学关系。
二、数据分析:
数据样本与数据来源
全国各地区城市居民家庭人均可支配收入与消费支出,数据均选自“国家统计局网”中2000—2005年的统计数据(见表1)。
全国各地区居民家庭人均可支配收入与消费支出(2000-2005)
表1
现运用SAS软件对筛选后的数据进行一元回归分析:
设居民家庭人均可支配收入为y,消费支出为x:
源程序:
datayy;
inputyx;
cards;
13249.810464
18645.0313773.41
17652.9513244.20
16682.812631.0
16293.7712253.74
15637.812200.4
14867.4911040.34
14769.9411809.87
14546.410636.1
13882.6211123.84
13627.710694.8
12883.469336.1
12638.559653.26
12463.9210284.6
12380.439636.27
12321.318794.41
12318.578621.82
11718.018868.19
11467.28802.4
10481.97332.3
10415.198099.63
10312.917867.53
9431.188617.11
9337.567191.96
9265.906996.90
;
procprint;
run;
procgplot;
ploty*x;
symbolc=blackv=stari=none;
run;
proccorrpearson;
varyx;
run;
procreg;
modely=x/prdw;
outputout=outr=residual;
run;
printcli;
printclm;
ploty*x/conf95;
run;
procgplotdata=out;
plotresidual*x;
symbolc=blackv=stari=none;
run;
dataout1;
setout;
z=abs(residual);
lag1residual=lag1(residual);
t=_n_;
run;
procprintdata=out1;
run;
proccorrdata=out1;
varxz;
run;
procgplotdata=out1;
plotresidual*lag1residual=1;
plotresidual*t=2;
symbol1c=blackv=stari=none;
symbol2c=blackv=stari=none;
run;
三、输出结果以及相关分析:
1.录入数据:
2.散点图:
有相关图我们可以发现,居民家庭人均可支配收入与消费支出具有明显的一元线性关系。
3.简单统计量和Pearson相关系数:
由相关图和相关系数我们可以发现,居民家庭人均可支配收入与消费支出具有明显的一元线性相关关系,所以我们选择用一元回归模型对其进行拟合。
4.参数估计及模型检验:
由结果看出:
参数x显著,而常数项不显著,但一般情况下我们都选择保留常数项,来体现实际意义,而方差分析中p<0.0001,所以一元回归方程也显著。
所以拟合模型为:
y=86.48762+1.30066*x
5.区间估计预测值与模型均值的拟合图,以及残差图:
由区间估计与模型均值的拟合图,我们可以确定,一元回归拟合效果良好,置信区间分部也合理。
再由残差图中我们可以看出:
点都在0值上下随机分布,没有明显的趋势,所以一元回归拟合效果良好。
为了增强模型的可靠性,我们进一步对模型进行异方差检验和自相关性检验。
6.异方差检验:
等级相关系数法:
z为残差的绝对值,所以由p=0.9966>0.05,以及结合上面的残差图:
点的分布没呈现明显的规律性,可以确定上述数据不存在异方差。
7.自相关性检验:
(1)图示法:
残差et与et-1的散点图
残差et与t的散点图
由残差et与et-1的散点图中,点都没呈现出明显的规律性,而残差et与t的散点图中,点都在0值附近随机分布,没有明显的规律性跳跃或波动,所以我们可以认为随机误差项不存在自相关性。
(2)DW检验法:
有输出结果,可以看出DW值为:
2.,查DW表,n=25,k=2,显著性水平a=0.05,得dL=1.29,dU=1.45。
由于1.45<2.<2.55,因而我们依然可以认为随机误差项不存在自相关性。
四、结论总结:
由一元回归分析,得到了居民家庭人均可支配收入与消费支出的函数关系为:
y=86.48762+1.30066*x。
t检验和方差分析检验结果确定回归方程显著有效,拟合效果良好,并且通过了异方差和自相关性检验,所以我们可以确定,此一元回归方程可以可靠地体现居民家庭人均可支配收入与消费支出的关系。
关于病虫预报的多元回归分析
【摘要】病虫害作为一类频发性生物灾害,是生产和生态工程建设的一个重要制约因素。
我国是世界上病虫害发生较为严重的国家之一。
为减少森林病虫害的危害造成的损失,通过研究生态系统中病虫害种群变化的规律,对病虫害未来发生和增长趋势作出科学的预测预报,从而实现对病虫害的可持续控制。
病虫害的发生流行是有害生物和气象等因素综合作用的结果,其中部分因素是决定有害生物发生流行的关键因子。
在生态系统中,可以根据这一类因素对病虫害种群动态的影响,通过数学、生态学方法构建系统模型,利用这些模型进行主要病虫害的种群趋势的准确预测,并采取科学的综合治理措施。
本文根据多元回归分析的原理,分析多个预报因子与病虫害种群变动之间的在联系,构建预测模型,利用文献资料和病虫害的调查数据有效地拟合和预报病虫害危害程度和发生趋势。
一、问题提出:
我国是世界上病虫害多发的国家之一,多年来,严重的病虫害不但制约着我国农业等产业的持续发展,而且对生态环境也带来了破坏性的影响,所以如何有效地预防,治理病虫害已经成为了我国的重要生态项目之一。
经过多年的研究观察,我们发现生态系统中有许多重要预报因子对病虫害的爆发具有很强的同步性,由此可见在这一类预报因子与病虫害爆发之间必然存在着密切的联系,我们将尝试通过对已有文献的数据进行分析总结,挖掘出它们之间确切的数学关系。
二、数据分析
1、设置指标
某地区病虫测报站选取了以下4个预报因子;
x1为最多连续10天诱蛾量(头);
x2为4月上、中旬百束小谷草把累计落卵量(块);
x3为4月中旬降水量(毫米);
x4为4月中旬雨日(天);
y为预报一代粘虫幼虫发生量(头/m2)。
其中,预报因子:
x1诱蛾量:
0~300头为l级,301~600头为2级,601~1000头为3级,1000头以上为4级;
x2卵量:
0~150块为1级,15l~300块为2级,301~550块为3级,550块以上为4级;
x3降水量:
0~10.0毫米为1级,10.1~13.2毫米为2级,13.3~17.0毫米为3级,17.0毫米以上为4级;
x4雨日:
0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。
y预报量:
每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。
2、数据样本与数据来源
某地区病虫测报站相关指标数据:
表1
现运用SAS软件对上述数据进行多元回归分析。
源程序:
datady;
inputyx1-x4;
cards;
14111
11311
13111
44444
11111
12111
33322
11211
43442
33432
22222
21342
31243
32113
43442
21111;
procprint;
run;
proccorrpearson;
varyx1-x4;
run;
procreg;
modely=x1-x4;
modely=x1-x4/selection=adjrsqcpaicdw;
modely=x1-x4/selection=stepwisevif;
outputout=outr=residual;
run;
dataout1;
setout;
z=abs(residual);
lag1residual=lag1(residual);
t=_n_;
run;
procprintdata=out1;
run;
proccorrdata=out1out=out2;
varx2x4z;
run;
procgplotdata=out1;
plotresidual*lag1residual=1;
plotresidual*t=2;
symbol1c=blackv=stari=none;
symbol2c=blackv=stari=none;
run;
procprincompdata=dy;
varx1-x4;
run;
procregdata=dy
outest=pcr;
modely=x1-x4/pcomit=1;
run;
procprintdata=pcr;
run;
procregdata=dyoutest=rid;
modely=x1-x4/ridge=0to1by0.1;
plot/ridgeplot;
run;
procprintdata=rid;
run;
三、输出结果以及相关分析:
1.录入数据:
2.简单统计量和Pearson相关系数:
由相关系数我们可以认为,各个预报因子都与预报一代粘虫幼虫发生量具有较强的的相关关系,所以尝试使用多元回归模型对其进行拟合。
3.随机误差项的异方差检验和自相关性检验:
由异方差检验结果,我们可以选择使用x2来构造权函数,进行加权最小二乘来估计参数系数,来减小随机误差项的异方差影响。
所以采用加权最小二乘法弱化异方差影响后的回归方程为:
y=-0.01+0.2*x1+0.264*x2+0.72*x3+0.813*x4
自相关性检验结果:
(1)图示检验法:
残差et与et-1的散点图
残差et与t的散点图
(2)等级相关系数法:
所以结合图示检验法和等级相关系数法,我们可以认为该序列的随机误差项不具有自相关性。
4.参数估计及模型检验:
拟合模型为:
y=-0.18211+0.14220*x1+0.24452*x2+0.21009*x3+0.60471*x4,只有参数x4显著,而其他参数估计都不显著,但方差分析中p<0.0001,说明自变量从整体上对y具有显著的影响,所以我们对自变量进行选择,剔除不显著变量,优化回归方程。
5.变量选择:
(1)最优子集法:
有最优子集法的输出结果我们可以看出,当自变量取x2和x4时AIC最小,所以防城最优,所以方程应该只保留x2和x4两个自变量。
(2)逐步回归法:
最终输出结果:
根据逐步回归法的结果,只选择x2和x4作为自变量时,所得到的拟合模型以及相关的模型显著性检验:
所以结合最优子集法和逐步回归法的结果,我们可以认为自变量只取x2和x4时,所得到的回归方程:
y=-0.08698+0.41439*x2+0.76067*x4最优,并且x2和x4的vif均较小,我们可以认为二者不具有多重共线性。
6.多重共线性的消除:
(若不采用逐步回归法)
(1)主成分回归法:
所以让主成分累计贡献率保持在95%以上时,我们只需要保留前三个主成份,所以得到主成分回归的回归方程为:
即:
y=-0.15327+0.15647*x1+0.19193*x2+0.27342*x3+0.56224*x4
(2)岭回归:
岭迹图:
输出结果:
岭迹图在K=0.6~0.8之间时比较稳定,所以我们选择取K=0.7,岭回归方程为:
y=0.38294+0.12864*x1+0.19369*x2+0.20429*x3+0.38116*x4
四、结论总结:
由多元回归分析,得到了多个预报因子与预报一代粘虫幼虫发生量的函数关系为:
y=-0.08698+0.41439*x2+0.76067*x4
y=-0.15327+0.15647*x1+0.19193*x2+0.27342*x3+0.56224*x4
y=0.38294+0.12864*x1+0.19369*x2+0.20429*x3+0.38116*x4
t检验和方差分析检验结果确定回归方程显著有效,拟合效果良好,并且消除了异方差以及自变量的多重共线性,还有通过了自相关性检验,所以我们可以确定,这些多元回归方程可以可靠地体现,各个预报因子与病虫害种群变动之间的在联系。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 回归 分析 课程设计 SAS