换一换

冰豆网 > 资源分类 > DOCX文档下载

预览

线性回归模型的研究毕业论文.docx

资源ID：29599579 资源大小：130.18KB 全文页数：146页
资源格式： DOCX 下载积分：10金币

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要10金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP,免费下载

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

线性回归模型的研究毕业论文.docx

1、线性回归模型的研究毕业论文毕业论文声明本人郑重声明：1此毕业论文是本人在指导教师指导下独立进行研究取得的成果。除了特别加以标注地方外，本文不包含他人或其它机构已经发表或撰写过的研究成果。对本文研究做出重要贡献的个人与集体均已在文中作了明确标明。本人完全意识到本声明的法律结果由本人承担。2本人完全了解学校、学院有关保留、使用学位论文的规定，同意学校与学院保留并向国家有关部门或机构送交此论文的复印件和电子版，允许此文被查阅和借阅。本人授权大学学院可以将此文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本文。3若在大学学院毕业论文审查小组复审中，发现本文有抄袭，

2、一切后果均由本人承担，与毕业论文指导老师无关。4.本人所呈交的毕业论文，是在指导老师的指导下独立进行研究所取得的成果。论文中凡引用他人已经发布或未发表的成果、数据、观点等，均已明确注明出处。论文中已经注明引用的内容外，不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究成果做出重要贡献的个人和集体，均已在论文中已明确的方式标明。学位论文作者（签名）：年月关于毕业论文使用授权的声明本人在指导老师的指导下所完成的论文及相关的资料（包括图纸、实验记录、原始数据、实物照片、图片、录音带、设计手稿等），知识产权归属华北电力大学。本人完全了解大学有关保存，使用毕业论文的规定。同意学校保存

3、或向国家有关部门或机构送交论文的纸质版或电子版，允许论文被查阅或借阅。本人授权大学可以将本毕业论文的全部或部分内容编入有关数据库进行检索，可以采用任何复制手段保存或编汇本毕业论文。如果发表相关成果，一定征得指导教师同意，且第一署名单位为大学。本人毕业后使用毕业论文或与该论文直接相关的学术论文或成果时，第一署名单位仍然为大学。本人完全了解大学关于收集、保存、使用学位论文的规定，同意如下各项内容：按照学校要求提交学位论文的印刷本和电子版本；学校有权保存学位论文的印刷本和电子版，并采用影印、缩印、扫描、数字化或其它手段保存或汇编本学位论文；学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务

4、；学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权大学可以将本学位论文的全部或部分内容编入学校有关数据库和收录到中国学位论文全文数据库进行信息服务。在不以赢利为目的的前提下，学校可以适当复制论文的部分或全部内容用于学术活动。论文作者签名：日期：指导教师签名：日期：线性回归模型的研究【摘要】：本文首先对回归分析的定义、主要内容、基本思想、实现过程进行了阐述，指出了它的优点及存在的问题。对NBA比赛中的各因素和中国人口的预测进行了研究。最后对整篇文章做了个总结。【关键词】：回归分析；回归模型；检验；预测1 引言回归分析最早是由19世纪末期高尔顿（

5、SirFrancisGalton）发展的。1855年，他发表了一篇文章名为“遗传的身高向平均数方向的回归”，分析父母与其孩子之间身高的关系，发现父母的身高越高或的其孩子也越高，反之则越矮。他把儿子跟父母身高这种现象拟合成一种线性关系。但是他还发现了个有趣的现象，高个子的人生出来的儿子往往比他父亲矮一点更趋向于平均身高，矮个子的人生出来的儿子通常比他父亲高一点也趋向于平均身高。高尔顿选用“回归”一词，把这一现象叫做“向平均数方向的回归”。于是“线形回归”的术语被沿用下来了。回归分析中，当研究的因果关系只涉及因变量和一个自变量时，叫做一元回归分析；当研究的因果关系涉及因变量和两个或两个以上自变量时

6、，叫做多元回归分析。此外，回归分析中，又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的，分为线性回归分析和非线性回归分析。按照参数估计方法可以分为主成分回归、偏最小二乘回归、和岭回归。一般采用线性回归分析，由自变量和规定因变量来确定变量之间的因果关系，从而建立线性回归模型。模型的各个参数可以根据实测数据解。接着评价回归模型能否够很好的拟合实际数据；如果不能够很好的拟合，则重新拟合；如果能很好的拟合，就可以根据自变量进行下一步推测。回归分析是重要的统计推断方法。在实际应用中，医学、农业、生物、林业、金融、管理、经济、社会等诸多方面随着科学的发展都需要运用到这个方法。从而推动了

7、回归分析的快速发展。2 回归分析的概述 2.1 回归分析的定义回归分析是应用极其广泛的数据分析方法之一。回归分析（regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。2.2 回归分析的主要内容（1）从一组数据出发，确定某些变量之间的定量关系式，即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法。（2）对这些关系式的可信程度进行检验。（3）在许多自变量共同影响着一个因变量的关系中，判断哪个（或哪些）自变量的影响是显著的，哪些自变量的影响是不显著的，将影响显著的自变量选入模型中，而剔除影响不显著的变量，通常用逐步回归、向前回归和向

8、后回归等方法。（4）利用所求的关系式对某一生产过程进行预测或控制。回归分析的应用是非常广泛的，统计软件包使各种回归方法计算十分方便。2.3一元线性回归与多元线性回归的分析一元线性回归模型, 是分析两个变量之间相互关系的数学方程式, 其一般表达式为y=a+bx式中, y表示因变量的估计值, x 表示自变量, a,b 称为回归模型的待定参数, 其中 b 又称为回归系数。上述的回归方程式在平面坐标系中表现为一条直线即回归直线。当 b0 时 y 随 x 的增加而增加, 两变量之间为正相关关系; 当 b0 时,y 随 x 的增加而减少, 两变量之间为负相关关系; 当y为一个常量时, 不随x的变动而变动。

9、这样就为我们判断现象之间的关系, 分析现象之间是否处于正常状态提供了一条标准。多元线性回归模型旨在分析两个或者两个以上的自变量作用后产生的结果,即多个自变量下的因变量结果,研究的是随机变量y与多个普通变量x1,x2, xp, (p2),的相关关系。表达式为y=0 +1 x1 +2 x2 +pxp+，对随机误差项常假定E()=0,Var()=2。并且称E(y)= 0 +1 x1 +2 x2 +pxp为理论回归方程。在实际应用中，如果获得n组观测数据（xi1 ,xi2,xip ;yi),i=1,2,n,则线性回归模型变为y=0 +1 xi1 +2 xi2 +p xip +i 。并且，量y与自变量x

10、之间的关系往往是非线性关系，而不是简单的线性关系。但在非线性回归分析研究实际问题时,往往选择可以通过一定变换后能转换成线性关系的研究模型，从而避免了非线性回归分析的计算的复杂性。随着技术的不断进步，研究过程中经常运用到计算机，复杂的非线性回归分析模型也将被应用在研究中，而且会越来越频繁。2.4 回归分析的基本思想在回归分析中，把变量分为两类。一类是因变量，它们通常是实际问题中所关心的一类指标，通常用Y表示；而影响因变量取值的的另一类变量称为自变量，用X来表示。回归分析研究的主要问题是：（1）确定Y与X间的定量关系表达式，这种表达式称为回归方程；（2）对求得的回归方程的可信度进行检验；（3）判断

11、自变量X对因变量Y有无影响；（4）利用所求得的回归方程进行预测和控制。2.5回归分析的实现过程（1）确定变量：明确预测的具体目标，也就确定了因变量。如预测具体目标是下一年度的销售量，那么销售量Y就是因变量。通过市场调查和查阅资料，寻找与预测目标的相关影响因素，即自变量，并从中选出主要的影响因素。（2）建立预测模型：依据自变量和因变量的历史统计资料进行计算，在此基础上建立回归分析方程，即回归分析预测模型。（3）进行相关分析：回归分析是对具有因果关系的影响因素（自变量）和预测对象（因变量）所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时，建立的回归方程才有意义。因此，作为自变量的因素

12、与作为因变量的预测对象是否有关，相关程度如何，以及判断这种相关程度的把握性多大，就成为进行回归分析必须要解决的问题。进行相关分析，一般要求出相关关系，以相关系数的大小来判断自变量和因变量的相关的程度。（4）计算误差量：回归预测模型是否可用于实际预测，取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验，且预测误差较小，才能将回归方程作为预测模型进行预测。（5）确定预测值：利用回归预测模型计算预测值，并对预测值进行综合分析，确定最后的预测值。2.6回归分析的优缺点回归分析的优点是在分析多个因素模型的时候，更加的简单有效，可以准确的计量多个因素之间的相关程度与回归拟合程度的高低，

13、从而提高预测方程式的准确性。但有时候在回归分析中，选用何种因子和该因子采用何种表达式只是一种推测，这影响了因子的多样性和某些因子的不可测性，使得回归分析在某些情况下受到限制。3 回归分析的应用3.1一元线性回归分析中国人口发展的第四个高峰期是在新中国建立之后的50年。在这一时期里，中国人口的大展呈现着许多复杂的特点，而且这些特点都与中国历史时期人口有着密切的关系人口问题一直是一个全球性问题，也是中国经济社会发展和可持续发展的一个基本问题。2010年，中国人口总数已经达到134091万，全世界大约683059万人。全世界平均五个人中就有一个是中国人。中国人口的特点是基数大、育龄人群和农村人口的比

14、重高、增长速度较快而且地区分布不均匀。虽然中国人口基数大，但是每年净增人口数也很大。那么未来人口增长趋势如何呢，未来男性比重、人口老龄化趋势、城市人口比重又如何呢？查阅大量资料得到以下数据年份总人口（万）男性人口比重（%）城市人口比重（%）199612238950.8230.48199712362651.0731.91199812476151.2533.35199912578651.4334.78200012674351.6336.22200112762751.4637.66200212845351.4739.09200312922751.5040.53200412998851.5241.7

15、6200513075651.5342.99200613144851.5244.34200713212951.5045.89200813280251.4746.99200913345051.4448.34201013409151.2749.95201113473551.2651.27观察历年总人口散点图，发现变量间呈线性相关趋势，所以应该选取一元线性回归的方法。通过spss软件回归分析得到下图模型拟合度检验模型汇总b模型RR 方调整 R 方标准估计的误差1.995a.990.989393.666a. 预测变量: (常量), 年份。b. 因变量: 总人口其中第二列R表示复相关系数，其反映的是自变

16、量与因变量之间的密切程度。其值在0到1之间，越大越好。第三列R方是复相关系数的平方，又称决定系数。通过观察这几个数据，可知拟合情况很好。方差分析表Anovaa模型平方和df均方FSig.1回归217948139.1361217948139.1361406.364.000b残差2169618.30114154972.736总计220117757.43815a. 因变量: 总人口b. 预测变量: (常量), 年份。从上图中可知，回归模型的Sig值为0，说明该模型有显著的统计意义。系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-1474830.96342773.884-34.4

17、80.000年份800.64021.350.99537.502.000a. 因变量: 总人口根据上图得到拟合的结果为总人口=年份*800.640-1474830.963。但是一个完整的回归分析过程还包括利用残差分析，对拟合结果进行检验。下图中所示的是与残差值有关的一些统计量，包括预测值及标准化的预测值、残差及残差的预测值的最小值、最大值、均值、标准差和样本值。这些数据中无离群值，且数据的标准差也比较小，可以认为模型是健康的。残差统计量a极小值极大值均值标准偏差N预测值123245.89135255.48129250.693811.80716残差-856.890403.272.000380.3

18、1716标准预测值-1.5751.575.0001.00016标准残差-2.1771.024.000.96616a. 因变量: 总人口对于模型的检验，除了分析残差统计量之外，还可以直接作出标准化残差值的直方图和正态P-P图来观察其是否服从正态分布。如下图所示，由于残差具有正态分布的趋势。因此可以认为这里的回归模型是恰当的。观察历年城市人口比重散点图，发现变量间呈线性相关趋势，所以应该选取一元线性回归的方法。通过spss软件回归分析得到下图模型拟合度检验模型汇总b模型RR 方调整 R 方标准估计的误差11.000a1.0001.000.13627a. 预测变量: (常量), 年份。b. 因

19、变量: 城市人口比重通过观察这几个数据可知拟合度很好。Anovaa模型平方和df均方FSig.1回归643.0461643.04634629.231.000b残差.26014.019总计643.30615a. 因变量: 城市人口比重b. 预测变量: (常量), 年份。回归模型的Sig值为0，说明该模型具有显著的统计意义。系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-2714.34214.806-183.322.000年份1.375.0071.000186.089.000a. 因变量: 城市人口比重拟合的结果为城市人口比重=年份*1.375-2714.342。同样可以通过

20、以上两种方法对拟合结果进行检验，发现该回归模型是恰当的。结论通过建立回归模型可以预测未来几年内中国人口，中国人口一直呈现上升趋势，上升速度基本平缓，没有出现很大的波动，但上升幅度有略微的下降。同样通过回归模型能够预测未来几年内中国城市人口比重，中国城市人口比重也一直呈现上升趋势，上升速度快，城市人口越来越多，已经超过50%，未来几年内还会继续上升，没有下跌的趋势，而且上升幅度基本不变。结合实际情况，比如“计划生育”方面可以改善一下，适当的放宽要求。3.2多元线性回归分析篮球运动是一项热门的竞技体育运动项目，由两队参与的球类运动。篮球比赛强调篮球运动员之间的配合来完成比赛。而篮球运动对运动员的技

21、战术和身体素质要求越来越高，尤其是当今世界篮球水平最高的联赛是美国的国家篮球协会（NBA），其对技术的要求比起其他赛事更高。优秀的篮球技术是战术运用的基础。传统上把篮球技术分为进攻技术和防守技术两种，包括移动动作、控制球权、支配球权和争夺球权，当然也包括由这些动作随意组合所组成的动作体系。众所周知，影响每一场比赛胜负的原因有很多，既有偶然性，但更多的是必然性的。那么是哪些主要的技战术动作主导着NBA2012-2013赛季季后赛每支参赛球队的最终排名呢？从而能够提高这些技战术动作能力来提高排名。通过对NBA2012-2013赛季季后赛数据的进行回归分析就能得到答案。NBA季后赛是世界最高水平的比

22、赛，各支球队以夺取总冠军为最高荣誉和目标，而且NBA比赛也为各支球队的战术、实力的表现提供了平台。之所以NBA的吸引力大是因为比赛精彩，战术、球员能力高。根据NBA中文官方网站提供的数据统计情况，发现有总投篮出手、投篮命中率、三分球命中率、罚球命中率、助攻、得分六项指标来评价球队进攻能力。发现有篮板、抢断、盖帽、失分四项指标来评价球队的防守能力。发现有失误、犯规、失格三项指标来评价球队的违规控制能力。NBA2012-2013赛季季后赛各球队进攻能力六项指标成绩球队总投篮出手投篮命中率三分球命中率罚球命中率助攻得分总冠军热火76.60.4680.40.76820.697.1西部冠军马刺82.2

23、0.4630.40.76321.9100.3西部决赛灰熊81.50.4180.30.74819.394.7东部决赛步行者78.50.4330.30.74017.591.8第二轮雷霆81.60.4270.30.83818.198.5第二轮勇士84.40.4620.40.73621.7102.7第二轮公牛79.90.4380.30.72019.591.9第二轮尼克斯81.00.4100.30.78215.188.6第一轮老鹰77.30.4220.30.68217.089.3第一轮篮网83.70.4420.30.75820.299.4第一轮凯尔特人82.30.4130.30.86016.890.6第

24、一轮雄鹿76.80.4330.30.63019.893.2第一轮火箭81.00.4240.30.71118.0100.0第一轮快船75.30.4670.30.78218.094.7第一轮掘金84.80.4380.30.73021.2103.0第一轮湖人78.00.4420.30.60818.585.3NBA2012-2013赛季季后赛各球队防守能力四项指标成绩球队篮板抢断盖帽失分总冠军热火38.18.35.490.7西部冠军马刺42.67.95.093.3西部决赛灰熊41.77.34.694.1东部决赛步行者45.65.44.591.6第二轮雷霆42.96.07.097.1第二轮勇士46.16

25、.44.9102.5第二轮公牛40.86.44.698.6第二轮尼克斯39.58.84.385.9第一轮老鹰38.37.33.894.5第一轮篮网42.16.35.697.4第一轮凯尔特人39.05.53.087.7第一轮雄鹿34.810.02.5100.0第一轮火箭43.55.85.5105.8第一轮快船37.25.25.7100.2第一轮掘金38.79.02.8107.2第一轮湖人40.05.85.3104.0NBA2012-2013赛季季后赛各球队违规控制能力三项指标成绩球队失误犯规失格总冠军热火13.122.20.1西部冠军马刺12.919.10.0西部决赛灰熊10.722.10.1东

26、部决赛步行者16.422.40.2第二轮雷霆13.624.90.3第二轮勇士16.523.80.3第二轮公牛14.322.40.6第二轮尼克斯11.623.80.4第一轮老鹰12.224.20.2第一轮篮网11.619.90.3第一轮凯尔特人17.318.80.3第一轮雄鹿16.319.80.0第一轮火箭15.823.20.0第一轮快船13.327.80.2第一轮掘金14.523.20.3第一轮湖人16.517.50.0NBA2012-2013赛季季后赛各球队名称排名情况的影响因素分析（1）确定影响NBA2012-2013赛季季后赛各球队的排名情况模型。NBA2012-2013赛季季后赛各球队

27、名称排名情况是综合因素的反映，令热火为第一名，马刺第二名，灰熊跟步行者并列第三名，雷霆、勇士、公牛、尼克斯并列第五名，老鹰、篮网、凯尔特人、雄鹿、火箭、快船、掘金、湖人并列第九。设成绩为因变量Y. 设总投篮出手、投篮命中率、三分球命中率、罚球命中率、助攻、得分、篮板、抢断、盖帽、失分、失误、犯规和失格为自变量，分别为X1，X2，X3，X4，X5，X6，X7，X8，X9，X10，X11，X12，X13。（2）首先，分析各个待选变量的特制，以及对排名的影响程度，相关系数显著性检验代表解释变量X与被解释变量Y之间的相关程度，它越靠近1，说明两者相关程度越高，可以利用SPSS逐步筛选的方法进一步完成回

28、归方程的建立。依据下表可知，模型2的相关系数显著性检验R为0.606，决定系数R方为0.368，调整的决定系数为0.323；而模型2的相关性系数检验R为0.742，决定系数R为0.550，调整的决定系数为0.481，各值都比模型1更加接近于1。所以模型2更加适合做线性回归模型，而且主要影响因素为x3和x10，其他因素经分析可以不考虑。模型汇总模型RR 方调整 R 方标准估计的误差1.606a.368.3232.4552.742b.550.4812.149a. 预测变量: (常量), X3。b. 预测变量: (常量), X3, X10。（2）建立NBA2012-2013赛季季后赛各球队的名次排名情况回归方程。从下表中可知：各列数据依次是非标准化回归系数B、非标准化回归系数的标准误差、标准化回归系数、回归系数显著性检验中T统计量的观测值、对应的概率sig。因

注意事项

本文（线性回归模型的研究毕业论文.docx）为本站会员主动上传，冰豆网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知冰豆网（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。