计量经济学第二章一元线性回归模型.pptx
- 文档编号:30845895
- 上传时间:2024-02-02
- 格式:PPTX
- 页数:94
- 大小:664.54KB
计量经济学第二章一元线性回归模型.pptx
《计量经济学第二章一元线性回归模型.pptx》由会员分享,可在线阅读,更多相关《计量经济学第二章一元线性回归模型.pptx(94页珍藏版)》请在冰豆网上搜索。
第二章经典单方程计量经济学模型:
一元线性回归模型回归分析概述一元线性回归模型的参数估计一元线性回归模型的检验一元线性回归模型的预测实例24年2月2日1LOUYONG2.1回归分析概述一、变量间的关系及回归分析的基本概念二、总体回归函数(PRF)三、随机扰动项四、样本回归函数(SRF)24年2月2日2LOUYONG一、变量间的关系及回归分析的基本概念1.变量间的关系变量间的关系
(1)确定性关系确定性关系或函数关系函数关系:
研究的是确定现象非随机变量间的关系。
(2)统计依赖)统计依赖或相关关系:
相关关系:
研究的是非确定现象随机变量间的关系。
24年2月2日3LOUYONG2,半径半径圆面积f施肥量阳光降雨量气温农作物产量,fn对变量间统计依赖关系的考察主要是通过相关对变量间统计依赖关系的考察主要是通过相关分析分析(correlationanalysis)或回归分析或回归分析(regressionanalysis)来完成的来完成的正相关线性相关不相关相关系数:
统计依赖关系负相关11XY有因果关系回归分析回归分析正相关无因果关系相关分析相关分析非线性相关不相关负相关24年2月2日4LOUYONGn注意注意不线性相关并不意味着不相关。
有相关关系相关关系并不意味着一定有因果关系因果关系。
相关分析相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。
回归分析回归分析对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):
前者是随机变量,后者不是。
24年2月2日5LOUYONG2.回归分析的基本概念回归分析的基本概念n回归分析回归分析(regressionanalysis)(regressionanalysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。
n其目的其目的在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。
n被解释变量被解释变量(ExplainedVariable)或应变应变量量(DependentVariable)。
n解释变量解释变量(ExplanatoryVariable)或自变自变量量(IndependentVariable)。
24年2月2日6LOUYONGn回归分析构成计量经济学的方法论基础,其回归分析构成计量经济学的方法论基础,其主要内容包括:
主要内容包括:
(1)根据样本观察值对经济计量模型参数进行估计,求得回归方程;
(2)对回归方程、参数估计值进行显著性检验;(3)利用回归方程进行分析、评价及预测。
24年2月2日7LOUYONG二、总体回归函数(PRF)n回归分析回归分析关心的是根据解释变量的已知或关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。
24年2月2日8LOUYONGn例例2.1n一个假想的社区有100户家庭组成,要研究该社区每月家庭消费支出家庭消费支出Y与每月家庭可支配收家庭可支配收入入X的关系。
即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。
为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。
24年2月2日9LOUYONG表表2.1.1某社区家庭每月收入与消费支出统计表某社区家庭每月收入与消费支出统计表每月家庭可支配收入X(元)800110014001700200023002600290032003500561638869102312541408165019692090229959474891311001309145217381991213423216278149241144136415511749204621782530638847979115513971595180420682266262993510121210140816501848210123542860968104512431474167218812189248628711078125414961683192522332552112212981496171619692244258511551331156217492013229926401188136415731771203523101210140816061804210114301650187021121485171619472200每月家庭消费支出Y(元)2002共计24204950114951644519305238702502521450212851551024年2月2日10LOUYONGn由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同;n但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布(Conditionaldistribution)是已知的,例如:
P(Y=561|X=800)=1/4。
24年2月2日11LOUYONGn因此,给定收入X的值Xi,可得消费支出Y的条件均值条件均值(conditionalmean)或条件期条件期望望(conditionalexpectation):
E(Y|X=Xi)。
n该例中:
E(Y|X=800)=605n描出散点图发现:
随着收入的增加,消费“平均地说平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。
这条直线称为总总体回归线体回归线。
24年2月2日12LOUYONG05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消费支出Y(元)24年2月2日13LOUYONGn在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线总体回归线(populationregressionline),或更一般地称为总体回归曲线总体回归曲线(populationregressioncurve)。
)()|(iiXfXYE称为(双变量)总体回归函数总体回归函数(populationregressionfunction,PRF)。
相应的函数:
24年2月2日14LOUYONGn含义:
回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。
函数形式:
可以是线性或非线性的。
例2.1中,将居民消费支出看成是其可支配收入的线性函数时:
iiXXYE10)|(为一线性函数。
线性函数。
其中,0,1是未知参数,称为回归系数回归系数(regressioncoefficients)。
24年2月2日15LOUYONG三、随机扰动项n总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平。
n但对某一个别的家庭,其消费支出可能与该平均水平有偏差。
n称为观察值围绕它的期望值的离差(离差(deviation),是一个不可观测的随机变量,又称为随机随机干扰项干扰项(stochasticdisturbance)或随机误差随机误差项项(stochasticerror)。
)|(iiiXYEY24年2月2日16LOUYONGn例2.1中,给定收入水平Xi,个别家庭的支出可表示为两部分之和:
(1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性系统性(systematic)或确定性(确定性(deterministic)部部分;分;
(2)其他随机随机或非确定性非确定性(nonsystematic)部分部分i。
24年2月2日17LOUYONGn上式称为总体回归函数(PRF)的随机设定形式。
表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。
n由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。
24年2月2日18LOUYONGn随机误差项主要包括下列因素随机误差项主要包括下列因素n在解释变量中被忽略的因素的影响;n变量观测值的观测误差的影响;n模型关系的设定误差的影响;n其他随机因素的影响。
n产生并设计随机误差项的主要原因产生并设计随机误差项的主要原因n理论的含糊性;n数据的欠缺;n节省原则。
24年2月2日19LOUYONG四、样本回归函数(SRF)n问题:
问题:
能从一次抽样中获得总体的近似的信息吗?
如果可以,如何从抽样中获得总体的近似信息?
n例例2.2:
在例2.1的总体中有如下一个样本,能否从该样本估计总体回归函数PRF?
表表2.1.3家庭消费支出与可支配收入的一个随机样本家庭消费支出与可支配收入的一个随机样本Y800110014001700200023002600290032003500X5946381122115514081595196920782585253024年2月2日20LOUYONG该样本的散点图散点图(scatterdiagram):
n画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该直线近似地代表总体回归线可以该直线近似地代表总体回归线。
该直线称为样本回归线样本回归线(sampleregressionlines)。
)。
24年2月2日21LOUYONGn记样本回归线的函数形式为:
iiiXXfY10)(称为样本回归函数(样本回归函数(sampleregressionfunction,SRF)。
24年2月2日22LOUYONG样本回归函数的随机形式样本回归函数的随机形式/样本回归模型样本回归模型同样地,样本回归函数也有如下的随机形式:
iiiiieXYY10式中,ie称为(样本)残差(样本)残差(或剩余剩余)项项(residual),代表了其他影响iY的随机因素的集合,可看成是i的估计量i。
由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型(样本回归模型(sampleregressionmodel)。
24年2月2日23LOUYONG回归分析的主要目的回归分析的主要目的:
根据样本回归函数SRF,估计总体回归函数PRF。
即,根据iiiiieXeYY10估计24年2月2日24LOUYONGiiiiiXXYEY10)|(2.2一元线性回归模型的参数估计一、一元线性回归模型的基本假设二、参数的普通最小二乘估计(OLS)三、参数估计的最大似然法(ML)*四、最小二乘估计量的性质五、参数估计量的概率分布及随机干扰项方差的估计24年2月2日25LOUYONG一、线性回归模型的基本假设一、线性回归模型的基本假设假设1.解释变量X是确定性变量,不是随机变量;假设2.随机误差项具有零均值、同方差和不序列相关性:
E(i)=0i=1,2,nVar(i)=2i=1,2,nCov(i,j)=0iji,j=1,2,n24年2月2日26LOUYONG假设3.随机误差项与解释变量X之间不相关:
Cov(Xi,i)=0i=1,2,n假设4.服从零均值、同方差、零协方差的正态分布iN(0,2)i=1,2,n24年2月2日27LOUYONG1.如果假设1、2满足,则假设3也满足;2.如果假设4满足,则假设2也满足。
注意以上假设也称为线性回归模型的经典假经典假设设或高斯(高斯(Gauss)假设)假设,满足该假设的线性回归模型,也称为经典线性回归模型经典线性回归模型(ClassicalLinearRegressionModel,CLRM)。
24年2月2日28LOUYONG另外另外,在进行模型回归时,还有两个暗含的假设:
假设5.随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。
即nQnXXi,/)(2假设6.回归模型是正确设定的24年2月2日29LOUYONG二、参数的普通最小二乘估计(二、参数的普通最小二乘估计(OLSOLS)给定一组样本观测值(Xi,Yi)(i=1,2,n)要求样本回归函数尽可能好地拟合这组值.普通最小二乘法普通最小二乘法(Ordinaryleastsquares,OLS)给出的判断标准是:
二者之差的平方和niiiniXYYYQ121021)()(最小。
24年2月2日30LOUYONG方程组(*)称为正规方程组(正规方程组(normalequations)。
24年2月2日31LOUYONG记22221)(iiiiXnXXXx上述参数估计量可以写成:
XYxyxiii1021称为OLS估计量的离差形式(离差形式(deviationform)。
由于参数的估计结果是通过最小二乘法得到的,故称为普通普通最小二乘估计量(最小二乘估计量(ordinaryleastsquaresestimators)。
24年2月2日32LOUYONGiiiiiiiiYXnYXYYXXyx1)(例例2.2.1:
在上述家庭可支配收入可支配收入-消费支出消费支出例中,对于所抽出的一组样本数,参数估计的计算可通过下面的表2.2.1进行。
表表2.2.1参数估计的计算表参数估计的计算表iXiYixiyiiyx2ix2iy2iX2iY1800594-1350-9731314090182250094750864000035283621100638-1050-92997587011025008637841210000407044314001122-750-44533405056250019838119600001258884417001155-450-41218558020250017007428900001334025520001408-150-1592391022500254084000000198246462300159515028414022500762529000025440257260019694504021807202025001612836760000387696182900207875051138295056250026071284100004318084932002585105010181068480110250010355101024000066822251035002530135096312995101822500926599122500006400900求和21500156745769300742500045900205365000029157448平均2150156724年2月2日33LOUYONG777.07425000576930021iiixyx172.1032150777.0156700XY因此,由该样本估计的回归方程为:
124年2月2日34LOUYONGiiXY777.0172.103四、最小二乘估计量的性质四、最小二乘估计量的性质当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。
一个用于考察总体的估计量,可从如下几个方面考察其优劣性:
(1)线性性)线性性,即它是否是另一随机变量的线性函数;24年2月2日35LOUYONG
(2)无偏性)无偏性,即它的均值或期望值是否等于总体的真实值;(3)有效性)有效性,即它是否在所有线性无偏估计量中具有最小方差。
n这三个准则也称作估计量的小样本性质。
小样本性质。
拥有这类性质的估计量称为最佳线性无偏估计量(bestlinerunbiasedestimator,BLUE)。
24年2月2日36LOUYONG(4)渐近无偏性)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;(5)一致性)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;(6)渐近有效性)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。
当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质:
大样本或渐近性质:
24年2月2日37LOUYONG在给定经典线性回归的假定下,在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线最小二乘估计量是具有最小方差的线性无偏估计量。
性无偏估计量。
高斯马尔可夫定理(Gauss-Markovtheorem)24年2月2日38LOUYONG33、有效性(最小方差性)、有效性(最小方差性),即在所有线性无偏估计量中,最小二乘估计量0、1具有最小方差。
(1)先求0与1的方差)var()var()var()var(21021iiiiiiikXkYk22222iiixxx2222222221121iiiiixxXkXnnkXkXnn22222222221iiiiixnXxnXnxxXn221020)/1()var()var()var(iiiiiikXnXwYw24年2月2日39LOUYONG五、参数估计量的概率分布及随机干扰项五、参数估计量的概率分布及随机干扰项方差的估计方差的估计1、参数估计量、参数估计量0和和1的概率分布的概率分布),(2211ixN),(22200iixnXN24年2月2日40LOUYONG2.随机误差项随机误差项的方差的方差2的估计的估计2又称为总体方差总体方差。
24年2月2日41LOUYONG由于随机项i不可观测,只能从i的估计残差ei出发,对总体方差进行估计。
可以证明可以证明,2的最小二乘估计量最小二乘估计量为222nei它是关于2的无偏估计量。
24年2月2日42LOUYONG在随机误差项的方差2估计出后,参数0和1的方差和标准差的估计量分别是:
1的样本方差:
2221ixS1的样本标准差:
21ixS0的样本方差:
22220iixnXS0的样本标准差:
220iixnXS24年2月2日43LOUYONG2.3一元线性回归模型的统计检验一、拟合优度检验二、变量的显著性检验三、参数的置信区间24年2月2日44LOUYONGn在抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检统计检验验。
n主要包括拟合优度检验、拟合优度检验、变量的显著性检验显著性检验及参数的区间估计。
区间估计。
24年2月2日45LOUYONG一、拟合优度检验一、拟合优度检验拟合优度检验:
拟合优度检验:
对样本回归直线与样本观测值之间拟合程度的检验。
度量拟合优度的指标:
判定系数(可决系可决系数数)R22问题问题:
采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?
24年2月2日46LOUYONG1、总离差平方和的分解已知由一组样本观测值(Xi,Yi),i=1,2,n得到如下样本回归直线iiXY10iiiiiiiyeYYYYYYy)()(24年2月2日47LOUYONG24年2月2日48LOUYONG如果Yi=i即实际观测值落在样本回归“线”上,则拟合最好拟合最好。
可认为,“离差”全部来自回归线,而与“残差”无关。
24年2月2日49LOUYONGTSS=ESS+RSS记总体平方和总体平方和(TotalSumofSquares)回归平方和(回归平方和(ExplainedSumofSquares)残差平方和(残差平方和(ResidualSumofSquares)24年2月2日50LOUYONG22)(YYyTSSii22)(YYyESSii22)(iiiYYeRSS2、可决系数、可决系数R22统计量称R2为(样本)可决系数/判定系数(coefficientofdetermination)。
可决系数的取值范围取值范围:
0,1R2越接近1,说明实际观测点离样本线越近,拟合优度越高。
24年2月2日51LOUYONGTSSRSSTSSESSR1记2在实际计算可决系数时,在1已经估计出后:
在例2.1.1的收入消费支出收入消费支出例中,24年2月2日52LOUYONG22212iiyxR9766.045900207425000)777.0(222212iiyxR二、变量的显著性检验二、变量的显著性检验回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。
在一元线性模型中,就是要判断X是否对Y具有显著的线性影响。
这就需要进行变量的显著性检验。
变量的显著性检验所应用的方法是数理统计学中的假设检验。
计量经济学中,主要是针对变量的参数真值是否为零来进行显著性检验的。
24年2月2日53LOUYONG1、假设检验所谓假设检验假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。
24年2月2日54LOUYONGn假设检验采用的逻辑推理方法是反证法假设检验采用的逻辑推理方法是反证法先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。
n判断结果合理与否,是基于“小概率事件不易判断结果合理与否,是基于“小概率事件不易发生”这一原理的发生”这一原理的24年2月2日55LOUYONG2、变量的显著性检验24年2月2日56LOUYONG),(2211ixN)2(1112211ntSxti检验步骤:
(1)对总体参数提出假设H0:
1=0,H1:
10
(2)以原假设H0构造t统计量,并由样本计算其值(3)给定显著性水平,查t分布表得临界值t/2(n-2)24年2月2日57LOUYONG11St(4)比较,判断若|t|t/2(n-2),则拒绝H0,接受H1;若|t|t/2(n-2),则拒绝H1,接受H0;24年2月2日58LOUYONG在上述收入消费支出例中,首先计算2的估计值24年2月2日59LOUYONG134022107425000777.04590020222221222nxyneiii)2(0022200ntSxnXtii41.98742500010/53650000134022220iixnXSt统计量的计算结果分别为:
29.180425.0777.0111St048.141.9817.103000St给定显著性水平=0.05,查t分布表得临界值t0.05/2(8)=2.306|t1|2.306,说明家庭可支配收入在95%的置信度下显著,即是消费支出的主要解释变量;|t2|2.306,表明在95%的置信度下,无法拒绝截距项为零的假设。
24年2月2日60LOUYONG假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。
三、参数的置信区间三、参数的置信区间24年2月2日61LOUYONG如果存在这样一个区间,之称为置信区间(confidenceinterval);1-称为置信系数(置信度)(confidencecoefficient),称为显著性水平(levelofsignificance);置信区间的端点称为置信限(confidencelimit)或临界值(criticalvalues)。
24年2月2日62LOUYONG1)(P一元线性模型中,i(i=1,2)的置信区间:
在变量的显著性检验中已经知道:
意味着,如果给定置信度(1-),从分布表中查得自由度为(n-2)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 第二 一元 线性 回归 模型