面板数据格兰杰因果关系向量自回归和向量误差修正模型.docx
- 文档编号:29838040
- 上传时间:2023-07-27
- 格式:DOCX
- 页数:16
- 大小:43KB
面板数据格兰杰因果关系向量自回归和向量误差修正模型.docx
《面板数据格兰杰因果关系向量自回归和向量误差修正模型.docx》由会员分享,可在线阅读,更多相关《面板数据格兰杰因果关系向量自回归和向量误差修正模型.docx(16页珍藏版)》请在冰豆网上搜索。
面板数据格兰杰因果关系向量自回归和向量误差修正模型
面板数据、格兰杰因果关系、向量自回归和向量误差修正模型
(2011-06-1311:
43:
22)
标签:
分类:
工作篇
校园
面板数据的计量方法
1.什么是面板数据,
面板数据,paneldata,也称时间序列截面数据,timeseriesandcrosssectiondata,或混合数据,pooldata,。
面板数据是截面数据与时间序列综合起来的一种数据资源~是同时在时间和截面空间上取得的二维数据。
如:
城市名:
北京、上海、重庆、天津的GDP分别为10、11、9、8,单位亿元,。
这就是截面数据~在一个时间点处切开~看各个城市的不同就是截面数据。
如:
2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12,单位亿元,。
这就是时间序列~选一个城市~看各个样本时间点的不同就是时间序列。
如:
2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为:
北京市分别为8、9、10、11、12,
上海市分别为9、10、11、12、13,
天津市分别为5、6、7、8、9,
重庆市分别为7、8、9、10、11,单位亿元,。
这就是面板数据。
2.面板数据的计量方法
利用面板数据建立模型的好处是:
1,由于观测值的增多~可以增加估计量的抽样精度。
2,对于固定效应模型能得到参数的一致估计量~甚至有效估计量。
3,面板数据建模比单截面数据建模可以获得更多的动态信息。
例如1990-2000年30个省份的农业总产值数据。
固定在某一年份上~它是由30个农业总产值数字组成的截面数据,固定在某一省份上~它是由11年农业总产值数据组成的一个时间序列。
面板数据由30个个体组成。
共有330个观测值。
面板数据模型的选择通常有三种形式:
混合估计模型、固定效应模型和随机效应模型。
这三类模型的差异主要表现在系数、截距以及随机误差的假设不同。
第一种是混合估计模型,PooledRegressionModel,。
如果从时间上看~不同个体之间不存在显著性差异,从截面上看~不同截面之间也不存在显著性差异~那么就可以直接把面板数据混合在一起用普通最小二乘法,OLS,估计参数。
此时~对所有横截面数据而言~截距应是相同的。
第二种是固定效应模型,FixedEffectsRegressionModel,。
在面板数据散点图中~如果对于不同的截面或不同的时间序列~模型的截距是不同的~则可以采用在模型中加
虚拟变量的方法估计回归参数~称此种模型为固定效应模型,fixedeffectsregression
model,。
此时~相对于混合效应模型而言~个体间存在差异可以体现在截距的差异也可以体现为系数的差异。
固定效应模型分为3种类型~即个体固定效应模型,entityfixedeffectsregression
model,、时刻固定效应模型,timefixedeffectsregressionmodel,和时刻个体固定效应模型,timeandentityfixedeffectsregressionmodel,。
1,个体固定效应模型。
个体固定效应模型就是对于不同的个体有不同截距的模型。
如果对于不同的时间序列,个体,截距是不同的~但是对于不同的横截面~模型的截距没有显著性变化~那么就应该建立个体固定效应模型。
注意:
个体固定效应模型的EViwes输出结果中没有公共截距项。
2,时刻固定效应模型。
时刻固定效应模型就是对于不同的截面,时刻点,有不同截距的模型。
如果确知对于不同的截面~模型的截距显著不同~但是对于不同的时间序列,个体,截距是相同的~那么应该建立时刻固定效应模型~
相对于混合估计模型来说~是否有必要建立时刻固定效应模型可以通过F检验来完成。
H0:
对于不同横截面模型截距项相同,建立混合估计模型,。
H1:
对于不同横截面模型的截距项不同,建立时刻固定效应模型,。
3,时刻个体固定效应模型。
时刻个体固定效应模型就是对于不同的截面,时刻点,、不同的时间序列,个体,都有不同截距的模型。
如果确知对于不同的截面、不同的时间序列,个体,模型的截距都显著地不相同~那么应该建立时刻个体效应模型。
相对于混合估计模型来说~是否有必要建立时刻个体固定效应模型可以通过F检验来完成。
H0:
对于不同横截面~不同序列~模型截距项都相同,建立混合估计模型,。
H1:
不同横截面~不同序列~模型截距项各不相同,建立时刻个体固定效应模型,。
第三种是随机效应模型。
在固定效应模型中采用虚拟变量的原因是解释被解释变量的信息不够完整。
也可以通过对误差项的分解来描述这种信息的缺失。
yit=a+b1xit+eit其中误差项在时间上和截面上都是相关的~用3个分量表示如下。
eit=ui+vt+wit其中ui~N(0,su2)表示截面随机误差分量,vt~N(0,sv2)表示时间随机误差分量,wit~N(0,sw2)表示混和随机误差分量。
同时还假定ui~vt~wit之间互不相关~各自分别不存在截面自相关、时间自相关和混和自相关。
上述模型称为随机效应模型。
与固定效应模型不同~随机效应模型中。
随机误差项和截距项都是随机变量。
随机效应模型和固定效应模型比较~相当于把固定效应模型中的截距项看成两个随机变量。
一个是截面随机误差项,ui,~一个是时间随机误差项,vt,。
如果这两个随机误差项都服从正态分布~对模型估计时就能够节省自由度~因为此条件下只需要估计两个随机误差项的均值和方差。
假定固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应~而
且对均值的离差分别是ui和vt~固定效应模型就变成了随机效应模型。
注意:
随机效应模型EViwes输出结果中含有公共截距项。
一般常用的具体检验方法是:
通过构造F统计量判断是否所有固定影响为零~对固定效应模型和混合模型进行筛选;通过ols估计的残差构造LM统计量~即BP拉格朗日乘数检验进行随即模型和混合模型检验以及通过hausman检验进行固定效应模型和随机模型的筛选。
由于面板数据带有时间序列和横截面数据的双重性。
而在处理时间序列模型时~必须首先对时间序列进行单位根检验~否则很可能出现“伪回归”~因此必须对其进行平稳性检验。
Eviews软件对面板数据的单位根检验包括五种~即LLC检验、IPS检验、Fish-ADF,Fish-PP检验和Hadri检验。
其中Hadri检验的原假设为面板数据不存在单位根~而其它四种检验的原假设为含有单位根。
详细的应用例子可参见:
蔡莉~《我国货币政策有效性的区域差异分析:
2003-2009》~复旦大学2009届硕士论文~第36-39页。
随机效应模型和固定效应模型哪一个更好些,实际是各有优缺点。
随机效应模型的好处是节省自由度。
对于从时间序列和截面两方面上看都存在较大变化的数据~随机效应模型能明确地描述出误差来源的特征。
固定效应模型的好处是很容易分析任意截面数据所对应的因变量与全部截面数据对应的因变量均值的差异程度。
此外~固定效应模型不要求误差项中的个体效应分量与模型中的解释变量不相关。
当然~这一假定不成立时~可能会引起模型参数估计的不一致性。
用EViwes可以估计固定效应模型,包括个体固定效应模型、时刻固定效应模型和时刻个体固定效应模型3种,、随机效应模型、带有AR
(1)参数的模型、截面不同回归系数也不同的面板数据模型。
用EViwes可以选择普通最小二乘法、加权最小二乘法,以截面模型的方差为权,、似不相关回归法估计模型参数。
时间序列的平稳、非平稳、协整、格兰杰因果关系
步骤:
先做单位根检验~看变量序列是否平稳序列~若平稳~可构造回归模型等经典计量经济学模型,若非平稳~进行差分~当进行到第i次差分时序列平稳~则服从i阶单整,注意趋势、截距不同情况选择~根据P值和原假设判定,。
若所有检验序列均服从同阶单整~可构造VAR模型~做协整检验,注意滞后期的选择,~判断模型内部变量间是否存在协整关系~即是否存在长期均衡关系。
如果有~则可以构造VEC模型或者进行Granger因果检验~检验变量之间“谁引起谁变化”~即因果关系。
1.单位根检验是序列的平稳性检验~如果不检验序列的平稳性直接OLS容易导致伪回归。
常用的ADF检验包括三个模型方程。
在李子奈的《高级计量经济学》上有该方法的全部步骤~即从含趋势项、截距项的方程开始~若接受原假设~则对模型中的趋势项参数进行t检验~若接受则进行对只含截距项的方程进行检验~若接受~则对一阶滞后项的系数参数进行t检验~若接受~则进行差分后再ADF检验,若拒绝~则序列为平稳序列。
2.当检验的数据是平稳的,即不存在单位根,~要想进一步考察变量的因果联系~可以采用格兰杰因果检验~但要做格兰杰检验的前提是数据必须是平稳的~否则不能做。
3.当检验的数据是非平稳,即存在单位根,~并且各个序列是同阶单整,协整检验的前提,~想进一步确定变量之间是否存在协整关系~可以进行协整检验~协整检验主要有EG两步法和JJ检验
(1)EG两步法是基于回归残差的检验~可以通过建立OLS模型检验其残差平稳性
(2)JJ检验是基于回归系数的检验~前提是建立VAR模型,即模型符合ADL模式,
4.当变量之间存在协整关系时~可以建立ECM进一步考察短期关系~Eviews这里还提供了一个Wald,Granger检验~但此时的格兰杰已经不是因果关系检验~而是变量外生性检验~请注意识别
5.格兰杰检验只能用于平稳序列:
这是格兰杰检验的前提~而其因果关系并非我们通常理解的因与果的关系~而是说x的前期变化能有效地解释y的变化~所以称其为“格兰杰原因”。
非平稳序列很可能出现伪回归~协整的意义就是检验它们的回归方程所描述的6.
因果关系是否是伪回归~即检验变量之间是否存在稳定的关系。
所以~非平稳序列的因果关系检验就是协整检验。
7.平稳性检验有3个作用:
(1)检验平稳性~若平稳~做格兰杰检验~非平稳~作协正检验。
(2)协整检验中要用到每个序列的单整阶数。
(3)判断时间学列的数据生成过程。
8.其实很多人存在误解。
有如下几点~需要澄清:
(1)格兰杰因果检验是检验统计上的时间先后顺序~并不表示而这真正存在因果关系~是否呈因果关系需要根据理论、经验和模型来判定。
(2)格兰杰因果检验的变量应是平稳的~如果单位根检验发现两个变量是不稳定的~那么~不能直接进行格兰杰因果检验~所以~很多人对不平稳的变量进行格兰杰因果检验~这是错误的。
(3)协整结果仅表示变量间存在长期均衡关系~那么~到底是先做格兰杰还是先做协整呢,因为变量不平稳才需要协整~所以~首先因对变量进行差分~平稳后~可以用差分项进行格兰杰因果检验~来判定变量变化的先后时序~之后~进行协整~看变量是否存在长期均衡。
(4)长期均衡并不意味着分析的结束~还应考虑短期波动~要做误差修正检验。
在变量均非平稳但协整的情况下则可以建立误差修正模型(ErrorCorrectionModel,ECM)
来研究变量间的关系~由于误差修正项的出现~ECM可以同时研究短期与长期的因果关系。
(5)当变量之间存在协整关系时~可以建立ECM进一步考察短期关系~Eviews里提供了一个Wald,Granger检验~但这个格兰杰已经不是因果关系检验~而是变量外生性检验~一定要区分开。
向量自回归,VAR,VectorAutoregression,常用于预测相互联系的时间序列系统以及分析随机扰动对变量系统的动态影响。
VAR方法通过把系统中每一个内生变量,作为系统中所有内生变量的滞后值的函数来构造模型~从而回避了结构化模型的要求。
Engle和Granger,1987a,指出两个或多个非平稳时间序列的线性组合可能是平稳的。
假如这样一种平稳的或的线性组合存在~这些非平稳,有单位根,时间序列之间被认为是具有协整关系的。
这种平稳的线性组合被称为协整方程且可被解释为变量之间的长期均衡关系。
VAR模型对于相互联系的时间序列变量系统是有效的预测模型~同时~向量自回归模型也被频繁地用于分析不同类型的随机误差项对系统变量的动态影响。
如果变量之间不仅存在滞后影响~而不存在同期影响关系~则适合建立VAR模型~因为VAR模型实际上是把当期关系隐含到了随机扰动项之中。
注意点:
1、单位根检验是序列的平稳性检验~如果不检验序列的平稳性直接OLS容易导致伪回归。
2、当检验的数据是平稳的,即不存在单位根,~要想进一步考察变量的因果联系~可以采用格兰杰因果检验~但要做格兰杰检验的前提是数据必须是平稳的~否则不能做。
3、当检验的数据是非平稳,即存在单位根,~并且各个序列是同阶单整,协整检验的前提,~想进一步确定变量之间是否存在协整关系~可以进行协整检验~协整检验主要有EG两步法和JJ检验
A、EG两步法是基于回归残差的检验~可以通过建立OLS模型检验其残差平稳性
B、JJ检验是基于回归系数的检验~前提是建立VAR模型,即模型符合ADL模式,
4、当变量之间存在协整关系时~可以建立ECM进一步考察短期关系~Eviews这里还提供了一个Wald,Granger检验~但此时的格兰杰已经不是因果关系检验~而是变量外生性检验~请注意识别。
5、格兰杰检验只能用于平稳序列:
这是格兰杰检验的前提~而其因果关系并非我们通常理解的因与果的关系~而是说x的前期变化能有效地解释y的变化~所以称其为“格兰杰原因”。
6、非平稳序列很可能出现伪回归~协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归~即检验变量之间是否存在稳定的关系。
所以~非平稳序列的因果关系检验就是协整检验。
7、平稳性检验有3个作用:
1,检验平稳性~若平稳~做格兰杰检验~非平稳~作协正检验。
2,协整检验中要用到每个序列的单整阶数。
3,判断时间学列的数据生成过程。
ADF检验:
1view---unitroottest,出现对话框~默认的选项为变量的原阶序列检验平稳性~确认后~若ADF检验的P值小于0.5~拒绝原假设~说明序列是平稳的~若P值大于0.5~接受原假设~说明序列是非平稳的,2重复刚才的步骤~view---unit
roottest,出现对话框~选择1stdifference,即对变量的一阶差分序列做平稳性检验~和第一步中的检验标准相同~若P值小于0.5~说明是一阶平稳~若P值大于0.5~则继续进行二阶差分序列的平稳性检验。
先做单位根检验~看变量序列是否平稳序列~若平稳~可构造回归模型等经典计量经济学模型,若非平稳~进行差分~当进行到第i次差分时序列平稳~则服从i阶单整,注意趋势、截距不同情况选择~根据P值和原假设判定,。
若所有检验序列均服从同阶单整~可构造VAR模型~做协整检验,注意滞后期的选择,~判断模型内部变量间是否存在协整关系~即是否存在长期均衡关系。
如果有~则可以构造VEC模型或者进行Granger因果检验~检验变量之间“谁引起谁变化”~即因果关系。
第一~格兰杰因果检验是检验统计上的时间先后顺序~并不表示而这真正存在因果关系~是否呈因果关系需要根据理论、经验和模型来判定。
第二~格兰杰因果检验的变量应是平稳的~如果单位根检验发现两个变量是不稳定的~那么~不能直接进行格兰杰因果检验~所以~很多人对不平稳的变量进行格兰杰因果检验~这是错误的。
第三~协整结果仅表示变量间存在长期均衡关系~那么~到底是先做格兰杰还是先做协整呢,因为变量不平稳才需要协整~所以~首先因对变量进行差分~平稳后~可以用差分项进行格兰杰因果检验~来判定变量变化的先后时序~之后~进行协整~看变量是否存在长期均衡。
第四~长期均衡并不意味着分析的结束~还应考虑短期波动~要做误差修正检验。
8.单位根检验是检验数据的平稳性~或是说单整阶数。
9.协整是说两个或多个变量之间具有长期的稳定关系。
但变量间协整的必要条件是它们之间是同阶单整~也就是说在进行协整检验之前必须进行单位跟检验。
10.协整说的是变量之间存在长期的稳定关系~这只是从数量上得到的结论~但不能确定谁是因~谁是果。
而因果关系检验解决的就是这个问题。
单位根检验是检验时间序列是否平稳~协整是在时间序列平稳性的基础上做长期趋势的分析~而格兰杰检验一般是在建立误差修正模型的后~所建立的短期的因果关系。
故顺序自然是先做单位根检验~再过协整检验~最后是格兰杰因果检验。
单位根检验是对时间序列平稳性的检验~只有平稳的时间序列~才能进行计量分析~否则会出现伪回归现象,协整是考察两个或者多个变量之间的长期平稳关系~考察两者的协整检验通常采用恩格尔-格兰杰检验~两者以上则用Johansen检验,格兰杰因果检验是考察变量之间的因果关系~协整说明长期稳定关系不一定是因果关系~所以需要在通过格兰杰因果检验确定两者的因果关系。
顺序一般是单位根检验~通过后如果同阶单整~在进行协整~然后在进行因果检验。
要特别注意的是:
只有同阶单整才能进行协整。
11.VAR建模时lagintervalsforendogenous要填滞后期~但是此时你并不能判断哪个滞后时最优的~因此要试~选择不同的滞后期~至AIC或SC最小时~所对应着的滞后为最优滞后~此时做出来的VAR模型才较为可靠。
12.做协整检验前作VAR的原因是~协整检验是对滞后期和检验形式非常敏感的检验~首先需要确定最优滞后。
由于VAR是无约束的~而协整是有约束的~因此协整检验的最优滞后一般为VAR的最优滞后减去1~确定了最优滞后后~再去诊断检验形式~最终才能做协整。
13.当确定了协整的个数后~往下看~有个标准化的结果~这个结果就是协整方程~由于在结果中各变量均在方程一侧~因此如果系数为正~则说明是负向关系~反之亦然。
14.协整表示变量间的长期均衡关系~貌似与你的OLS不矛盾。
1,如检验不协整~说明没长期稳定关第~可以做VAR模型~但是模型建立后要做
稳定性分析:
做AR根的图表分析~如所有单位根小于1~说明VAR模型定~满足脉冲分析及方差分解所需条件之一
模型的因果关系检验2不过注意在做因果检验前要先确定滞后长度~方法见高铁梅计量分析方法与建模第2版P302只有满足因果关系~加上满足条件一:
稳定性~则可进行脉冲及方差分解
如不满足因果关系~则所有不满足因果关系的变量将视为外生变量~至此要重新构建VAR模型~新的VAR模型将要引入外生变量的VAR模型
2,VAR与VEC关系是:
VEC是有协整约束,即有长期稳定关系,的VAR模型~多用于具有协整关系的非平稳时间序列建模高铁梅计理分析方法与建模第2版P295
15(简单说VAR模型建立时
第一步:
不问序列如何均可建立初步的VAR模型,建立过程中数据可能前平稳序列~也可能是部分平稳~还可能是没协整关系的同阶不平稳序列~也可能是不同阶的不平稳序列~滞后阶数任意指定。
所有序列一般视为内生向量)~
第二步:
在建立的初步VAR后进行
1滞后阶数检验~以确定最终模型的滞后阶数
2在滞后阶数确定后进行因果关系检验~以确定哪些序列为外生变量
至此重新构建VAR模型,此时滞后阶数已定~内外生变量已定,~再进行AR根图表分析~
如单位根均小于1~VAR构建完成可进行脉冲及方差分解
如单位根有大于1的~考虑对原始序进行降阶处理,一阶单整序列处理方法:
差分或取对数~二阶单整序列:
理论上可以差分与取对数同时进行~但由于序列失去了经济含义~应放弃此处理~可考虑序列的趋势分解~如分解后仍然不能满足要求~可以罢工~不建立任何模型~休息或是打砸了电脑,~处理过后对新的序列,包括最初的哪些平稳序列,不断重复第一步与第二步~直至满足稳定性为止
第三步,建立最终的VAR后,可考虑SVAR模型
如果变量不仅存在滞后影响,还存在同期影响关系,则建立VAR模型不太合适,这种情况下需要进行结构分析。
误差修正模型,ErrorCorrectionModel~ECM,
向量误差修正模型,VEC,VectorErrorCorrection,,是一个有约束的VAR模型~并在解释变量中含有协整约束~因此它适用于已知有协整关系的非平稳序列。
当有一个大范围的短期动态波动时~VEC表达式会限制内生变量的长期行为收敛于它们的协整关系。
因为一系列的部分短期调整可以修正长期均衡的偏离~所以协整项被称为是误差修正项。
误差修正项反映了长期均衡对短期波动偏离自我修正的动态机制。
理论上~误差修正项应为负值~表示当失衡时~时间序列应收敛并回归长期均衡~绝对值越大则队本
期误差修正作用与越强。
如果为正~则表示前期的失衡部分无法在后一期作反向回归调整。
应用可参考文献:
常海滨、徐成贤:
我国货币政策传导机制区域差异的实证分析~经济科学~2007年第5期
1.误差修正模型的产生原因
对于非稳定时间序列~可通过差分的方法将其化为稳定序列~然后才可建立经典的回归分析模型
如:
建立人均消费水平,Y,与人均可支配收入,X,之间的回归模型:
Y=α+αX+μt01tt
如果Y与X具有共同的向上或向下的变化趋势,进行差分~X,Y成为平稳序列~建立差分回归模型得:
ΔY=αΔX+v式中~v=μ-μt1ttttt-1
然而~这种做法会引起两个问题:
(1)如果X与Y间存在着长期稳定的均衡关系Y=α+αX+μ且误差项μ不存在序列相关~则差分式ΔY=αΔX+vt01tttt1tt中的v是一个一阶移动平均时间序列~因而是序列相关的,
(2)如果采用差分形式进行t
估计~则关于变量水平值的重要信息将被忽略~这时模型只表达了X与Y间的短期关系~而没有揭示它们间的长期关系。
因为~从长期均衡的观点看~Y在第t期的变化不仅取决于X本身的变化~还取决于X与Y在t-1期末的状态~尤其是X与Y在t-1期的不平衡程度。
另外~使用差分变量也往往会得出不能令人满意回归方程。
例如~使用ΔY=ΔX+v回归时~很少出现截距项显著为零的情况~即我们常常会1tt
得到如下形式的方程:
式中~,*,
在X保持不变时~如果模型存在静态均衡,staticequilibrium,~Y也会保持它的长期均衡值不变。
但如果使用,*,式~即使X保持不变~Y也会处于长期上升或下降的过程中~这意味着X与Y间不存在静态均衡。
这与大多数具有静态均衡的经济理论假说不相符。
可见~简单差分不一定能解决非平稳时间序列所遇到的全部问题~因此~误差修正模型便应运而生。
2.误差修正模型的简单原理,ErrorCorrectionModel~简记为ECM,
误差修正模型,ErrorCorrectionModel~简记为ECM,是一种具有特定形式的计量经济学模型~为了便于理解~我们通过一个具体的模型来介绍它的结构。
假设两变量X与Y的长期均衡关系为:
Y=α+αX+μt01tt
由于现实经济中X与Y很少处在均衡点上~因此实际观测到的只是X与Y间的短期的或非均衡的关系~假设具有如下(1,1)阶分布滞后形式
该模型显示出第t期的Y值~不仅与X的变化有关~而且与t-1期X与Y的状态值有关。
由于变量可能是非平稳的~因此不能直接运用OLS法。
对上述分布滞后模型适当变形得:
(**),式中~λ=1-μ~
~
如果将,**,中的参数~与Y=α+αX+μ中的相应参数视为相等~则,**,t01tt
式中括号内的项就是t-1期的非均衡误差项。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面板 数据 格兰杰 因果关系 向量 回归 误差 修正 模型
![提示](https://static.bdocx.com/images/bang_tan.gif)