1、异方差案例分析异方差案例分析中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入除从事农业经营收入外,还包括从事其他产业经营性收入以及工资性收入、财产收入和转移支付收入等。为了考察从事农业经营收入和其他收入对中国农村居民消费支出增长影响,可使用如下双对数模型:其中,Y表示农村家庭人均消费支出,X1表示从事农业经营收入,X2表示其他收入。下表列出了中国2001年各地区农村居民家庭人均纯收入及消费支出相关数据。中国2001年各地区农村居民家庭人均纯收入及消费支出 单位:元地区人均消费支出Y从事农业经营收入X1其他收入X2地区人均消费支出Y从事农业经营收入X1其他收入X2北京3552.15
2、79.14446.4湖北1649.213521000.1天津2050.91314.62633.1湖南1990.3908.21391.3河北1429.8928.81674.8广东2703.361242.92526.9山西1221.6609.81346.2广西1550.621068.8875.6内蒙古1554.61492.8480.5海南1357.431386.7839.8辽宁1786.31254.31303.6重庆1475.16883.21088吉林1661.71634.6547.6四川1497.52919.31067.7黑龙江1604.51684.1596.2贵州1098.39764647.8
3、上海4753.2652.55218.4云南1336.25889.4644.3江苏2374.71177.62607.2西藏1123.71589.6814.4浙江3479.2985.83596.6陕西1331.03614.8876安徽1412.41013.11006.9甘肃1127.37621.6887福建2503.110532327.7青海1330.45803.8753.5江西17201027.81203.8宁夏1388.79859.6963.4山东190512931511.6新疆1350.231300.1410.3河南1375.61083.81014.1资料来源:中国农村住户调查年鉴(2002
4、)、中国统计年鉴(2002)。我们不妨假设该线性回归模型满足基本假定,采用OLS估计法,估计结果如下: (1.87) (3.02) (10.04) R2=0.7831 2=0.7676 D.W.=1.89 F=50.53 RSS=0.8232图1估计结果显示,其他收入而不是从事农业经营收入增长,对农户消费支出增长更具有刺激作用。下面对该模型进行异方差性检验。1.图示法。首先做出Y及X1、X2散点图,如下: 图2可见基本在其均值附近上下波动,而散点存在较为明显增大趋势。再做残差平方项及、散点图:图3图4可见图1中离群点相对较少而图2呈现较为明显单调递增异方差性。故初步判断异方差性主要是引起。2.
5、G-Q检验根据上述分析,首先将原始数据按X2升序排序,去掉中间7个数据,得到两个容量为12子样本,记数据较小样本为子样本1,数据较大为子样本2。对子样本1进行OLS回归,结果如下:图5得到子样本1残差平方和RSS1=0.064806;再对子样本2进行OLS回归,结果如下:图6得到子样本2残差平方和RSS2=0.279145。计算F统计量: 在5%显著水平下,F0.05(9,9)=3.18 F,故应拒绝同方差假设,表明该总体随机干扰项存在单调递增异方差。3.white检验记原模型残差平方项为,将其及X1,X2及其平方项及交叉项做辅助回归,结果如下:图7由各参数t值可见各项都不是很显著,而且可决系
6、数值也比较小,但white统计量nR2=310.464=14.38该值大于5%显著水平下自由度为5分布相应临界值=11.07,因此应拒绝同方差假设。去掉交叉项后辅助回归结果如下:图8显然,X2和X2平方项参数t检验是显著,并且white统计量nR2=310.437376=11.58656大于5%显著水平下自由度为5分布相应临界值=11.07,因此应拒绝同方差假设。4异方差修正加权最小二乘法我们以1/X2为权重进行异方差修正。加权后估计结果如下:图9可见修正后各解释变量显著性总体相对提高。其white检验结果如下:图10此时white统计量nR2=310.023325=0.723小于5%显著水平下自由度为5分布相应临界值=11.07,故此时满足同方差假设。故修正后估计结果为: