Stata软件之回归分析.ppt
- 文档编号:171390
- 上传时间:2022-10-05
- 格式:PPT
- 页数:39
- 大小:586KB
Stata软件之回归分析.ppt
《Stata软件之回归分析.ppt》由会员分享,可在线阅读,更多相关《Stata软件之回归分析.ppt(39页珍藏版)》请在冰豆网上搜索。
内容概要,一、实验目的二、简单回归分析的Stata基本命令三、简单回归分析的Stata软件操作实例四、多元回归分析的Stata基本命令五、多元回归分析的Stata软件操作实例,一、实验目的:
掌握运用Stata软件进行简单回归分析以及多元回归分析的操作方法和步骤,并能看懂Stata软件运行结果。
二、简单回归分析的Stata基本命令,简单线性回归模型(simplelinearregressionmodel)指只有一个解释变量的回归模型。
如:
其中,y为被解释变量,x为解释变量,u为随机误差项,表示除x之外影响y的因素;称为斜率参数或斜率系数,称为截距参数或截距系数,也称为截距项或常数项。
简单线性回归模型的一种特殊情况:
即假定截距系数时,该模型被称为过原点回归;过原点回归在实际中有一定的应用,但除非有非常明确的理论分析表明,否则不宜轻易使用过原点回归模型。
二、简单回归分析的Stata基本命令,regressyx以y为被解释变量,x为解释变量进行普通最小二乘(OLS)回归。
regress命令可简写为横线上方的三个字母reg。
regressyx,noconstanty对x的回归,不包含截距项(constant),即过原点回归。
predictz根据最近的回归生成一个新变量z,其值等于每一个观测的拟合值(即)。
predictu,residual根据最近的回归生成一个新变量u,其值等于每一个观测的残差(即)。
三、简单回归分析的Stata软件操作实例,实验1简单回归分析:
教育对工资的影响劳动经济学中经常讨论的一个问题是劳动者工资的决定。
不难想象,决定工资的因素有很多,例如能力、性别、工作经验、教育水平、行业、职业等。
在这里仅考虑其中一种因素:
教育水平,建立如下计量模型:
其中,wage为被解释变量,表示小时工资,单位为元;edu为解释变量,表示受教育年限,即个人接受教育的年数,单位为年;u为随机误差项。
假定模型(3.1)满足简单回归模型的全部5条基本假定,这样的OLS估计量将是最佳线性无偏估计量。
请根据表S-2中给出的数据采用Stata软件完成上述模型的估计等工作。
三、简单回归分析的Stata软件操作实例,1、打开数据文件。
直接双击“工资方程1.dta”文件;或者点击Stata窗口工具栏最左侧的Open键,然后选择“工资方程1.dta”即可;或者先复制Excel表S-2中的数据,再点击Stata窗口工具栏右起第4个DataEditor键,将数据粘贴到打开的数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左起第二个Save键保存数据,保存时需要给数据文件命名。
2、给出数据的简要描述。
使用describe命令,简写为:
des得到以下运行结果;,三、简单回归分析的Stata软件操作实例,结果显示“工资方程1.dta”数据文件包含1225个样本和11个变量;11个变量的定义及说明见第3列。
三、简单回归分析的Stata软件操作实例,3、变量的描述性统计分析。
对于定量变量,使用summarize命令:
suageeduexpexpsqwagelnwage,得到以下运行结果,保存该运行结果;第1列:
变量名;第2列:
观测数;第3列:
均值;第4列:
标准差;第5列:
最小值;第6列:
最大值。
三、简单回归分析的Stata软件操作实例,4、wage对edu的OLS回归。
使用regress命令:
regwageedu,得到以下运行结果,保存该运行结果;
(1)表下方区域为基本的回归结果。
第1列依次为被解释变量wage,解释变量edu,截距项constant;第2列回归系数的OLS估计值;第3列回归系数的标准误;第4列回归系数的t统计量值;写出样本回归方程为:
即如果受教育年限增加1年,平均来说小时工资会增加0.39元。
三、简单回归分析的Stata软件操作实例,
(2)表左上方区域为方差分析表。
第2列从上到下依次为回归平方和(SSE)、残差平方和(SSR)和总离差平方和(SST);第3列为自由度,分别为k=1,n-k-1=1225-1-1=1223,n-1=1225-1=1224;第4列为均方和(MSS),由各项平方和除以相应的自由度得到。
(3)表右上方区域给出了样本数(Numberofobs)、判定系数(R-squared)、调整的判定系数(AdjR-squared)、F统计量的值、回归方程标准误或均方根误(RootMSE,或S.E.)以及其他一些统计量的信息。
上述回归分析的菜单操作实现:
StatisticsLinearmodelsandrelatedLinearregression弹出对话框,在DependentVariable选项框中选择或键入wage,在IndependentVariables选项框中选择或键入edu点击OK即可,三、简单回归分析的Stata软件操作实例,5、生成新变量z为上一个回归的拟合值,生成新变量u为上一个回归的残差;然后根据u对数据进行从小到大的排序,并列出u最小的5个观测。
命令如下:
predictz(生成拟合值)predictu,residual(生成残差)sortu(根据u对数据从小到大排序)listwagezuin1/5(列出u最小的5个观测值以及对应的实际样本观测值和拟合值)即对于观测1,小时工资的实际观测值(wage)为2.46,拟合值(z)为9.10,残差(u)为-6.64。
三、简单回归分析的Stata软件操作实例,6、画出以wage为纵轴,以edu为横轴的散点图,并加入样本回归线。
命令如下:
graphtwowaylfitwageedu|scatterwageedu得到以下运行结果,保存该运行结果;,三、简单回归分析的Stata软件操作实例,7、wage对edu的OLS回归,只使用年龄小于或等于30岁的样本。
命令如下:
regwageeduifage=30得到以下运行结果,保存该运行结果;写出样本回归方程为:
对于年龄在30岁及以下的劳动者,增加1年受教育年限使得工资会增加0.41元,略高于针对全体样本的估计值。
三、简单回归分析的Stata软件操作实例,8、wage对edu的OLS回归,不包含截距项,即过原点回归。
命令如下:
regwageedu,noconstant得到以下运行结果,保存该运行结果;,三、简单回归分析的Stata软件操作实例,9、取半对数模型。
模型(3.1)假定增加1年受教育年限带来相同数量的工资增长;但美国经济学家明瑟(J.Mincer)等人的研究表明,更合理的情况是增加1年受教育年限导致相同百分比的工资增长。
这就需要使用半对数模型(对数-水平模型),即:
其中lnwage是小时工资的自然对数;斜率系数的经济含义是:
增加1年受教育年限导致收入增长,该百分比值一般称为教育收益率或教育回报率(therateofreturntoeducation)做lnwage对edu的回归,命令如下:
reglnwageedu得到以下运行结果,保存该运行结果(见下页);,三、简单回归分析的Stata软件操作实例,写出样本回归方程为:
结果表明教育收益率的估计值为5.03%,即平均而言,增加1年受教育年限使得工资增长5.03%。
三、简单回归分析的Stata软件操作实例,10、最后可建立do文件把前面所执行过的命令保存下来。
在do文件的编辑窗口中(点击Stata窗口工具栏右起第5个NewDo-键即打开Stata的do文件编辑窗口)键入如下命令和注释,并保存为“工资方程1.do”文件。
该文件的内容为:
use“D:
讲课资料周蓓的上课资料数据【重要】【计量经济学软件应用课件】10649289stata10工资方程1.dta“,clear/打开数据文件des/数据的简要描述suageeduexpexpsqwagelnwage/定量变量的描述性统计regwageedu/简单线性模型的OLS估计graphtwowaylfitwageedu|scatterwageedu/作图regwageeduifage=30/只使用年龄小于或等于30岁的样本进行OLS估计regwageedu,noconstant/过原点回归reglnwageedu/对数-水平模型,三、简单回归分析的Stata软件操作实例,实验2简单回归分析:
学校投入对学生成绩的影响表S-3记录了一些学校某个年份高一学生的平均成绩及有关学校的其他一些信息。
本实验主要考察学校的生均支出(expend)对学生数学平均成绩(math)的影响;生均支出代表了学校的经费投入水平,从理论上说,在其他条件不变的情况下,学生在生均支出越高的学校中能够获得更好的教学资源(包括更优秀的师资、更好的硬件设备等),从而学习成绩也应该越高。
请根据表S-3中给出的数据采用Stata软件完成相关模型的估计等工作。
1、打开数据文件。
双击“学校投入与学生成绩.dta”文件,或点击Stata窗口工具栏Open键选择“学校投入与学生成绩.dta”即可;或复制Excel表S-3中的数据后点击Stata窗口工具栏DataEditor键,将数据粘贴到数据编辑窗口中,关闭该窗口,点击工具栏Save键保存数据,保存时要给数据文件命名。
三、简单回归分析的Stata软件操作实例,2、假定生均支出(expend)与影响学生数学成绩的其他因素不相关,建立如下四个简单回归模型:
水平-水平模型:
水平-对数模型:
对数-水平模型:
对数-对数模型(常弹性模型):
水平-水平模型的命令及运行结果如下:
regmathexpend估计结果表明:
学校生均支出增加1千元,使得学生数学平均成绩将提高2.46分;,三、简单回归分析的Stata软件操作实例,水平-对数模型的命令及运行结果如下:
regmathlnexpend估计结果:
即学校生均支出增加1%,使得学生数学平均成绩将提高0.11分;,三、简单回归分析的Stata软件操作实例,对数-水平模型的命令及运行结果如下:
reglnmathexpend估计结果:
即学校生均支出增加1千元,使得学生数学平均成绩将提高7%;,三、简单回归分析的Stata软件操作实例,对数-对数模型的命令及运行结果如下:
reglnmathlnexpend估计结果:
即学校生均支出增加1%,使得学生数学平均成绩将提高0.32%;,四、多元回归分析的Stata基本命令,对于多元线性回归模型:
regressyx1x2xk以y为被解释变量,x1,x2,xk为解释变量进行普通最小二乘(OLS)回归。
regress命令可简写为reg;regressyx1x2xk,noconstanty对x1,x2,xk的回归,不包含截距项,即过原点回归;testx1x2x3根据最近的回归进行F检验,原假设为:
test根据最近的回归进行F检验,原假设为:
五、多元回归分析的Stata软件操作实例,实验1多元回归分析:
工资方程利用数据文件“工资方程1.dta”建立工资方程考察影响小时工资(wage)的因素,重点关注受教育年限(edu)的系数,即教育收益率(即对数-水平模型的斜率系数)。
1、打开数据文件。
直接双击“工资方程1.dta”文件;或者点击Stata窗口工具栏最左侧的Open键,然后选择“工资方程1.dta”即可;2、简单回归分析。
首先建立简单回归模型(对数-水平模型):
命令及运行结果如下:
reglnwageedu,五、多元回归分析的Stata软件操作实例,回归结果表明:
如果不考虑其他因素的影响,教育收益率的估计值为5.03%,即平均而言,增加1年受教育年限使得工资增长5.03%。
五、多元回归分析的Stata软件操作实例,3、多元回归分析。
除了受教育年限(edu)之外,工作经验(exp)也是影响小时工资(wage)的重要因素。
从理论上分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Stata 软件 回归 分析