相关分析与回归分析.ppt
- 文档编号:711479
- 上传时间:2022-10-12
- 格式:PPT
- 页数:49
- 大小:2.04MB
相关分析与回归分析.ppt
《相关分析与回归分析.ppt》由会员分享,可在线阅读,更多相关《相关分析与回归分析.ppt(49页珍藏版)》请在冰豆网上搜索。
相关分析和回归分析,学习目标,掌握相关分析及回归分析的相关概念和思想;会计算相关系数;能解决一元回归分析的参数估计问题。
重难点,重点:
相关分析及回归分析的相关概念和思想一元线性回归分析最小二乘法难点:
回归系数的参数估计,利用相关与回归分析技术改进民航服务质量降低服务成本,引入,据网友爆料,4月11日上午浦东机场有旅客擅自闯入机场滑行道造成多架外航飞机堵在后面不能移动。
红圈中为浦东机场上的拦机者。
10家航空公司航班正点率与顾客投诉次数数据,相关分析,一、相关关系和函数关系,二、相关关系的种类,1.按照相关关系涉及的变量(或因素)的多少,可以分为单相关、复相关和偏相关。
2.按照变量之间相互关系的表现形式的不同,可以分为线性相关和非线性相关。
3.按照变量之间的相互关系的方向不同,可以分为正相关和负相关。
4.按照变量之间的相关程度、可以分为完全相关、不完全相关和不相关。
三、相关分析的主要内容,1.确定现象之间有无相关关系,以及相关关系的表现形式,2.确定相关关系的密切程度,常见的相关分析工具:
相关表相关图:
散点图相关系数,四、相关分析的测定,表8-5:
某企业劳动生产率与平均工资情况,相关表,相关图,相关图,完全正相关不完全正相关不相关,完全负相关不完全负相关曲线相关,相关系数,我们虽然可以通过相关表和相关图,定性给出两个变量之间相关关系,但是对于相关关系的具体的密切程度则无法度量,为此我们给出了相关系数,定量研究这两个变量之间的相关关系。
相关系数,X和Y之间的相关系数公式:
xy的协方差,x的标准差,y的标准差,xy的协方差,x的方差,y的方差,积差法,化简的公式:
相关系数的特点,相关系数的取值在-1与1之间。
|r|越大,表明变量间线性相关关系越强。
当r=0时,表明X与Y没有线性相关关系。
当00表明X与Y为正相关;若r0表明X与Y为负相关。
当|r|=1时,表明X与Y完全线性相关:
若r=1,称X与Y完全正线性相关;若r=-1,称X与Y完全负线性相关。
密切程度的判断,相关系数一般的判断标准是:
|r|0.3称为微弱相关;0.3|r|0.5称为低度相关;0.5|r|0.8称为显著相关;0.8|r|1称为高度相关;|r|=1称为完全相关。
相关系数分类图,例子:
P192表8-7,x:
全员劳动生产率y:
平均工资,答:
劳动生产率与平均工资之间存在着高度正线性相关。
练习题,下表给出了某局各企业固定资产价值和总产值的相关数据,请计算固定资产价值和总产值之间的关系。
例:
某局各企业固定资产和总产值统计表,解:
根据上表资料可得:
两者呈高度正相关。
使用相关系数的注意事项:
X和Y是相互对称的随机变量,所以相关系数只反映变量间的线性相关程度,不能说明非线性相关关系。
相关系数不能确定变量的因果关系,也不能说明相关关系具体接近于哪条直线。
线性回归,想一想,相关系数能确定变量的因果关系吗?
能说明相关关系具体接近于哪条直线吗?
答:
不能,为明确变量间联系的具体数量规律,需要进行回归分析。
只有两个变量的回归称为简单回归分析或者一元回归分析。
简单回归分析将变量X和Y区分为自变量和因变量。
一、“回归”的概念,回归的古典意义:
高尔顿遗传学的回归概念父母身高与子女身高的关系:
无论高个子或低个子的子女都有向人的平均身高回归的趋势,回归的现代意义,一个因变量对若干解释变量依存关系的研究回归的目的(实质):
由固定的自变量去估计因变量的平均值,二、一元线性回归模型,回归数学模型:
该模型表明当x取某个数值时,y并不必然表现为一个确定的值,而是在f(x)附近波动,但其平均数在大量观察下趋向于确定的值f(x)。
一元线性回归,真实值:
yi=a+bxi+i,预测值:
i=a+bxi,散点图,一元线性回归模型:
其中:
a为截距,b为直线斜率,也叫做y对x的回归系数。
它表示每变动一个单位所引起的的边际变动量;,i称残差(也称为回归误差或预测误差),表示除x外的其它次要因素形成的随机扰动。
当样本容量较大时,正负干扰可相互抵消,所以可认为i的均值为0。
回归分析的主要任务是:
1、确定回归系数a,b2、判断回归方程是否合理,回归系数的最小二乘估计,最小二乘法的基本思想:
想一想:
为什么不可以取i或|i|?
希望所估计的偏离实际观察值的残差越小越好。
可以取残差平方和作为衡量与偏离程度的指标。
即选择a、b使得,经过推导可得:
注:
一般先求b,再求a回归直线经过点ei与xi、yi之间无相关关系,x,y,【例8-5】根据例8-3资料:
则直线回归方程:
请解释一下回归系数a,b的经济学含义,练习题,以总产值y为因变量,固定资产价值x为自变量,建立回归直线方程y=a+bx。
请进行参数估计。
9.2.4估计标准误差(standarderroroftheestimate),因变量实际值与理论值离差的平均值,计算原理与能够反映平均数代表性大小的标准差基本相同,定义公式为:
计算公式:
=,S=,9.2.5判定系数(coefficientofdetermination),用表示,用来测定回归方程拟合数据的好坏程度,范围在0与1之间,越大,线性回归效果就越好,r越大,回归直线代表性大,r越小,回归直线代表性小,小,大,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关 分析 回归