第1章回归分析.docx
- 文档编号:23860715
- 上传时间:2023-05-21
- 格式:DOCX
- 页数:22
- 大小:198.87KB
第1章回归分析.docx
《第1章回归分析.docx》由会员分享,可在线阅读,更多相关《第1章回归分析.docx(22页珍藏版)》请在冰豆网上搜索。
第1章回归分析
§1 回归分析
1.1 回归分析
1.2 相关系数
1.3 可线性化的回归分析
1.了解回归分析的思想和方法.(重点)
2.掌握相关系数的计算和判断线性相关的方法.(重点)
3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)
[基础·初探]
教材整理1 回归分析
阅读教材P3~P6“练习”以上部分,完成下列问题.
设变量y对x的线性回归方程为y=a+bx,由最小二乘法知系数的计算公式为:
b=
=
=
,a=
-b
.
某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时,销售额为( )【导学号:
********】
A.63.6万元 B.65.5万元
C.67.7万元D.72.0万元
【解析】
=
=3.5,
=
=42,∴a=
-b
=42-9.4×3.5=9.1,
∴回归方程为y=9.4x+9.1,
∴当x=6时,y=9.4×6+9.1=65.5,故选B.
【答案】 B
教材整理2 相关系数
阅读教材P6“练习”以下至P9“练习”以上部分,完成下列问题.
1.相关系数r的计算
假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数
r=
=
=
.
2.相关系数r与线性相关程度的关系
(1)r的取值范围为[-1,1];
(2)|r|值越大,误差Q越小,变量之间的线性相关程度越高;
(3)|r|值越接近0,误差Q越大,变量之间的线性相关程度越低.
3.相关性的分类
(1)当r>0时,两个变量正相关;
(2)当r<0时,两个变量负相关;
(3)当r=0时,两个变量线性不相关.
判断(正确的打“√”,错误的打“×”)
(1)两个变量的相关系数r>0,则两个变量正相关.( )
(2)两个变量的相关系数越大,它们的相关程度越强.( )
(3)若两个变量负相关,那么其回归直线的斜率为负.( )
【答案】
(1)√
(2)× (3)√
教材整理3 可线性化的回归分析
阅读教材P9~P13“练习”以上部分,完成下列问题.
1.非线性回归分析
对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.
2.非线性回归方程
曲线
方程
曲线图形
变换
公式
变换后的
线性函数
y=axb
(a=1,b>0) (a=1,b<0)
c=lna
v=lnx
u=lny
u=c+bv
y=aebx
(a>0,b>0) (a>0,b<0)
c=lna
u=lny
u=c+bx
曲线
方程
曲线图形
变换
公式
变换后的
线性函数
y=ae
(a>0,b>0) (a>0,b<0)
c=lna
v=
u=lny
u=c+bv
y=a+
blnx
(b>0) (b<0)
v=lnx
u=y
u=a+bv
下列数据x,y符合哪一种函数模型( )
x
1
2
3
4
5
6
7
8
9
10
y
2
2.69
3
3.38
3.6
3.8
4
4.08
4.2
4.3
A.y=2+
x B.y=2ex
C.y=2e
D.y=2+lnx
【解析】 分别将x的值代入解析式判断知满足y=2+lnx.
【答案】 D
[质疑·手记]
预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:
疑问1:
___________________________________________
解惑:
_____________________________________________________
疑问2:
_____________________________________________________
解惑:
_____________________________________________________
疑问3:
_____________________________________________________
解惑:
___________________________________________
[小组合作型]
变量间的相关关系及判定
(1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图111①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图111②.由这两个散点图可以判断( )
图111
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
(2)两个变量x,y与其线性相关系数r有下列说法:
①若r>0,则x增大时,y也随之相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有( )
A.①② B.②③
C.①③D.①②③
(3)有五组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是( )
A.①③B.②④
C.②⑤D.④⑤
【精彩点拨】 可借助于线性相关概念及性质作出判断.
【自主解答】
(1)由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.
(2)根据两个变量的相关性与其相关系数r之间的关系知,①③正确,②错误,故选C.
(3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C.
【答案】
(1)C
(2)C (3)C
1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.
2.利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若r>0.75,则线性相关较为显著,否则为不显著.
[再练一题]
1.下列两变量中具有相关关系的是( )
A.正方体的体积与边长
B.人的身高与体重
C.匀速行驶车辆的行驶距离与时间
D.球的半径与体积
【解析】 选项A中正方体的体积为边长的立方,有固定的函数关系;选项C中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D中球的体积是
π与半径的立方相乘,有固定函数关系.只有选项B中人的身高与体重具有相关关系.
【答案】 B
求线性回归方程
某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
月平均
气温x(℃)
17
13
8
2
月销售
量y(件)
24
33
40
55
(1)算出线性回归方程y=bx+a(a,b精确到0.1);
(2)气象部门预测下个月的平均气温约为6℃,据此估计该商场下个月毛衣的销售量.
【精彩点拨】
(1)可利用公式求解;
(2)把月平均气温代入回归方程求解.
【自主解答】
(1)由散点图易判断y与x具有线性相关关系.
=(17+13+8+2)÷4=10,
=(24+33+40+55)÷4=38,
xiyi=17×24+13×33+8×40+2×55=1267,
x
=526,
b=
=
≈-2.01,
a=
-b
≈38-(-2.01)×10=58.1,
所以线性回归方程为y=-2.01x+58.1.
(2)气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量为y=-2.01x+58.1=-2.01×6+58.1≈46(件).
1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在做回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.
2.利用回归直线,我们可以进行预测.若回归直线方程y=a+bx,则x=x0处的估计值为y0=a+bx0.
3.线性回归方程中的截距a和斜率b都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.
4.回归直线必过样本点的中心点.
[再练一题]
2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得到下表数据:
x
6
8
10
12
y
2
3
5
6
(1)请画出上表数据的散点图(要求:
点要描粗);
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.【导学号:
67720001】
【解】
(1)如图:
(2)
xiyi=6×2+8×3+10×5+12×6=158,
=
=9,
=
=4,
x
=62+82+102+122=344,
b=
=
=0.7,
a=
-b
=4-0.7×9=-2.3,
故线性回归方程为y=0.7x-2.3.
(3)由
(2)中线性回归方程知当x=9时,y=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.
[探究共研型]
可线性化的回归分析
探究1 如何解答非线性回归问题?
【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:
探究2 已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?
x
1
2
3
y
3
5.99
12.01
①y=3×2x-1;②y=log2x;
③y=4x;④y=x2.
【提示】 观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.所以模拟效果最好的为①.
某地区不同身高的未成年男性的体重平均值如下表:
身高x(cm)
60
70
80
90
100
110
体重y(kg)
6.13
7.90
9.99
12.15
15.02
17.50
身高x(cm)
120
130
140
150
160
170
体重y(kg)
20.92
26.86
31.11
38.85
47.25
55.05
(1)试建立y与x之间的回归方程;
(2)如果一名在校男生身高为168cm,预测他的体重约为多少?
【精彩点拨】 先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.
【自主解答】
(1)根据表中的数据画出散点图,如下:
由图看出,这些点分布在某条指数型函数曲线y=c1ec2x的周围,于是令z=lny,列表如下:
x
60
70
80
90
100
110
z
1.81
2.07
2.30
2.50
2.71
2.86
x
120
130
140
150
160
170
z
3.04
3.29
3.44
3.66
3.86
4.01
作出散点图,如下:
由表中数据可求得z与x之间的回归直线方程为z=0.693+0.020x,则有y=e0.693+0.020x.
(2)由
(1)知,当x=168时,y=e0.693+0.020×168≈57.57,所以在校男生身高为168cm,预测他的体重约为57.57kg.
两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.
[再练一题]
3.在一次抽样调查中测得样本的5个样本点,数据如下表:
x
0.25
0.5
1
2
4
y
16
12
5
2
1
试建立y与x之间的回归方程.
【解】 作出变量y与x之间的散点图如图所示.
由图可知变量y与x近似地呈反比例函数关系.
设y=
,令t=
,则y=kt.由y与x的数据表可得y与t的数据表:
t
4
2
1
0.5
0.25
y
16
12
5
2
1
作出y与t的散点图如图所示.
由图可知y与t呈近似的线性相关关系.
又
=1.55,
=7.2,
iyi=94.25,
=21.3125,
b=
=
≈4.1344,
a=
-b
=7.2-4.1344×1.55≈0.8,
∴y=4.1344t+0.8.
所以y与x的回归方程是y=
+0.8.
[构建·体系]
1.下列结论正确的是( )
①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
A.①② B.①②③
C.①②④D.①②③④
【解析】 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.
【答案】 C
2.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点( )
x
1
2
3
4
y
1
3
5
7
A.(2,3) B.(1.5,4)
C.(2.5,4)D.(2.5,5)
【解析】 线性回归方程必过样本点的中心(
,
),
即(2.5,4),故选C.
【答案】 C
3.对具有线性相关关系的变量x和y,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.
【解析】 由题意知
=2,
=3,b=6.5,所以a=
-b
=3-6.5×2=-10,即回归直线的方程为y=6.5x-10.
【答案】 y=6.5x-10
4.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:
百万元):
固定资
产价值
3
3
5
6
6
7
8
9
9
10
工业增
加值
15
17
25
28
30
36
37
42
40
45
根据上表资料计算的相关系数为________.
【解析】
=
=6.6.
=
=31.5.
所以r=
≈0.9918.
【答案】 0.9918
5.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程y=bt+a;
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
附:
回归方程y=bt+a中,
b=
,a=
-b
.
【解】
(1)列表计算如下:
i
ti
yi
t
tiyi
1
2
3
4
5
1
2
3
4
5
5
6
7
8
10
1
4
9
16
25
5
12
21
32
50
∑
15
36
55
120
这里n=5,
=
i=
=3,
=
i=
=7.2.
又ltt=
-n
2=55-5×32=10,
lty=
iyi-n
=120-5×3×7.2=12,
从而b=
=
=1.2,
a=
-b
=7.2-1.2×3=3.6,
故所求回归方程为y=1.2t+3.6.
(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y=1.2×6+3.6=10.8(千亿元).
我还有这些不足:
(1)______________________________________________________
(2)______________________________________________________
我的课下提升方案:
(1)______________________________________________________
(2)____________________________________________
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 章回 分析