统计学考研真题精选11.docx
- 文档编号:12218183
- 上传时间:2023-04-17
- 格式:DOCX
- 页数:42
- 大小:32.74KB
统计学考研真题精选11.docx
《统计学考研真题精选11.docx》由会员分享,可在线阅读,更多相关《统计学考研真题精选11.docx(42页珍藏版)》请在冰豆网上搜索。
统计学考研真题精选11
统计学考研真题精选11
(总分:
300.00,做题时间:
150分钟)
一、单项选择题
(总题数:
28,分数:
28.00)
1.对于线性回归模型为了进行统计推断,通常假定模型中各随机误差项的方差( )。
(分数:
1.00)
A.均等于0
B.均相等 √
C.不相等
D.均不为0
解析:
线性回归模型对随机误差项的假定为:
随机误差项ε的期望值为0;对于所有的x值ε的方差σ2都相等;ε是一个服从正态分布的随机变量且各随机误差项之间相互独立,即ε~N(0,σ2)
2.在线性回归分析中,残差平方和SSE相对总平方和SST越小意味着( )。
(分数:
1.00)
A.线性关系越不显著
B.随机误差产生的影响相对越小,模型越有效 √
C.线性关系之外的其他因素的影响相对越大
D.统计软件中的F值越小
解析:
在线性回归分析中,残差平方和SSE相对总平方和SST越小,则回归平方和SSR相对总平方和越大,F检验统计量的值越大;从而线性关系越显著,线性关系之外的其他因素(随机误差等)产生的影响相对越小,故模型也越有效。
3.回归分析中的估计标准误差( )。
(分数:
1.00)
A.可以是负值
B.等于因变量的平方根
C.是根据残差平方和计算的 √
D.等于自变量的平方根
解析:
回归分析中的估计标准误差是度量各实际观测点在直线周围的散布状况的一个统计量,它是均方残差(MSE)的平方根,用se来表示,其计算公式为:
4.产量(X,台)与单位产品成本(Y,元/台)之间的回归方程为
,下列解释合理的是( )。
(分数:
1.00)
A.产量每增加一台,单位产品成本增加248元
B.产量每增加一台,单位产品成本减少2.6元
C.产量每增加一台,单位产品成本平均增加245.4元
D.产量每增加一台,单位产品成本平均减少2.6元 √
解析:
一元线性回归方程的形式为:
E(y)=β0+β1x其中A是直线的斜率,它表示当x每变动一个单位时,y的平均变动值。
题中,回归方程的回归系数为-2.6,表示产量每增加一台,单位产品成本平均减少2.6元。
5.下列关于相关系数的描述中,不正确的是( )。
(分数:
1.00)
A.相关系数是反映两个变量之间线性关系的度量
B.相关系数具有对称性
C.计量尺度改变不影响相关系数
D.相关系数是两个变量间因果关系的度量 √
解析:
相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量,相关系数具有以下的特点:
①r的取值范围是[-1,1];②r具有对称性;③改变x和y的数据原点及计量尺度,不改变r的数值大小;④r是两个变量之间线性关系的一个度量,不意味着x与y—定有因果关系。
6.在回归分析中,因变量的预测区间估计是指( )。
(分数:
1.00)
A.
对于自变量x的一个给定值x0,求出因变量y的平均值的区间
B.
对于自变量x的一个给定值x0。
,求出因变量y的个别值的区间
√
C.
对于因变量y的一个给定值y0,求出自变量x的平均值的区间
D.
对于因变量y的一个给定值y0,求出自变量x的个别值的区间
解析:
预测区间估计是对x的一个给定值x0,求出y的一个个别值的估计区间,这一区间称为预测区间。
对x的一个给定值x0,求出y的平均值的估计区间,这一区间称为置信区间。
7.在回归分析中,残差平方和SSE反映了y的总变差中( )。
(分数:
1.00)
A.除了x对y的线性影响之外的其他因素对y变差的影响 √
B.由于x与y之间的线性关系引起的y的变化部分
C.由于x与y之间的非线性关系引起的y的变化部分
D.由于y的变化引起的x的误差
解析:
残差平方和或误差平方和是除了x对y的线性影响之外的其他因素对y变差的作用,是不能由回归直线来解释的yi变差部分,记为SSE。
8.—元线性回归中,以下哪一种残差图特点可以说明回归模型的运用是不合理的?
( )(分数:
1.00)
A.残差落在一水平直线附近
B.残差落在一倾斜直线附近 √
C.残差的正态概率图大致落在一条直线附近
D.残差关于一水平直线大致对称
解析:
若对所有的x值,ε的方差都相同,而且假定描述变量x和y之间关系的回归模型是合理的,那么残差图中的所有点都应落在一条水平带中间。
如果,对于较大的x值,相应的残差也较大,这就意味着违背了ε方差相等的假设。
9.在回归变量Y关于预测变量X的回归分析中,若以x为横坐标,y为纵坐标,绘散点图,最小二乘原则是指( )。
(分数:
1.00)
A.各点到直线的垂直距离的和最小
B.各点到x轴的纵向距离的平方和最小
C.各点到直线的垂直距离的平方和最小
D.各点到直线的纵向距离的平方和最小 √
解析:
最小二乘法也称为最小平方法,它是用最小化垂直方向(纵向距离)的离差平方和来估计参数。
10.欲调查两变量(X和Y)的相互关系,收集一份数据作线性相关分析,经计算得到样本相关系数r=0.38,可以说( )。
(分数:
1.00)
A.X和Y无关,因r值较小
B.不能确定X和Y是否相关以及相关密切程度,因不知n的大小
C.虽然X和Y相关,但不能认为X和Y有因果关系 √
D.因r>0,可以认为X和Y存在线性相关关系
解析:
对于一个具体的r取值,根据经验可将相关程度分为以下几种情况:
当|r|≥0.8时,可视为高度相关;0.5≤|r|<0.8时,可视为中度相关;0.3≤|r|<0.5时,视为低度相关;当|r|<0.3时,说明两个变量之间的相关程度极弱,可视为不相关。
即|r|→0说明两个变量之间的线性关系越弱;|r|→1说明两个变量之间的线性关系越强。
r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。
11.在因变量的总离差平方和中,如果剩余平方和所占的比重大,回归平方和所占的比重小,则两变量之间( )。
(分数:
1.00)
A.相关程度高
B.相关程度低 √
C.完全相关
D.完全不相关
解析:
判定系数
,回归平方和所占的比重小,即判定系数小,则两变量之间的相关程度低。
12.关于有常数项的一元线性回归方程,以下正确的是( )。
(分数:
1.00)
A.判定系数等于自变量和因变量的相关系数
B.判定系数等于自变量和因变量相关系数的平方 √
C.自变量和因变量相关系数等于判定系数正的平方根
D.修正的判定系数等于自变量和因变量相关系数的平方
解析:
在一元线性回归中,相关系数实际上是判定系数的平方根。
相关系数与回归系数的符号一致。
13.如果Y关于X的回归方程为y=2-x,而且这个回归方程的R2=0.81,则x与y之间的相关系数( )。
(分数:
1.00)
A.r=1
B.r=-1
C.r=0.9
D.r=-0.9 √
解析:
在一元线性回归中,判定系数实际上是相关系数的平方。
相关系数与回归系数的符号一致。
故
14.以回归方程Y=a+bX作相关分析与回归分析,关于样本相关系数r与回归系数b,下列各论断中哪一个更合理?
( )(分数:
1.00)
A.r>0时b<0
B.r>0时b>0 √
C.r=1时b=0
D.r=1时b=1
解析:
r>0说明y与x正相关,所以b>0。
|r|=1说明y的取值完全依赖于x、二者之间即为函数关系,但6的取值并不确定。
15.变量x与y的相关系数的符号取决于( )。
(分数:
1.00)
A.变量x的标准差
B.变量y的标准差
C.变量x和y两标准差的乘积
D.变量x和y的协方差 √
解析:
随机变量x和y相关系数的计算公式为:
随机变量x和y的协方差的计算公式为:
比较两个计算公式可知,随机变量x和y的相关系数的符号和协方差的符号相同。
16.在线性回归模型中,根据判定系数R2与F统计量的关系可知,当R2=0时,有( )。
(分数:
1.00)
A.F=-1
B.F=0 √
C.F=1
D.F=∞
解析:
F统计量与R2的关系为
当R2=0时,SSR=0,即有F=0。
17.将一枚硬币重复投掷n次,用X和Y分别表示正面朝上和反面朝上的次数,则X和Y的相关系数等于( )。
(分数:
1.00)
A.-1 √
B.0
C.1/2
D.1
解析:
将一枚硬币重复投掷n次,正面朝上和反面朝上的次数关系为X+Y=n即X=n-y,X与Y为完全负线性相关关系,所以相关系数为-1。
18.已知变量X和Y的协方差为-50,X的方差为180,Y的方差为20,其相关系数为( )。
(分数:
1.00)
A.0.83
B.-0.83 √
C.0.01
D.-0.01
解析:
19.1000件时,生产成本为3万元,其中固定成本6000元,建立总生产成本对产量的一元线性回归方程应是( )。
(分数:
1.00)
A.
yc=6000+24x
√
B.
yc=6+0.24x
C.
yc=24000-6x
D.
yc=24+6000x
解析:
由题设可知,该产品固定成本=6000元,单位成本=(30000-6000)/1000=24(元/件),故线性回归方程的截距项为6000,回归系数为24。
20.利用最小平方法配合回归方程的数学依据是:
令观察值和估计值之间( )。
(分数:
1.00)
A.所有离差皆为零
B.离差之和为零
C.离差的平方和为零
D.离差平方和为最小 √
解析:
21.在用回归方程进行估计推算时,( )。
(分数:
1.00)
A.只能用因变量推算自变量
B.只能用自变量推算因变量 √
C.不须考虑因变量和自变量问题
D.自变量和因变量可相互推算
解析:
回归模型中自变量是给定的,即自变量是非随机的,因变量是随机的,所以在用回归方程进行估计推算时,只能用自变量推算因变量。
22.估计标准误差说明回归直线的代表性,因此( )。
(分数:
1.00)
A.估计标准误差数值越大,说明回归直线的代表性越大
B.估计标准误差数值越大,说明回归直线的代表性越小 √
C.估计标准误差数值越小,说明回归直线的代表性越小
D.估计标准误差的数值越小,说明回归直线的实用价值小
解析:
估计标准误差就是度量各实际观测点在直线周围的散布状况的一个统计量,它是均方残差的平方根。
从估计标准误差的实际意义看,它反映了用估计的回归方程预测因变量y时预测误差的大小。
若各观测点越靠近直线,se越小,回归直线对各观测点的代表性就越好,根据估计的回归方程进行预测也就越准确;若各观测点全部落在直线上,则se=0,此时用自变量来预测因变量时是没有误差的。
23.在一元线性回归中,检验H0:
β1=0,下面结论正确的是( )。
(分数:
1.00)
A.相关系数检验、t检验、F检验二种方法不等价
B.相关系数检验、t检验、F检验二种方法是等价的 √
C.相关系数检验法只能用t统计量检验,不能用F统计量检验
D.F检验只能用F统计量检验,而不能用t统计量检验
解析:
24.利用估计的回归方程进行区间估计时,关于置信区间和预测区间,下面说法正确的是( )。
(分数:
1.00)
A.置信区间比预测区间宽
B.预测区间比置信区间宽 √
C.二者一样宽
D.不一定
解析:
25.对于一元线性回归模型,以se表示估计标准误差,r表示样本相关系数,则有( )。
(分数:
1.00)
A.
se=0时,r=1
B.
se=0时,r=-1
C.
se=0时,r=0
D.
se=0时,r=1或r=-1
√
解析:
当估计标准误差
即模型与样本观测值完全拟合,从而自变量与因变量完全正相关或者完全负相关,即r=1或r=-1。
26.下列关于一元线性回归模型Y的平均值E(Y0)与个别值Y0的预测区间的说法,正确的是( )。
(分数:
1.00)
A.X越远离其均值,预测区间越窄
B.样本容量n越大,预测精度越高
C.样本容量n越大,预测精度越低
D.样本容量一定时,平均值的置信区间比个别值的预测区间宽
解析:
预测区间为
故X越远离其均值
,求得的预测区间越宽;样本容量n越大,预测区间越窄,预测精度越高。
而置信区间为
,故样本容量一定时,平均值的置信区间比个别值的预测区间窄。
27.标准化残差图主要用于直观地判断( )。
(分数:
1.00)
A.回归模型的线性关系是否显著
B.回归系数是否显著
C.误差项ε服从正态分布的假定是否成立 √
D.误差项ε等方差的假定是否成立
解析:
如果误差项ε服从正态分布这一假定成立,那么标准化残差的分布也应服从正态分布。
因此,在标准化残差图中,大约有95%的标准化残差在-2~+2之间。
28.如果误差项e服从正态分布的假定成立,那么在标准化残差图中,大约有95%的标准化残差落在( )。
(分数:
1.00)
A.-2~+2之间 √
B.0~1之间
C.-1~+1之间
D.-1〜0之间
解析:
二、多项选择题
(总题数:
6,分数:
24.00)
29.以下关于相关系数的说法中,正确的是( )。
(分数:
4.00)
A.r数值大小与两个变量,坐标原点及测量尺度无关 √
B.若r>0,则越接近于1,说明两变量正的因果关系越强
C.r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系 √
D.
r具有对称性,即x与y之间的相关系数和y与x之间的相关系数相等,即rxy=ryx
√
E.根据计算出来的样本相关系数对总体的相关程度进行判断时,必须进行显著性检验 √
解析:
相关系数只是表明两个变量间互相影响的程度和方向,它说明的是两个变量之间线性相关关系的强弱,并不能说明两变量间是否有因果关系,以及何为因,何为果,即使是在相关系数非常大时,也并不意味着两变量间具有显著的因果关系。
30.在回归分析中,关于估计标准误差正确的是( )。
(分数:
4.00)
A.估计标准误差大,回归直线代表性小,因而回归直线实用价值大
B.估计标准误差大,回归直线代表性小,因而回归直线实用价值也小 √
C.估计标准误差小,回归直线代表性小,因而回归直线实用价值也小
D.估计标准误差大,回归直线代表性大,因而回归直线实用价值小
E.估计标准误差可以看作排除%对:
k影响后,:
k随机波动大小的估计量 √
解析:
估计标准误差是表明回归方程理论值与实际值之间离差的平均水平的指标。
其作用有:
它可以说明以回归直线为中心的所有相关点的离散程度;它可以说明回归方程的理论值代表相应实际值的代表性大小;它可以反映两变量之间相关的密切程度。
31.下列各项中,可以采用回归分析的有( )。
(分数:
4.00)
A.圆的半径与面积
B.人均可支配收入和消费性支出 √
C.小学生的识字多少与他们的鞋子尺寸
D.作物产值与农作物种植面积 √
E.我国的国内生产总值和印度的人口
解析:
A项是确定性的函数关系;CE两项通过定性分析可知,小学生的识字多少与他们的鞋子尺寸是没有关系的;我国的国内生产总值和印度的人口数量也是没有关系的;BD两项存在相关关系,可以采用回归分析。
32. 关于相关分析与回归分析的说法,正确的有( )。
(分数:
4.00)
A.两者都是研究非确定性变量间的统计依赖关系 √
B.两者都可以测度线性依赖程度的大小 √
C.在相关分析中变量的地位是对称的 √
D.在回归分析中变量的地位是不对称的 √
E.相关分析中的变量可以是随机变量,也可以是非随机变量
解析:
相关分析与回归分析的联系和区别分别是:
①联系:
两者都是研究非确定性变量间的统计依赖关系,并能测度线性依赖程度的大小。
②区别:
a.相关分析中变量的地位在相关分析中是对称的,而且都是随机变量;回归分析中变量的地位是不对称的,有自变量与因变量之分,而且自变量也往往被假设为非随机变量;b.相关分析只关注变量间的联系程度,不关注具体的依赖关系;而回归分析则更加关注变量间的具体依赖关系。
33.下列关于判定系数R2的说法,正确的有( )。
(分数:
4.00)
A.
残差平方和越小,R2越小
B.
残差平方和越小,R2越大
√
C.
R2=1时,模型与样本观测值完全拟合
√
D.
R2越接近于1,模型的拟合优度越高
√
E.
判定系数的取值范围为0≤R2≤1
√
解析:
34.对于一元线性回归模型,对x的一个给定值x,y的平均值的置信区间和个别值的预测区间分别为( )。
(分数:
4.00)
A.
B.
C.
√
D.
E.
解析:
三、判断题
(总题数:
9,分数:
9.00)
35.一元回归模型的判定系数R2表明了回归直线对观测数据的拟合程度。
( ) (分数:
1.00)
A.正确 √
B.错误
解析:
R2越接近于1,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x的变化来解释y值变差的部分就越多,回归直线对观测数据的拟合程度就越好;反之,R2越接近于0,回归直线对观测数据的拟合程度就越差。
36.公司的业绩与股票价格是因果关系,其中股票价格大跌是因,公司的业绩下降是果。
( )(分数:
1.00)
A.正确
B.错误 √
解析:
公司业绩与股票价格之间存在不确定的数量关系,公司的业绩会影响股票的价格,而股票的价格也会对公司的业绩产生影响,即存在一定的相关关系,但并非因果关系。
37.回归分析是根据变量之间的主从或因果的回归关系,对变量之间的数量变化进行测定,建立数学模型,对因变量进行预测或估计的统计分析方法。
( )(分数:
1.00)
A.正确 √
B.错误
解析:
回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
回归分析中的数学模型众多。
回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
38.利用一个回归方程,两个变量可以互相推算。
( )(分数:
1.00)
A.正确
B.错误 √
解析:
回归方程给出的是因变量的预测方程,只能根据给定的自变量,然后预测出相应的因变量的值。
39.在回归分析中,定义的自变量和因变量都是随机变量。
( ) (分数:
1.00)
A.正确
B.错误 √
解析:
在回归分析中,自变量是非随机变量,而因变量是随机变量。
40.回归模型中假定误差项ε是一个服从正态分布的随机变量,且相互独立。
( )(分数:
1.00)
A.正确 √
B.错误
解析:
41.通过增大样本容量和提高模型的拟合优度可以缩小置信区间。
( )(分数:
1.00)
A.正确 √
B.错误
解析:
根据置信区间的表达式:
可以看出,增大样本容量〃可以缩小区间半径;提高模型的拟合优度,则标准误差se会变小,则区间的半径变小。
两种方法都可以缩小置信区间。
42. 对于一元线性回归模型,如果自变量是显著的,那么自变量所对应的系数应该显著不为0。
( )(分数:
1.00)
A.正确 √
B.错误
解析:
43.估计量和估计值并没有什么区别,二者是同一概念。
( )(分数:
1.00)
A.正确
B.错误 √
解析:
估计量通常是样本的函数,是一个随机变量;而估计值是将观测到的样本数据带入估计量表达式后计算得到的一个具体数值。
四、简答题
(总题数:
11,分数:
70.00)
44.简述一元回归模型的基本假设。
(分数:
5.00)
__________________________________________________________________________________________
正确答案:
(
(1)一元线性回归模型的概念
对于具有线性关系的两个变量,可以用一元线性方程来表示它们之间的关系。
描述因变量y如何依赖于自变量x和误差项s的方程称为回归模型。
只涉及一个自变量的一元线性回归模型,可表示为:
y=β0+β1x+ε
(2) —元线性回归模型的主要假设
① 因变量y与自变量x之间具有线性关系;
② 在重复抽样中,自变量x的取值是固定的,即假定x是非随机的;
③ 误差项ε是一个期望值为0的随机变量,即E(ε)=0;
④ 对于所有的尤值,ε的方差σ2都相同;
⑤ 误差项e是一个服从正态分布的随机变量,且独立,即σ2。
)
解析:
45.简述回归分析的一般过程。
(分数:
5.00)
__________________________________________________________________________________________
正确答案:
(
回归分析是确定两个或两个以上变量间相互依赖的定量关系的一种统计分析方法,进行回归分析的一般过程为:
(1) 明确预测的具体目标,确定因变量和直变量。
(2) 进行相关分析。
回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。
只有当变量与因变量确实存在某种关系时,建立的回归方程才有意义。
因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。
进行相关分析,一般要求出相关系数,以相关系数的大小来判断自变量和因变量的相关的程度。
(3) 建立预测模型。
依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程。
(4) 计算预测误差。
回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。
回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。
(5) 确定预测值。
利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。
)
解析:
46.试问独立性与不相关之间的区别与联系?
(分数:
5.00)
__________________________________________________________________________________________
正确答案:
(
两者的联系:
独立性和不相关性都是随机变量间联系“薄弱”的一种反映。
若z与f独立,则X与Y不相关。
在二维正态分布中,不相关性与独立性是等价的。
两者的区别:
两个随机变量相互独立与不相关是两个不同的概念,不相关只说明两个随机变量之间没有线性关系,但这时的X与Y可能有某种别的函
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 考研 精选 11