生物统计学习题集答案.docx
- 文档编号:5161729
- 上传时间:2022-12-13
- 格式:DOCX
- 页数:17
- 大小:97.75KB
生物统计学习题集答案.docx
《生物统计学习题集答案.docx》由会员分享,可在线阅读,更多相关《生物统计学习题集答案.docx(17页珍藏版)》请在冰豆网上搜索。
生物统计学习题集答案
生物统计学习题集参考答案
第一章概论
一、填空
1变量按其性质可以分为连续变量和非连续变量。
2样本统计数是总体参数的估计量。
3生物统计学是研究生命过程中以样本来推断总体的一门学
科。
4生物统计学的基本内容包括_试验设置、统计分析—两大部分。
5统计学的发展过程经历了古典记录统计学、近代描述统计学现代推断统计学3个阶段。
6生物学研究中,一般将样本容量丄大于等于_30称为大样本。
7试验误差可以分为一随机误差、系统误差两类。
二、判断
(-)1对于有限总体不必用统计推断方法。
(-)2资料的精确性高,其准确性也一定高。
(+)3在试验设计中,随机误差只能减少,而不可能完全消除。
(+)4统计学上的试验误差,通常指随机误差。
三、名词解释
样本:
从总体中抽出的若干个体所构成的集合称为样本。
总体:
具有相同的个体所构成的集合称为总体。
连续变量:
是指在变量范围内可抽出某一范围的所有值。
非连续变量:
也称离散型变量,表示变量数列中仅能取得固定数值并
且通常是整数。
准确性:
也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
精确性:
也称精确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章试验资料的整理与特征数的计算
一、填空
1资料按生物的性状特征可分为—量性状资料_变量和—变量性状资料_变量。
2直方图适合于表示_计量、连续变量一资料的次数分布。
3变量的分布具有两个明显基本特征,即集中性和离散性。
4反映变量集中性的特征数是平均数,反映变量离散性的特征
数是_变异数(标准差)_。
5样本标准差的计算公式s="刀(X-X横杆)平方/(n-1)。
二、判断
(-)1计数资料也称连续性变量资料,计量资料也称非连续性变
量资料。
(-)2条形图和多边形图均适合于表示计数资料的次数分布。
(+)3离均差平方和为最小。
(+)4资料中出现最多的那个观测值或最多一组的中点值,称为
众数。
(-)5变异系数是样本变量的绝对变异量。
三、名词解释
资料:
实验或调查获得的大量的原始数据。
数量性状资料:
由计数、度量、测量得到的资料。
质量性状资料:
只能观察不能测量的资料。
计数资料:
有计数法得到的数据。
计量资料:
有测量、度量得到的数据。
普查:
指对研究对象的每一个个体都进行测量或度量的一种全面调查抽样调查:
是一种非全面调查它是根据一定的原则或研究对象抽取一部分个体进行测量和度量把得到的数据资料作为样本进行统计处理然后利用样本特征数对总体进行推断。
全距(极差):
最大观测值与最小观测值的差值。
组中值:
组中上限与下限的中间值。
算数平均数:
总体或样本资料中各个观测值的综合除以观测值个数所得的商。
中位数:
按顺序排列位置居中的观测数。
众数:
出现次数最多的一组数。
几何平均数:
观测数的乘积再开观测数的个数次方得到的值。
方差:
用样本容量n来除以离均差平方和得到的平均的平方和。
标准差:
方差的平方根。
变异系数:
标准差除以样本平均数。
四、单项选择
1下面变量中属于非连续性变量的是c_o
A身高B体重C血型D血压
2对某鱼塘不同年龄鱼的尾数进行统计分析时,可做成A图来表示。
A条形图B直方图C多边形图D折线图
3关于平均数,下列说法正确的是__B_。
A正态分布的算术均数与几何平均数相等
B正态分布的算术平均数与中位数相等
C正态分布的中位数与几何平均数相等
D正态分布的算术平均数、中位数、几何平均数均相等
4如果对各观测值加上一个常数a,其标准差D_。
A扩大a倍B扩大a倍C扩大a2倍D不变
5比较大学生和幼儿园孩子身高变异度,应采用的指标是__C_。
A标准差B方差C变异系数D平均数
第三章概率与概率分布
一、填空
1如果事件A和事件B为独立事件,则事件A与事件B同时发生地
概率P(AB)=_P(A)P(B)一。
2二项分布的形状是由n和p个参数决定的。
3正态分布曲线上,_u_确定曲线在x轴上的中心位置,_c_
确定曲线的展开程度。
4样本平均数的标准误j等于平方/n。
x■■
5t分布曲线和正态分布曲线相比,顶部偏低,尾部偏
二、判断
(-)1事件A的发生与事件B的发生毫无关系,则事件A和事件
B为互斥事件。
(-)2二项分布函数c:
pxqn」恰好是二项式pqn展开式的第x项,故称二项分布。
(-)3样本标准差s是总体标准差的无偏估计值.
(+)4正态分布曲线形状与样本容量n值无关。
(+)5x2是随自由度变化的一组曲线。
三、名词解释
概率:
某事件在N次重复试验发生了M此,当次数n不断增大时,事件A发生的频率就越来越接近一确定值于是定义P为事件A发生的概率。
和事件:
两事件至少有一件发生构成的新事件。
积事件:
两事件同时发生构成的新事件。
互斥事件:
不能同时发生的两事件。
对立事件:
必有一个发生的两事件。
独立事件:
毫无关系的两事件。
完全事件系:
事件两两相斥,构成的整体称为完整事件系。
概率加法定理:
互斥事件的出现的概率等于他们各自概率之和
概率乘法定理:
独立事件同时发生的概率等于他们各自概率的积。
伯努利大数定律:
实验条件不变的情况下,重复次数越多,频率越接
近理论概率。
辛钦大数定律:
n无限大时,样本平均数和总体平均数相等。
无偏估计值:
如果所有可能样本的某一统计数的平均数等于总体相应参数,则称盖统计数为总体相应参数的无偏估计值。
中心极限定理:
如果被抽取的样本不是正态总体,但具有平均数和方差,当样本容量不断增大,样本平均数的分布也越来越接近正态分布切具有平均数和方差,着成为中心极限定理。
四、单项选择
1一批种蛋的孵化率为80%同时用2枚种蛋进行孵化,则至少有一枚能孵化出小鸡的概率为A_
A0.96B0.64C0.80D0.90
2关于泊松分布参数入错误的说法是__C一。
A匕=入B二2-C■■D二np
3设x服从N(225,25),现以n=100抽样,其标准误为B。
A1.5B0.5C0.25D2.25
4正态分布曲线由参数卩和决定,卩值相同时,▽取D时正态曲线展开程度最大,曲线最矮宽。
A0.5B1C2D3
5t分布、F分布的取值区间分别为_A_o
A(-*,+x);[0,+x)
—°°,+乂);(-OO,+°)
第四章统计推断
一、填空
1统计推断主要包括假设检验_和参数估计一两个方面。
2参数估计包括__区间__估计和_点—估计。
3假设检验首先要对总体提出假设,一般应作两个假设,一个是,无效假设(零假设、H6_一个是被择假设(HA_。
4对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作U+-uo(XX-。
5在频率的假设检验中,当np或nq<30时,需进行连续性矫正。
二、判断
(-)1作假设检验时,如果IuI>Ua,应接受H),否定f。
(+)2作单尾检验时,查u或t分布表(双尾)时,需将双尾
概率乘以2再查表。
(-)3第一类错误和第二类错误的区别是:
第一类错误只有在接受H)时才会发生;第二类错误只有在否定H)时才会发生。
(-)4当总体方差二2未知时需要用t检验法进行假设检验。
(-)5在假设检验中,对大样本(n》30),用u检验法,对小样本(n<30)用t检验。
(-)6成对数据显著性检验的自由度等于2(n-1)。
(+)7在进行区间估计时,a越小,则相应的置信区间越大。
(-)8方差的同质性是指所有样本的方差都是相等的。
(+)9在小样本资料中,成组数据和成对数据的假设检验都是采
用t检验的方法。
(+)10在同一显著水平下,双尾检验的临界正态离差大于单尾检验。
三、名词解释
统计推断:
根据带随机性的观测数据(样本)以及问题的条件和假定
(模型),而对未知事物作出的,以概率形式表述的推断。
假设检验:
根据总体的的理论分布和小概率原理对未知或不完全知道
的的总体提出两种彼此对立的假设,然后又样本的实际结果经过一定的计算,做出在一定概率意义上应该接受的那种假设推断。
参数估计:
至样品结果对总体参数在一定的概率水平下做出的估计。
小概率原理:
如果抽样结果使得小概率事件发生,则拒绝假设,如果没有使小概率事件发生则接受假设,一般认为等于或是小于0.01或
是0.05得让概率为校概率。
显著水平:
在进行无效假设和被择假设后,要确定一个否定H0的概
率标准,这个标准较显著水平。
方差同质性:
表明样本是否来自同一整体。
a错误:
如果h0是真实的假设检验、却否定了它,犯了一个否定真实假设检验的错误。
B错误:
如果H0不是真实的,假设检验的时候却接受了它否定了HA这样就犯了接受不真实假设的错误。
四、单项选择
1两样本平均数进行比较时,分别取以下检验水平,以___A
所对应的犯第二类错误的概率最小。
A.<■=0.20Bis=0.10C二=0.05Djs=0.01
2当样本容量n<30且总体方差c2未知时,平均数的检验方法是
A。
At检验B检验CF检验D2检验
3两样本方差的同质性检验用B.。
A■检验BF检验Ct检验D2检验
4进行平均数的区间估计时,___B」
An越大,区间越小,估计的精确性越小
Bn越大,区间越小,估计的精确性越大
C二越大,区间越大,估计的精确性越大
D二越大,区间越小,估计的精确性越大
5已知某批25个小麦样本的平均蛋白质含量x和二,则其在95%置信度下的蛋白质含量的点估计L=__C_。
Ax_%05二Bx—toa二Cx—UrDX_to.05[
第五章2检验
一、填空
1/2检验主要有3种用途:
一个样本方差的同质性检验、—适合性
检验禾口独立性检验―。
272检验中,在自由度df=1—时,需要进行连续性矫正,其
矫正的[二刀(|0-E1-0.5)?
2/E。
32分布是—连续型—资料的分布,其取值区间为—[0+乂)_
4猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合孟德尔第一遗传规律应采用—适合性—检验法。
5独立性检验的形式有多种,常利用列联表一进行检验。
二、判断
(-)12检验只适用于离散型资料的假设试验。
(+)22检验中进行2Xc(c>3)列联表的独立性检验时,不
需要进行连续性矫正。
(+)3对同一资料,进行校正的2值要比未矫正的2值小。
(+)42检验时,当2>a时,否定接受HA,说明差异达显著水平。
(-)5比较观测值与理论值是否符合的假设检验称为独立性试
验。
三、名词解释
适合性检验:
比较观测值和理论值是否符合的假设检验。
独立性检验:
研究两个或两个以上因子之间是相互独立的检验。
四、单项选择
1()/2检验中检验统计量沪值的计算公式为A。
A
心Q—Ef
B
2
心Q-E)
C
尤2=迟
2
9-E\
\
D
E
O
〜g2 IO丿 2()7.2检验时,如果实得誓>;,即表明_C AP<: 应接受H0,否定HHBP>: 应接受HA,否定Ho CP<,应否定H0,接受HADP>: 应否定Ho,接受HA 3()在遗传学上常用B来检验所得的结果是否符合性状分 离规律。 A独立性检验B适合性检验C方差分析D同质性检 验 4()对于总合计数n为500的5个样本资料作2检验,其自由度为—D_o A499B496C1D4 5()rxc列联表的z2检验的自由度为B。 A(r—1)+(c—1)B(r—1)(c—1)Crc—1Drc—2 第六章方差分析 一、填空 1根据对处理效应的不同假定,方差分析中的数学模型可以分为—固定模型、随机模型和混合模型3类。 'r*■-1111 2在进行两因素或多因素试验时,通常应该设置—重复=,以正确估计试验误差,研究因素间的交互作用。 3在方差分析中,对缺失数据进行弥补时,应使补上来数据后,—误差平方和.最小。 4方差分析必须满足正态性、可加性、方差同质性3 个基本假定。 5如果样本资料不符合方差分析的基本假定,则需要对其进行数据 转换,常用的数据转换方法有平方根转换_对数转换_正 反弦转换等。 二、判断 (+)1LSD检验方法实质上就是t检验。 (+)2二因素有重复观测值的数据资料可以分析两个因素间的互作效应。 (-)3方差分析中的随机模型,在对某因素的主效进行检验时, 其F值是以误差项方差为分母的。 (+)4在方差分析中,如果没有区分因素的类型,可能会导致错误的结论。 (-)5在方差分析中,对缺失数据进行弥补,所弥补的数据可以提供新的信息。 (+)6对转换后的数据进行方差分析,若经检验差异显著,在进行平均数的多重比较时需要用转换后的数据进行计算。 三、名词解释 因素: 试验中所研究的影响试验指标的原因水平: 试验因素的不同状态 试验单位: 能接受不同试验处理的独立的试验载体重复: 一个处理实施在两个或两个以上的试验单位上 多重比较: 平均数两两间的互相比较 交互作用: - 一因子对另一因子的不同水准有不同的效果 数据转换: 在方差分析前进行适当的处理 四、单项选择 Xij A组内平方和 C总平方和 A组内平方和 C总平方和 ()3方差分析计算时,可使用_B__种方法对数据进行初步整理。 A全部疏忽均减去一个值 B每一处理减去一个值 C每一处理减去该处理的平均数 D全部数据均除以总平均数 第七章直线回归与相关分析 一、填空 1相关系数的取值范围是[-111。 2用来说明回归方程代表性大小的统计分析指标是F。 3统计上常用回归分析来研究呈因果关系的两个变量间的关系,用—相关—分析来研究呈平行关系的两个变量间的关系。 4对于简单直线回归方程,其回归平方和的自由度为__1_。 5在直线回归方程中,自变量改变一个单位,依变量平均增加或减 少的单位数可用b来进行表示。 二、判断 (-)1当直线相关系数r=0时,说明变量之间不存在任何相关关系。 (+)2如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。 (-)3相关系数r有正负、大小之分,因而它反映的是两现象之间具体的数量变动关系。 (-)4回归系数b的符号与相关系数r的符号,可以相同也可以不同。 (-)5回归分析和相关分析一样,所分析的两个变量都一定是随机变量。 (-)6在直线回归分析中,两个变量是对等的,不需要区分因变量和自变量。 (-)7正相关指的就是两个变量之间的变动方向都是上升的。 三、名词解释 相关分析: 描述两个或两个以上变量间关系密切程度的统计方法。 回归分析: 一种研究与测度变量之间关系的技术。 对具有相关关系的现象,择一适当的数学关系式,用以说明一个或一组变量变动时,另一变量或一组变量平均变动的情况,这种关系式称为回归方程。 回归系数: 回归方程式八丫二bX+a中之斜率b,称为回归系数。 回归截距: 回归方程式“Y二bX+a中之斜率a,称为回归截距。 离回归平方和: 为了明确解释变量和随机误差各产生的效应是多少,统计学上把数据点与它在回归直线上相应位置的差异称残差,把每个 残差的平方后加起来,称为残差平方和,它表示随机误差的效应。 回归平方和: 反映自变量与因变量之间的相关程度的偏差平方和。 相关系数: 相关系数是变量之间相关程度的指标。 样本相关系数用r 表示,总体相关系数用p表示。 决定系数: 相关系数的平方即为决定系数。 z转换: 要估计相关系数的置信区间,需要将r转换为z。 四、单项选择 1在回归直线中y=a+bx中,b<0,则x与y之间的相关系数_D。 Ar=0Br=1C0 2由样本求得r=—0.09,同一资料作回归分析时,b值应为 Ab<0Bb>0Cb=0Db>0 3简单线性回归系数t检验,其自由度为__A— An—2Bn—1CnD2n4回归系数和相关系数的符号是一致的,其符号均可用来判断现象 B。 A线性相关还是非线性相关相关 C完全相关还是不完全相关相关 5相关分析室研究__C__。 A变量之间的数量关系动关系 C变量之间的相互关系的密切程度 正相关还是负 单相关还是负 果关系 6在回归直线y二a+bx中,b表示 7当相关系数r=0时,表明__D Ax与y之间一定存在因果关系 B同一资料作回归分析时,求得回归系数一定为正值 C同一资料作回归分析时,求得回归系数一定为负值 D求得回归截距a>0 9根据样本算得一相关系数r,经t检验,PvO.01,说明Do A两变量有高度相关Br来自高度相关的相 关总体 Cr来自总体相关系数p的总体Dr来自pH0总体10若r A不存在任何关系B有直线相关关系 C有确定的函数关系D不存在直线关系,但不排除存在某种曲 线关系 平坦 SSm> 总、k 12如果直线相关系数r=1,则一定有C。 ASS总二SS残BSS戋二S%CSS、 A用回归直线估计的效果越好 用回归直线估计的效 13直线回归分析中,回归系数b的绝对值越大,则__C___。 果越差 原点 14最小二乘估计方法的本质要求是___D___。 A各点到直线的垂直距离的和最小 B各点到x轴的纵向距离的平方和最小 C各点到直线的垂直距离的平方最小 D各点到直线的纵向距离的平方和最小 15在简单线性回归分析中,剩余平方和反映了C。 A应变量y的变异度B自变量x的变异度 C扣除x影响后y的变异度D扣除y影响后x的变 异度 第八章可直线化的非线性回归分布 一、填空 1在确定两个变量曲线类型的常用方法有图示法和直线化法 。 2在进行非线性回归曲线的直线化时,对数据进行转换的方法通常有直接引入新变量_和一方程变换后再引入新变量_。 3—相交指数一可以反映回归曲线拟合程度高低。 二、判断 (+)1直线关系是两变量间最简单的一种关系,但这种关系通常仅在变量一定得取值范围内成立。 (-)2所有的曲线类型都可以通过变量转换成直线形式。 (+)3对曲线进行直线化,必须结合双变量资料本身的特性。 第九章抽样原理与方法 一、填空 1只要使用非全面调查的方法,即使遵守随机原则, 也不可避免会发生。 2常用的抽样方法有、和。 3在抽样调查时,抽样误差越小,用样本估计总体的可靠性就越 4在其他条件一定时,样本容量越大,抽样误差越。 5按照抽样方法的不同,随机抽样有可分为 、和。 二、判断 ()1抽样误差是抽样调查中无法避免的误差。 ()2抽样误差的产生是由于破坏了随机原则所造成的。 ()3在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。 ()4在进行抽样调查时,样本容量越大,其抽样误差也越大。 ()5顺序抽样可以计算其抽样误差。 ()6整体抽样不能提供总体平均数的无偏估计值。 ()7简单随机抽样适用于个体间差异较小,所需抽取的样本单位数较小的情况。 ()8分层随机抽样通常比简单随机抽样得到的结果更准确。 ()9通常样本容量与准确度有关,样本容量越大,准确度越高。 ()10抽样调查方法的正确与否直接关系到由样本所得估计值的准确性。 四、单项选择 1用简单随机抽样方法抽取样本单位,如果要使抽样平均误差降低50%则样本容量需扩大为原来的。 A2倍B3倍C4倍D5倍 2事先将全部总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样方式为。 A分层随机抽样B简单随机抽样C整体抽样D顺序抽样 3整群抽样是对被抽中的群体作全面调查,所以整群抽样时 A全面调查B非全面调查C一次性调查D经常性调查 4事先确定总体范围,并对总体的每个单位编号,然后根据《随机数码表》或抽签的方式来抽取调查单位数的抽样组织形式,被称为 A简单随机抽样B机械抽样C分层抽样 体抽样 5先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样调查组织方式被称为。 A简单随机抽样B机械抽样C分层随机抽样D整 体抽样 6在其他条件不变的情况下,样本容量和抽样误差的关系是 A样本容量越大,抽样误差越大 B样本容量越大,抽样误差越小 C样本容量的变化与抽样误差的数值无关 D抽样误差变化程度是样本容量变动程度的1/2 第十章试验设计及其统计分析 一、填空 1试验设计包括3个基本要素,即,受试对象和 。 2试验设计中遵循随机的原则可以起到的作用。 3对比设计的统计分析采用的是法,而随机区组设计的统 计分析采用的是。 4裂区设计中一般将精度要求高的因素安排在,精度要求 低的因素安排在。 5正交设计常采用科学合理地安排试验设计。 二、判断 ()1理论上讲,如果试验没有误差,精确度和准确度是一致的。 ()2试验设计中设置重复的目的是为了消除试验误差。 ()3对比设计体现了实验设计中的重复和随机原则,但未体现局部控制的原则。 ()4裂区设计中一般主区之间比副区之间的实验空间更为接近,所以主区的实验误差多小于副区误差。 ()5在无交互左营的正交试验中,各实验因素的水平数减1之 和加1,即为所需要做的最少试验次数。 四、单项选择 1试验设计的三大基本原则是。 A受试对象、处理效应、观察指标 B 随机、重复、局部控 制 C处理因素、受试对象、处理效应 D 齐同对比、均衡性、 随机化 2随机区组设计要使。 A组内差异最小,组间差异最大 B 组内差异最大,组间差 异最小 C组内、组间差异都最小D 组内、组间差异都最大 3下列关于正交设计的叙述, 是不正确的。 A正交表中的部分水平组合,在全部可能的水平组合中均匀分布 B如果正交表的各列都安排了试验因素,则无法估计试验误差 C正交设计是多因素试验的不完全设计,能够大大节省人力、物 力,因此试验因素越多越好 D正交表中任一因素任一水平都均衡地包含其他因素的各水平 4在二裂式裂区设计中,如果A因素(a个水平)安排在主区,B因素(b个水平)安排在副区,n个区组,则副区
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 习题集 答案