拉丁方试验设计方案统计分析.docx
- 文档编号:28520897
- 上传时间:2023-07-18
- 格式:DOCX
- 页数:16
- 大小:41.28KB
拉丁方试验设计方案统计分析.docx
《拉丁方试验设计方案统计分析.docx》由会员分享,可在线阅读,更多相关《拉丁方试验设计方案统计分析.docx(16页珍藏版)》请在冰豆网上搜索。
拉丁方试验设计方案统计分析
拉丁方实验设计及分析
1刖言
拉丁方”的名字最初是由R、A、Fisher给出的。
拉丁方设计(latinsquaredesign)是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成单位组,是比随机单位组设计多一个单位组的设计。
在拉丁方设计中,每一行或每一列都成为一个完全单位组,而每一处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,实验处理数=横行单位组数=直列单位组数=
实验处理的重复数。
在对拉丁方设计实验结果进行统计分析时,由于能将横行、直列二个单位组间的变异从实验误差中分离出来,因而拉丁方设计的实验误差比随机单位就在于提供对实验处理顺序的控制,使实验条件均衡,抵消由于实验处理的先后顺序的影响而产生的顺序误差,因而也可称之为抵消法设计。
组设计小,实验精确性比随机单位组设计高。
拉丁方设计又叫平衡对抗设计(balaneeddesign)、轮换设计。
这三个名称是从其模式、作用和方法三个不同的角度来说明这种设计的意义。
所谓平衡对抗设计,是指在实验中,由于前一个实验处理往往会影响后一个实验处理的效果,而该实验设计的作用。
所谓轮换设计,是指在实验中,由于学习的首因效应,先实验的内容,被试容易记住;又因为学习的近因效应,对于刚刚学过的内容,被试回忆的效果一般也较好。
因此、在实验方法上,有必要使不同实验条件出现的先后顺序轮换,使情境条件以及先后顺序对各个实验组的机会均等,打破顺序界限。
所谓拉丁方设计,是指平衡对抗设计的结构模式,犹如拉丁字母构成的方阵。
例如四组被试接受A、B、C、D四种处理,其实验模式为:
组1A8CD
组2t)ABC
纟n3CDAR
…口厂;n』上述模式表可以看出,每种处理即表
组4BLDA
中的字母在每一行和每一列都出现了一次而且仅出现了一次。
像这样的一个方阵列就称为一个拉丁方。
要构成一个拉丁方,必须使行数等于列数,并且两者都要等于实验处理的种数。
在只有两个实验处理的情况下,通常采用的平衡对抗设计是以ABBA的顺序来
安排实验处理的顺序。
或者把单组被试分为两半•一半按照ABBA的顺序实施
处理,另一半按照BAAB的顺序实施处理。
2选题背景
源于生产实践,在畜牧、水产等动物实验中,如果要控制来自两个方面的系统误差且实验动物的数量又较少,则常采用拉丁方设计
。
2.1研究的目的和意义
拉丁方设计(latinsquaredesign是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成单位组,是比随机单位组设计多一个单位组的设计。
在拉丁方设计中,每一行或每一列都成为一个完全单位组,而每一处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,实验处理数=横行
单位组数=直列单位组数=实验处理的重复数。
在对拉丁方设计实验结果进行统计分析时,由于能将横行、直列二个单位组间的变异从实验误差中分离出来,因而拉丁方设计的实验误差比随机单位组设计小,实验精确性比随机单位组设计高。
课题的目的是:
因为在拉丁设计中,横行单位组数、直列单位组数、实验处理数与实验处理的重复数必须相等,所以处理数受到一定限制。
若处理数少,则重复数也少,估计实验误差的自由度就小,影响检验的灵敏度;若处理数多,则重复数也多,横行、直列单位组数也多,导致实验工作量大,且同一单位组内实验动物的初始条件亦难控制一致。
因此,拉丁方设计一般用于5-8个处理
的实验。
在采用4个以下处理的拉丁方设计时,为了使估计误差的自由度不少于12,可采用“复拉丁方设计”,即同一个拉丁方实验重复进行数次,并将实验数据合并分析,以增加误差项的自由度。
应当注意,在进行拉丁方实验时,某些单位组因素,如奶牛的泌乳阶段,实验因素的各处理要逐个地在不同阶段实施,如果前一阶段有残效,在后一阶段的实验中,就会产生系统误差而影响实验的准确性。
此时应根据实际情况,安排适当的实验间歇期以消除残效。
另外,还要注意,横行、直列单位组因素与实验因素间不存在交互作用,否则不能采用拉丁方设计。
其研究的意义在于:
1、精确性高拉丁方设计在不增加实验单位的情况下,比随机单位组设计多设置了一个单位组因素,能将横行和直列两个单位组间的变
异从实验误差中分离出来,因而实验误差比随机单位组设计小,实验的精确性
比
随机单位组设计高。
2、实验结果的分析简便
2.2现状和发展趋势与研究的主攻方向
拉丁方实验从实际应用上来说,在计算机科学、数字通讯、光纤网络优化、实验设计、生物基因工程等方面都有着重要的应用,其不仅在基础数学研究中具有极其重要的地位,在其它的学科中也有重要的应用,如心理学、生物等学科中均有重要应用。
近年来,正交拉丁方理论在实验设计、计算机科学、编码理论和保密通讯等领域得到了重要的应用,这为正交拉丁方理论的研究提供了巨大的原动力。
本研究方向近年来在frame自正交拉丁方、带对称正交侣的自正交拉丁方、r-自正交拉丁方、自正交的Mendelsohn三元系、横截设计等方面取得了一系列的研究成果。
3实验设计及拉丁方实验设计
3.1实验设计
实验设计的基本工具是正交表,正交表是根据均匀分布的思想,运用组合数学理论构造的一种数学表格•实验设计的方法很多,不同的方法用于解决在实际工作中所遇到的不同的问题,应用最广泛和最具典型性的方法有区组设计、正交设计、参数设计、回归设计、均匀设计、混料设计、饱和设计与超饱和设计”。
为比较某因子的多个水平,按某个已知的噪声因子把全部实验单元分为若干个组并进行实验和统计分析的方法称为区组设计。
根据不同情况设计具体实验的方法有随机化完全区组设计、平衡不完全区组设计和链式区组设计。
区组设计被广泛用于因素水平比较实验。
正交实验设计是一种常用多因子实验设计方法,它利用正交表k(q'选择实验
条件和安排实验计划。
并利用正交表的特点进行数据分析,减少实验次数,找出最好的或满意的实验计划组合。
对应实验具体情况和要求不同,正交设计方法和统计分析方法也有相应的调整和优化。
正交实验设计中的裂区设计是现今一大研究热点。
实验设计的主要作用是减低实验次数、提高实验精度,使研究人员从实验结果中获得无偏的处理效应及实验误差的估计,进行正确而有效的比较。
为了控制干扰因子引起的差异,降低实验误差,在实验设计中要遵循三条基本原则。
一.重复(Replication)
重复性是科学调查结论的基本要求。
相同处理设置实验单元重复后就可研究在实验单元间的变异。
设置重复主要作用在于;1.估计实验误差;2.降低实验误差,提高实验精度.
二.随机化(Randomization)
随机化指实验中每一个处理都有相等的机会实施安排在任何一个实验单元上。
随机可以消除任何人为的主观偏性及各种干扰因子的影响,以保证获得处理效应及误差变异的有效无偏估计。
三.区域控制(Blocking)
区域控制是将实验单元按系统干扰因子的环境控制因子进行区组划分,实施区组控制,使同一区组内的单元间环境因子保持一致,保证同一区组中局部范围内单元间误差的同质性。
3.2拉丁方实验设计
拉丁方设计(latinsquaredesign)在统计上控制两个不相互作用的外部变量并且操纵自变量。
每个外部变量或分区变量被划分为一个相等数目的区组或级别,自变量也同样被分为相同数目的级别。
如果将k个不同符号排成k列,使得每一个符号在每一行、每一列都只出现一次的方阵,叫做kxk拉丁方。
应用拉丁方设计就是将处理从纵横二个方向排列为区组(或重复),使每个处理在每一列和每一行中出现的次数相等(通常一次),即在行和列两个方向都进行局部控制。
所以它是比随机区组多一个方向局部控制的随机排列的设计,因而具有较高的精确性。
拉丁方设计的特点是处理数、重复数、行数、列数都相等。
最小的可以为2x2
拉丁方设计,没有诸如2x3拉丁方设计。
它的每一行和每一列都是一个区组或一次重复,而每一个处理在每一行或每一列都只出现一次,因此,它的处理数、重复数、行数、列数都等于5。
拉丁方设计的优点是:
精确度高。
缺点
是:
由于重复数与处理数必须相等,使得两者之间相互制约,缺乏伸缩性。
因此,采用此类设计时实验的处理数不能太多,一般以4〜10个为宜。
其具体的
应用过程是这样的:
假设我现在要做一个实验,被试一共要进行5个小测试,并且需要重测多次,因此对这5个测试的排序就需要列入变量控制之内,不可能多次都一样的顺序,因此为了平衡这种顺序效应,采取拉丁方设计,先命名5个小测试分别
为1,2,3,4,5。
那么对其的排序就是这样的:
其顺序是这样确定的,横排:
1,2,n,3,n-1,4,n-2……(n代表要排序的量的个数)竖排:
1,2,3,4,5再轮回1
(1)设计的基本要求:
①必须是三个因素的实验,且三个因素的水平数相等
(若三因素的水平数略有不同,应以主要处理因素的水平数为主,其它两因素的水平数可进行适当调整);②三因素间是相互独立的,均无交互作用;③各行、列、字母所得实验数据的方差齐。
(2)设计步骤:
①根据主要处理因素的水平数,确定基本型拉丁方,并从专业角度使另两个次要因素的水平数与之相同;②先将基本型拉丁方随机化,然后按随机化后的拉丁方阵安排实验。
可通过对拉丁方的任两列交换位置,或/及任
两行交换位置实现随机化;③规定行、列、字母所代表的因素与水平,通常用字母表示主要处理因素。
4、拉丁方实验设计数据处理的相关理论
拉丁方设计实验结果的分析,是将两个单位组因素与实验因素一起,按三因素实验单独观测值的方差分析法进行,但应假定3个因素之间不存在交互作
用。
将横行单位组因素记为A,直列单位组因素记为B,处理因素记为C,横
行单位组数、直列单位组数与处理数记为r,对拉丁方实验结果进行方差分析
的数学模型为:
--:
--:
:
(|=j=k=1,2,…,r)
式中:
卩为总平均数;&为第I横行单位组效应;5为第j直列单位组效应,
;为第k处理效应。
单位组效应。
通常是随机的,处理效应小通常是
冲斛=0
固定的,且有为随机误差,相互独立,且都服从N(0,
2)。
注意:
k不是独立的下标,因为I、j一经确定,k亦随之确定。
平方和与自由度划分式为:
SSr=SSA+SSB+SSC+SS
dfT=dfA+dfB+dfc+dfe
矫正数C=x2../r2
总平方和SSr=N2ij(k)-C
横行平方和SSa=2X2I./r-C
直列平方和SSb=舀2j/r-C
处理平方和SS:
=2X2(k)/r-C
误差平方和SSe=SSr-SSa-SSb-SSc
总自由度dfr=r2-1
横行自由度dfA=r-1
直列自由度dfB=r-1
处理自由度dfc=r-1
误差自由度dfe=df「dfA-dfB-dfc=(r-1)(r-2)
关于方差分析的基本步骤现归纳如下:
(一)计算各项平方和与自由度
(二)列出方差分析表,进行F检验。
(三)若F检验显著,则进行多重比较。
多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法:
包括q检验法和新复极差法)。
表示多重比较结果的方法有三角形法和标记字母法。
5拉丁方实验设计的具体实例
在畜牧、水产等动物实验中,如果要控制来自两个方面的系统误差,且实验动物的数量又较少,则常采用拉丁方设计。
下面结合具体例子说明拉丁方设计方法。
为了研究5种不同温度对蛋鸡产蛋量的影响,将5栋鸡舍的温度设为A、
B、C、D、E,把各栋鸡舍的鸡群的产蛋期分为5期,由于各鸡群和产蛋期的不
同对产蛋量有较大的影响,因此采用拉丁方设计,把鸡群和产蛋期作为单位组
设置,以便控制这两个方面的系统误差。
拉丁方设计步骤如下:
(一)选择拉丁方选择拉丁方时应根据实验的处理数和横行、直列单位组数先确定采用几阶拉丁方,再选择标准型拉丁方或非标准型拉丁方。
此例因实验处理因素为温度,处理数为5;将鸡群作为直列单位组因素,直列单位组数为5;将产蛋期作为横行单位组因素,横行单位组数亦为5,即实验处理数、直列单位组数、横行单位组数均为5,则应选取5>5阶拉丁方。
本例选取前面列出的第2个5X5标准型拉丁方,即:
(二)随机排列在选定拉丁方之后,如是非标准型时,则可直接按拉丁方中
的字母安排实验方案。
若是标准型拉丁方,还应按下列要求对横行、直列和实验处理的顺序进行随机排列。
33>标准型拉丁方:
直列随机排列,再将第二和第三横行随机排列
4>4标准型拉丁方:
随机选择4个标准型拉丁方中的一个,然后再将横行、直列及处理都随机排列。
下面对选定的5>5标准型拉丁方进行随机排列。
先从随机数字表(I)第22行、第8列97开始,向右连续抄录3个5位数,抄录时舍去“0”“6以上的数”和重复出现的数,抄录的3个五位数字为:
13542,41523,34521。
然后将上面选定的5X5拉丁方的直列、横行及处理按这3个五位数的顺序重新随机排列。
1、直列随机将拉丁方的各直列顺序按13542顺序重排。
2、横行随机再将直列重排后的拉丁方的各横行按41523顺序重排。
选择拉丁方
直列随机
横行随机
1
2
3
4
5
1
3
5
2
A
B
C
D
E
1
A
C
E
D
B
4
E
A
B
C
B
A
D
E
C
2
B
D
C
E
A
1
C
E
D
B
C
E
B
A
D
3
C
B
D
A
E
5
DAEBC
A
B
C
D
D
C
E
B
A
4
D
E
A
B
C
2
D
C
E
A
E
D
A
C
B
5
E
A
B
C
D
3
B
D
A
E
3、把5种不同温度按第三个5位数34521顺序排列即:
A=3,B=4,C=5,
D=2,E=1,也就是说,在拉丁方中的A表示第3种温度,B表示第4种温度等,依次类推。
从而得出5>5拉丁方设计,如表5.01所示。
表5.015种不同温度对鸡产蛋量影响的拉丁方设计
鸡
群
产蛋期
-一一
二二
三三
四
五
I
D
(2)
E
(1)
A
(3)
B(4)
C(5)
n
A(3)
C(5)
E
(1)
D
(2)
B(4)
川
E
(1)
A(3)
B
⑷
C(5)
D
(2)
IV
B(4)
D
(2)
C
(5)
E
(1)
A(3)
V
C(5)
B(4)
D
(2)
A(3)
E
(1)
注:
括号内的数字表示温度的编号
由表5.01可以看出,第一鸡群在第I个产蛋期用第2种温度,第二鸡群在第I
个产蛋期用第1种温度,等等。
实验应严格按设计实施。
6实验结果的统计分析
由前面拉丁方实验设计数据处理的相关理论我们可以得知:
将横行单位组因素记为A,直列单位组因素记为B,处理因素记为C,横行单位组数、直列单位组数与处理数记为r,对拉丁方实验结果进行方差分析
的数学模型为:
.:
/-=:
(|=j=k=1,2,…,r)
式中:
卩为总平均数;'为第I横行单位组效应;5为第j直列单位组效应,
:
为第k处理效应。
单位组效应⑴、°通常是随机的,处理效应2通常是为打=Ug
固定的,且有为随机误差,相互独立,且都服从N(0,
d2)o
注意:
k不是独立的下标,因为I、j一经确定,k亦随之确定
平方和与自由度划分式为:
SSr=SS\+SSB+SSC+SSedfT=dfA+dfB+dfc+dfe
例1的实验结果如表6.10所示
鸡群
产蛋期
横行和XI.
一一一
二二二
-三
四
五
I
D(23)
E(21)
A(24)
B(21)
C(19)
108
n
A(22)
C(20)
E(20)
D(21)
B(22)
105
川
E(20)
A(25)
B(26)
C(22)
D(23)
116
IV
B(25)
D(22)
C(25)
E(21)
A(23)
116
V
C(19)
B(20)
D(24)
A(22)
E(19)
104
直列和x.j
109
108
119
107
106
x..=549
表6.105种不同温度对母鸡产蛋量影响实验结果
(单位:
个)
注:
括号内数字为产蛋量
表6.11各种温度(处理)的合计
温度
A
B
C
D
E
X(k)
116
114
105
113
101
23.2
22.8
21.0
22.6
20.2
现对表6.10资料进行方差分析
1、计算各项平方和与自由度
矫正数
总平方和
横行平方和
2222
C=x../r=54915=12056.04
SSt=舀2j(k)-C=232+212+……+192-12056.04=12157-12056.04=100.96
222
SSa=2Xi./r-C=(108+105+…
2
…+104)/5-12056.04=27.36
直列平方和
222
SSb=舀j/r-C=(109+108+•
••…+106^)/5-12056.04=22.16
处理平方和
S$=2X2(k)/r-C=(1162+1142+-
2
••…+1012)/5-12056.04=33.36
误差平方和
SSe=SSt-SSa-SSb-SSc=100.96-33.36-27.36-22.16=18.08
总自由度
22
dfT=r-1=5-1=24
横行自由度
dfA=r-1=5-1=4
直列自由度
dfB=r-1=5-1=4
处理自由度
dfc=r-1=5-1=4
误差自由度
dfe=dfT-dfA-dfB-dfC=(r-1)(r-2)=(5-1)(5-2)=12
2、列出方差分析表,进行F检验
表6.10表6.11资料的方差分析表
变异来源
ss
df
ms
F
F0.05
F0.01
横行间
27.36
4
6.84
4.56*
3.26
5.41
直列间
22.16
4
5.54
3.69*
3.26
5.41
温度间
33.36
4
8.34
5.56**
3.26
5.41
误差
18.08
12
1.50
总变异
100.96
24
经F检验,产蛋期间和鸡群间差异显著,温度间差异极显著。
因在拉丁方设计中,横行、直列单位组因素是为了控制和降低实验误差而设置的非实验因素,
所以即使显著一般也不对单位组间进行多重比较。
下面对不同温度平均产蛋量间作进行多重比较。
3、多重比较
列出多重比较表,见表6.12。
表6.12不同温度平均产蛋量多重比较表(q法)
温度
平均数和
可町-20.2
耳灯-21
x⑷-22.6
和-22.8
A
23.2
3.0*
B
22.8
2.6*
2.2
0.6
D
22.6
2.4*
1.8
0.2
0.4
C
21.0
0.8
1.6
E
20.2
温度平均数标准误为:
S厂陋而=』3万=0,55
由dfe=12和k=2,3,4,5从q值表查得临界q值:
qo.05和qo.oi,并与一相乘得值,列于表6.13。
表6.13q值和LSR值表
厂
dfe
k
q0.05
q0.01
LSRd.05
LSR0.01
2
3.08
4.32
1.69
2.38
3
3.77
5.04
2.07
2.77
12
4
4.20
5.50
2.31
3.03
5
4.51
5.84
2.48
3.21
多重比较结果表明:
温度A、B、D平均产蛋量显著地高于E,即第3、4、2种温度的平均产蛋量显著高于第1种温度的平均产蛋量,其余之间差异不显著。
第1种和第5种温度平均产蛋量最低。
2)优缺点
(1)优点:
①拉丁方的行与列皆为配伍组,可用较少的重复次数获得较多的信息;②双向误差控制,使观察单位更加区组化和均衡化,进一步减少实验误差,比配伍组设计优越。
(2)缺点:
①要求三因素的水平数相等且无交互作用。
虽然当三因素的水平数
不等时,可以通过调整次要因素的水平数以满足设计的要求,但有时无法达到;况且因素间可能存在交互作用,故在实际工作中有一定的局限性;②当因素的水平数(Y较少时,易受偶然因素的影响。
为了提高精确度,可应用m个丫^拉丁方设计(可参照有关统计学书籍)。
③重复数等于处理数,灵活性
不强。
处理数多时,则重复过多。
处理数少时,重复少,则估计误差的自由度太小,精确度低。
因此,适用于5-8个品种或处理的实验。
如果在品种数或处理数少时,为了提高实验的精确度,可采用复拉丁方设计,即将一个拉丁方实验重复几次。
应当注意,在进行拉丁方实验时,某些单位组因素,如奶牛的泌乳阶段,实验因素的各处理要逐个地在不同阶段实施,如果前一阶段有残效,在后一阶段的实验中,就会产生系统误差而影响实验的准确性。
此时应根据实际情况,安排适当的实验间歇期以消除残效。
另外,还要注意,横行、直列单位组因素与实验因素间不存在交互作用,否则不能采用拉丁方设计。
参考文献
刘思衡.《作物育种与良种繁育学词典》.北京:
中国农业出版社,2001.
责任编辑:
中国水稻研究所科技信息中心、国家水稻数据中心
二、《南开大学法政学院学术论丛(下)》2002年S2期
三、舒华《心理与教育研究中的多因素实验设计》北京师范大学出版社1994-7-1
四、李云雁胡传荣《实验设计与数据处理》北京化学工业出版社2005
五、周概荣《应用统计方法辞典》北京中国统计出版社1992
六、韩于羹《应用数理统计》北京康空航天大学出版社1989
七、吴乙申《应用统计学》机械工业出版社1986
八、朱燕汤《数理统计》西北工业大学出版
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 拉丁 试验 设计方案 统计分析
![提示](https://static.bdocx.com/images/bang_tan.gif)