圆形分布资料统计分析.docx
- 文档编号:11785631
- 上传时间:2023-04-01
- 格式:DOCX
- 页数:27
- 大小:162.01KB
圆形分布资料统计分析.docx
《圆形分布资料统计分析.docx》由会员分享,可在线阅读,更多相关《圆形分布资料统计分析.docx(27页珍藏版)》请在冰豆网上搜索。
圆形分布资料统计分析
圆形分布资料统计分析
圆形分布统计方法是用于处理角度资料的一类分析方法。
在DPS数据处理系统中处理圆形分布的资料类型包括角度,昼夜时间及一年中的日期。
分析功能包括平均角计算及其假设检验、两样本比较、多样本比较、以及圆-圆比较等分析(如图1)。
图1圆形分布统计分析方法及处理数据类型选择界面
在处理圆形分布资料时,数据的输入格式必须注意:
系统约定,角度的度和分之间,时间的小时和分钟之间,一年中的天数的月份和日期之间,用小数点分开,3种圆形分布数据的输入格式如表1。
表1不同类型数据输入格式
角度
日期
时间
原始值
输入格式
原始值
输入格式
原始值
输入格式
35°05′
35.05
3月5日
3.05
8:
05
8.05
35°55′
35.55
3月15日
3.15
9:
30
9.3
35°50′
35.5
3月30日
3.3
9:
59
9.59
第1节平均角及其假设检验
设有n个角度α1,α2,…,αn,令
表示角的样本均数,简称平均角,其计算公式为:
角的标准差的公式为:
对于大样本的频数表资料,有:
rC=rC
式中C是校正系数,rC是r的校正值。
当一组数据中所有αi都等于同一数值,则这组数据无变异,s=0,而r=1,当一组数据中的αi均匀地分布在圆周上,则r=0,而s则因平均角不存在而无法计算,但当r趋向于0时,s趋向于无穷大。
r值的范围在0~1之间,s值的范围在0~∞无穷大之间,s可称为圆标准差(circularstandarddeviation)或平均角离差(meanangulardeviation),简称角离差(angulardeviation),通常以r表示角度资料的集中趋势(tendencyofconcentration)量度,s表示其离散趋势量度,本质上是一回事。
当基本参数计算处理后,我们就可进一步进行平均角均匀性检验。
检验是基于所有αi都是均匀分布在圆周的一个总体,其集中趋势量度值ρ=0,但在此总体中随机抽一个样本,所得ρ的估计值不一定为0,因此,当同一个样本资料算得平均角
与r后,此
是否意义(即是否来自ρ=0的总体)必须进行假设检验,称为均匀性检验(testofuniformity)。
此时,H0:
ρ=0,即为均匀分布,不存在平均角:
H1:
ρ≠0,即不是均匀分布,存在平均角。
均匀性检验方法是,根据样本大小n和算得的r或rC查表,如r(或rC)大于或等于表中界值,则P≤α,即在相应的水准上拒绝H0,表示存在集中趋势,平均角有意义。
如r小于表中界值,则P>α,即在α水准上不拒绝H0,认为是均匀分布,不存在集中趋势,故平均角无意义。
例1现有20名足月孕娠妇女的分娩时间如表2的第一列,试计算其平均分娩时间及其标准差,并检验其平均值是否有意义。
表220名妇女的分娩时间
分娩时间
输入格式
3:
50
3.5
23:
00
23.0
1:
40
1.4
2:
45
2.45
2:
40
2.4
5:
40
5.4
3:
00
3.0
4:
20
4.2
5:
00
5.0
5:
50
5.5
4:
15
4.15
9:
25
9.25
6:
50
6.5
3:
00
3.0
3:
30
3.3
1:
30
1.3
20:
20
20.2
19:
30
19.3
3:
15
3.15
1:
00
1.0
分析时,在DPS数据处理系统的电子表格中,按表2的第2列的数据格式输入,并定义成数据块,然后在菜单方式下选择“圆形分布资料统计分析”功能项,这时,系统就会出现如图1的用户选择界面。
在该界面中,分析方法选“平均角及其假设检验”,数据单位选“昼夜时间”,然后点击“确定”按钮,即可得到如下结果。
sinα均值=0.52669
cosα均值=0.48570
参数r=0.716453
r0.05=0.3846r0.01=0.4718
参数s=0.816631
平均=3:
09,标准差=3:
07
从结果可以看出,r>r0.01,即可认为,在α=0.01的水准上,认为存在集中趋势,此平均角有意义,平均分娩时间是3点零9分,标准差为3小时零7分。
例2某地4个年度克山病患者5679人,其急性发作的昼夜时间制成频数表(表3),试分析是否存在“好发”时间?
分析时,在DPS数据处理系统的电子表格中,按表3的第3列的输入发病时间的组中值,第4列输入各个时段的急性发病人数,并定义成数据块。
表3克山炳患者急性发作的昼夜时间分布
发病时间
组中值
输入格式
频数
0~
0:
30
0.30
107
1~
1:
30
1.30
139
2~
2:
30
2.30
134
3~
3:
30
3.30
205
4~
4:
30
4.30
218
5~
5:
30
5.30
303
6~
6:
30
6.30
418
7~
7:
30
7.30
376
8~
8:
30
8.30
501
9~
9:
30
9.30
306
10~
10:
30
10.30
359
11~
11:
30
11.30
213
12~
12:
30
12.30
321
13~
13:
30
13.30
219
14~
14:
30
14.30
199
15~
15:
30
15.30
239
16~
16:
30
16.30
234
17~
17:
30
17.30
273
18~
18:
30
18.30
298
19~
19:
30
19.30
196
20~
20:
30
20.30
172
21~
21:
30
21.30
106
22~
22:
30
22.30
70
23~
23:
30
23.30
73
然后在菜单方式下选择“圆形分布资料统计分析”功能项,这时,系统就会出现如图1的用户选择界面。
在该界面中,分析方法选“平均角及其假设检验”,数据单位选“昼夜时间”,然后点击“确定”按钮,即可得到如下结果。
sinα均值=0.12093
cosα均值=-0.21304
校正参数=1.00286
参数rc=0.245671
r0.05=0.0228r0.01=0.0279
参数s=1.675566
平均=10:
02,标准差=6:
24
从结果可以看出,rc>r0.01,即可认为,在α=0.01的水准上,认为存在集中趋势,此平均角有意义,即克山病的好发时间是10点零2分,标准差为6小时24分。
第2节两个或多个样本平均角的比较
两个或多个样本的平均角各自经均匀性检验,如果都拒绝H0,则可用Watson-William检验,判断它们是否来自总体平均角度都为ρ的总体,即比较平均角之间是否有显著差别。
1、两个样本平均角比较的t检验
设两样本的含量及r值分别为n1,r1,n2,r2。
H0:
ρ1=ρ2=ρ
H1:
ρ1≠ρ2
可用t检验:
上式中:
R1=n1r1
R2=n2r2
r为两组合并后算得的r值,当r在0.7以上时,本法效果较好,K为校正因子。
根据t值,计算自由度为N-2时的显著水平。
例3测定两组病人心向量的最大向量角(表4),现推断两组病人的平均角有无显著差异?
表4两组病人心向量最大向量角测量值
第一组
30
53.45
330
21.15
86.15
67.3
55
第二组
56.15
65
28.45
357.3
67.3
86.15
77.3
51.15
计算时,在DPS的电子表格里,按表4格式编辑、定义数据块,后在菜单方式下选择“圆形分布资料统计分析”功能项,这时,系统就会出现如图1的用户选择界面。
在该界面中,分析方法选“两样本平均角比较t测验”,数据单位选“方向角度”,然后点击“确定”按钮,即可得到如下结果。
平均a1=42°26’,参数r1=0.827824,r0.05=0.6419,r0.01=0.7693
平均a2=54°42’,参数r2=0.896473,r0.05=0.6020,r0.01=0.7250
t检验结果:
t=0.7170,df=13,p=0.4860
从结果可以看出,差异显著性水平p=0.4860,p>0.05,即可认为,两平均角相差无统计学差异。
2、两样本平均角比较的U2检验
这是一种非参数统计方法,效率较Watson-William法低,只有当两样本的平均角比较不具备t检验的条件时,可用本法,现结合一个例子,介绍其方法及步骤。
例4患A病的6个病人,晚上入睡时间分别为20:
30,21:
00,21:
15,21:
20,21:
45,22:
00;患B病的7个病人,入睡时间分别为21:
30,21:
45,22:
05,22:
15,22:
20,22:
45,22:
50,问两种病病人入睡时间的迟早有无差别?
解:
用U2检验法处理本资料,本法对均匀性及合并r大小等无特殊要求,故不必作平均角的均匀性检验及求合并r值。
H0:
两总体分布相同;
H1:
两总体分布不同。
(1)将两样本中的时间化为角度,再按照角度大小从上向下排列,但仍分两组,各自编序号i与j,排列结果见表5第2,5列。
(2)两组分别计算i/n1及j/n2,见表5第3,6列,A,B两组各有12个可标i或j的格子,而A组有6格填了i,有6个空格,B组有7格填了j,有5个空格,有空格的各行,也要计算i/n1,和j/n2,其i,j的决定方法为:
①i或j等于1以前各空格其值为0,例如表中第6列1~4行,j/n2的计算方法为0/7即等于0;②如i或j等于C之后有空格,这些空格在计算i/n1或j/n2时,i或j的值以貌取人C代之,如表中i=4与i=5之间有一空格行,它的i/n1为4/6=0.6667;③在i等于6后的各空格,其i/n1,为6/6=1,B组j/n2的空格处,其j/n2计算方法同上。
表5两样本比较的U2检验
A组
B组
d=i/n1-j/n2
d2
角度
i
i/n1
角度
j
j/n2
307.5°
1
0.1667
0
0.1667
0.0278
315°
2
0.3333
0
0.3333
0.1111
318.75°
3
0.5000
0
0.5000
0.2500
320°
4
0.6667
0
0.6667
0.4445
0.6667
322.5°
1
0.1428
0.5239
0.2745
326.5°
5
0.8883
326.5°
2
0.2857
0.5476
0.2999
330°
6
1
0.2857
0.7143
0.5102
1
331.25°
3
0.4286
0.5714
0.3286
1
333.75°
4
0.5714
0.4286
0.1837
1
335°
5
0.7143
0.2857
0.0816
1
341.25°
6
0.8571
0.1429
0.0204
1
342.5°
7
1
0
0
(3)计算各行的d值,置于第7列,d2置于第8列,并得
=4.8811,
=2.5302。
(4)用下式计算U2值:
本例得:
U2=6×7×[2.5302-(4.8811)2/13]/132=0.1733
根据U2查表,
=0.1941,U2<
,P>0.05,不拒绝H0,认为两组分布的差别无统计意义。
在DPS数据处理系统的支持下,进行两样本平均角比较的U2检验。
其操作步骤是分析前,先将观察数据编辑、定义成表6格式。
患A病病人组
20.3
21
21.15
21.2
21.45
22
患B病病人组
21.3
21.45
22.05
22.15
22.20
22.45
22.5
表6两样本平均角比较的U2检验的数据编辑、定义方式
然后在菜单方式下选择“圆形分布资料统计分析”功能项,这时,系统就会出现如图1的用户选择界面。
在该界面中,分析方法选“两样本平均角比较的U2检验”,数据单位选“昼夜时间”,然后点击“确定”按钮,即可得到如下结果。
排序秩次
No.
观察值
组别
组1
组2
1
20.30000
1
0.166667
0.000000
2
21.00000
1
0.333333
0.000000
3
21.15000
1
0.500000
0.000000
4
21.20000
1
0.666667
0.000000
5
21.30000
2
0.666667
0.142857
6
21.45000
21
0.833333
0.285714
7
22.00000
1
1.000000
0.285714
8
22.05000
2
1.000000
0.428571
9
22.15000
2
1.000000
0.571429
10
22.20000
2
1.000000
0.714286
11
22.45000
2
1.000000
0.857143
12
22.50000
2
1.000000
1.000000
统计量U的平方=0.1733,差异不显著
计算结果可直接计算出U2并判断是否显著。
该例中的的U2=0.1733,差异不显著。
第3节多个样本平均角的比较
仍用Watson-William法,计算过程与两样本时相仿,但必须求F值。
设有K个样本,以ni,ri,Ri分别表示第i个样本的有关统计量。
H0:
ρ1=ρ2=…=ρk
H1:
ρi不完全相等。
df1=k-1,df2=N-k。
式中K为校正因子,N=
,R为合并的R值。
查方差分析用F值表(附表五)作出统计推断。
本法也要求各平均角必须经均匀性检验认为有意义才能进行比较,并且合并的r须大于0.45,效果才较满意。
例5在例3中,如果除甲乙两组病人之外,还有一个样本丙,共6个观察值:
330°,345°,0°,15°,30°和20°。
现推断这3组病人的平均角有无显著差异?
第一组
30
53.45
330
21.15
86.15
67.3
55
第二组
56.15
65
28.45
357.3
67.3
86.15
77.3
51.15
第三组
330
345
0
15
30
20
表7三组病人心向量最大向量角测量值
计算时,在DPS的电子表格里,按表7格式编辑、定义数据块,后在菜单方式下选择“圆形分布资料统计分析”功能项,这时,系统就会出现如图1的用户选择界面。
在该界面中,分析方法选“多样本平均角比较”,数据单位选“方向角度”,然后点击“确定”按钮,即可得到如下结果。
平均a1=42°26,参数r1=0.827824,r0.05=0.6419,r0.01=0.7693
平均a2=54°42,参数r2=0.896473,r0.05=0.6020,r0.01=0.7250
平均a3=3°30,参数r3=0.935671,r0.05=0.6910,r0.01=0.8224
F检验结果:
F=5.3783,df=2,18,p=0.0148。
从结果可以看出,差异显著性水平p=0.0148,p<0.05,即可认为,3组平均角之间有显著差异。
第4节圆-圆相关
当观察到n对角度数据(αi,βi)时,可以研究α与β之间的相关性,称为圆-圆相关性(angular-angularcorrelation)。
其计算方法与圆形统计量是否均匀分布有关。
当α与β都呈均匀分布时,可用H检验法,如α与β中至少有一个为非均匀分布,就只能计算秩相关。
1、H检验
适用于均匀分布的角度资料,其相关系数的计算公式有:
δi=αi-βi
例6设有两个均匀分布的成对角度资料,试求相关系数并作统计检验。
在DPS数据处理系统中,先按表8方式编辑、定义数据块。
表8圆-圆相关分析数据格式
α
β
120
60
135
90
210
135
150
150
195
210
240
240
300
255
315
300
然后在菜单方式下选择“圆形分布资料统计分析”功能项,这时,系统就会出现如图1的用户选择界面。
在该界面中,分析方法选“圆-圆相关H检验”,数据单位选“方向角度”,然后点击“确定”按钮,即可得到如下结果。
No.
δ
φ
sin(δ)
cos(δ)
sin(φ)
cos(φ)
1
60°
180°
0.866025
0.500000
0.000000
-1.000000
2
45°
225°
0.707107
0.707107
-0.707107
-0.707107
3
75°
345°
0.965926
0.258819
-0.258819
0.965926
4
0°
300°
0.000000
1.000000
-0.866025
0.500000
5
-15°
405°
-0.258819
0.965926
0.707107
0.707107
6
0°
480°
0.000000
1.000000
0.866025
-0.500000
7
45°
555°
0.707107
0.707107
-0.258819
-0.965926
8
15°
615°
0.258819
0.965926
-0.965926
-0.258819
相关系数=0.86428
为正相关
H统计量=2.44457
显著水平p<0.01
从计算结果得知,其显著水平p<0.01,因此可以推断相关极显著。
2、圆-圆秩相关
当n对圆形分布资料中的α和β中的一个或两个不是均匀分布时,H检验不适用,此时须用秩相关,有关公式有:
其中j,k分别为αi和βi的秩次,
其中P为概率值。
例7现有6对圆分布资料,试用秩相关检验他们是否存在相关性。
在DPS数据处理系统中,先按表9方式编辑、定义数据块。
表9圆-圆秩相关分析数据格式
α
β
61.3
82.36
86.36
239.55
29.42
92.66
44.3
37
60.15
248.18
61
352.15
然后在菜单方式下选择“圆形分布资料统计分析”功能项,这时,系统就会出现如图1的用户选择界面。
在该界面中,分析方法选“圆-圆秩相关检验”,数据单位选“方向角度”,然后点击“确定”按钮,即可得到如下结果。
No.
秩次a
秩次b
角度a
角度b
δ
φ
1
1
1
60°
60°
0°
120°
2
2
3
120°
180°
-60°
300°
3
3
2
180°
120°
60°
300°
4
4
6
240°
360°
-120°
600°
5
5
4
300°
240°
60°
540°
6
6
5
360°
300°
60°
660°
相关系数=0.44096
为正相关
p=0.61342
从计算结果得知,其显著水平p=0.6134,因此可以推断相关不显著。
第5节圆-线相关
当观测到的成对数据中,一个是圆形分布,另一个是线性量时,也可研究两者间的相关性,称为圆-线相关(angular-linearcorrelation)。
其公式为:
(1)
(2)
(3)
(4)
(5)
其中y为线性量,α为角度;ryc表示y与cosα的简单相关系数;rys表示y与sinα的简单相关系数;rsc表示sinα与cosα的简单相关系数。
计算时,先求出角度资料的sinα与cosα,然后由
(1),
(2),(3)求出3个简单相关系数ryc,rys,rsc,再代入(4)式,求得r2,其中r即角度与线性量之间的相关系数,它是否来自ρ=0的总体,可由(5)式求得x2值后,计算其显著水平,当显著水平p<0.05时,则拒绝H0,认为总体相关系数不为0,也即存在圆-线相关。
例8研究某指标与日期之间的关系,得到观察结果如表10,试检验这两个变量是否存在相关性。
在DPS数据处理系统中,先按表10方式编辑、定义数据块。
表10圆-圆秩相关分析数据格式
α
Y
1.3
1.5
4.1
1.6
4.3
1.7
6.2
2
8.3
2.1
9.2
1.8
10.3
1.4
11.3
1.2
然后在菜单方式下选择“圆形分布资料统计分析”功能项,这时,系统就会出现如图1的用户选择界面。
在该界面中,分析方法选“圆-线相关”,数据单位选“年度日期”,然后点击“确定”按钮,即可得到如下结果
No.
角度
y
sin(a)
cos(a)
1
29.589°
1.500000
0.493776
0.869589
2
98.630°
1.600000
0.988678
-0.150055
3
118.356°
1.700000
0.880012
-0.474951
4
168.658°
2.000000
0.196673
-0.980469
5
238.685°
2.100000
-0.854322
-0.519744
6
258.411°
1.800000
-0.979614
-0.200891
7
298.849°
1.400000
-0.875892
0.482508
8
329.425°
1.200000
-0.508671
0.860961
相关系数=0.87443
卡方=6.11704
df=2
p=0.04696
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 圆形 分布 资料 统计分析