多元作业.docx
- 文档编号:26423475
- 上传时间:2023-06-19
- 格式:DOCX
- 页数:21
- 大小:171.31KB
多元作业.docx
《多元作业.docx》由会员分享,可在线阅读,更多相关《多元作业.docx(21页珍藏版)》请在冰豆网上搜索。
多元作业
姓名
评分
实验报告
课程名称:
多元统计分析
专业班级:
信息与计算科学082
学号:
指导教师:
彭诚
完成日期:
2011年5月25日
摘要
根据采集的数据变量,先判断相互之间的相关性,再运用因子分析的方法对护理设施和人们的健康问题进行评估和判定。
背景
Reference:
ThesedataarepartofthedataanalyzedinHowardL.Smith,NiellF.Piland,andNancyFisher,"AComparisonofFinancialPerformance,OrganizationalCharacter-istics,andManagementStrategyAmongRuralandUrbanNursingFacilities,JournalofRuralHealth,Winter1992,pp27-40.
Description:
ThedatawerecollectedbytheDepartmentofHealthandSocialServicesofthe
StateofNewMexicoandcover52ofthe60licensednursingfacilitiesinNewMexico
in1988.
变量
VariableNames:
BED=numberofbedsinhome
MCDAYS=annualmedicalin-patientdays(hundreds)
TDAYS=annualtotalpatientdays(hundreds)
PCREV=annualtotalpatientcarerevenue($hundreds)
NSAL=annualnursingsalaries($hundreds)
FEXP=annualfacilitiesexpenditures($hundreds)
RURAL=rural
(1)andnon-rural(0)homes
因子分析
原理:
因子分析是把每个原始变量分解成两个部分:
一部分是由所有变量共同具有的少数几个因子构成的,即所谓公共因素部分;另一部分是每个变量独自具有的因素,即所谓独特因素部分。
设有户个测量变量xl,x2,…,xP,每个变量可作如下分解:
xl=αllƒl+αl2ƒ2+…+αlmƒm+α1ε1
x2=α2lƒl+α22ƒ2+…+α2mƒm+α2ε1
…………………………………………………
xp=αplƒl+αp2ƒ2+…+αpmƒm+αpεp
上式为因子模型,其中ƒl,ƒ2,…,ƒm叫做公共因子,它们是在各个变量中共同出现的因子。
我们可以把它们看作高维空间中所张起的互相垂直的m个坐标轴。
εi(i=1,2,…,p)表示影响xi的独特因子。
αij做因子载荷,它是第i个变量在第j个主因子上的负荷,或者叫做第i个变量在第j个主因子上的权,它反映了第i个变量在第j主因子上的相对重要性。
αi为独特因子的载荷。
因子分析的基本问题就是要确定因子载荷。
建立因子模型
去处状态变量(附录)
相关系数矩阵:
BED
MCDAYS
TDAYS
PCREV
NSAL
FEXP
BED
1.0000000
0.5680006
0.8182959
0.8437752
0.5094241
0.4602559
MCDAYS
0.5680006
1.0000000
0.8116225
0.7070754
0.2541355
0.2583959
TDAYS
0.8182959
0.8116225
1.0000000
0.9030608
0.5153965
0.3047354
PCREV
0.8437752
0.7070754
0.9030608
1.0000000
0.5894065
0.4337859
NSAL
0.5094241
0.2541355
0.5153965
0.5894065
1.0000000
0.4550656
FEXP
0.4602559
0.2583959
0.3047354
0.4337859
0.4550656
1.0000000
相关性图表:
根据数据和图表可以很清楚的看出BED,MCDAYS,TDAYS,PCREV四者之间的相关性较强。
双因子分析:
Factor1
Factor2
SSloadings
2.666
1.578
ProportionVar
0.444
0.263
CumulativeVar
0.444
0.707
P值为0.0194小于0.05,满足要求。
两因子的累积贡献率为70.7%。
载荷矩阵:
Factor1
Factor2
BED
0.652
0.605
MCDAYS
0.820
0.125
TDAYS
0.937
0.342
PCREV
0.755
0.572
NSAL
0.333
0.586
FEXP
0.639
模型为:
高载荷指标
命名
因子一
M=年度医疗的住院天数
T=年度总患者天数
P=年总病人护理数百美元的收入
医疗条件因子
因子二
B=在家里的床位数目
P=年总病人护理数百美元的收入
N=年度护理的薪水
F=设施支出
人为投入条件因子
在第一因子中,M,T,P四项指标有较大的载荷,这些都从医院角度方面来反映护理状况的,所以称为医疗条件因子。
在第二个因子中,B,P,N,F有较大的载荷,这主要是从投入效益方面描述护理的,所以称为人为投入条件因子。
三因子分析:
Factor1
Factor2
Factor3
SSloadings
2.265
1.735
1.113
ProportionVar
0.378
0.289
0.185
CumulativeVar
0.378
0.667
0.852
三因子的累积贡献率已达85.2%,所以取前三个因子所对应的特征向量进行分析。
载荷矩阵:
Factor1
Factor2
Factor3
BED
0.786
0.357
0.231
MCDAYS
0.257
0.958
0.103
TDAYS
0.727
0.646
PCREV
0.781
0.508
0.190
NSAL
0.613
0.302
FEXP
0.259
0.958
模型为:
高载荷指标
命名
因子一
B=在家里的床位数目
T=年度总患者天数
P=年总病人护理数百美元的收入
人为投入条件因子
因子二
M=年度医疗的住院天数
时间因子
因子三
F=设施支出
外在设施因子
在第一因子中,B,T,P三项指标有较大的载荷,这些都从投入效益方面描述护理的,所以称为人为投入条件因子。
在第二个因子中,M有较大的载荷,这主要是病人住院时间来判断的,所以称为时间因子。
在第三个因子中,F有较大的载荷,这主要从设施支出方面来看待护理条件状况,所以称为外在设施因子。
得分矩阵(见附录)
线性模型
状态变量与得分矩阵因子建立线性回归模型:
状态变量与第一列得分矩阵因子的p值为0.2463,不构成一元线性回归。
状态变量与第二列得分矩阵因子的p值为0.0110小于0.05,满足要求。
EstimateStd.ErrortvaluePr(>|t|)
(Intercept)0.40690.19062.1350.0377*
RURAL-0.62240.2357-2.6410.0110*
模型:
状态变量与第二列得分矩阵因子之间负相关。
验证性因子分析
BED,MCDAYS,TDAYS三变量中进行单因子分析:
Factor1
SSloadings
2.326
ProportionVar
0.775
累积贡献率为77.5%
构成的载荷矩阵为:
在此单因子中各变量都具有较高的载荷。
PCREV,NSAL,FEXP三变量中进行单因子分析:
Factor1
SSloadings
1.515
ProportionVar
0.505
累积贡献率为50.5%。
累积贡献率偏低。
构成的载荷矩阵为:
在此单因子中各变量的载荷有差异。
PCREV,NSAL的载荷相对较高。
两组新变量之间的线性回归模型:
从“残差图”可以直观地看出残差的绝对数值都比较小,所描绘的点都在以0为横轴的直线上下随机散布,回归直线对各个观测值的拟合情况是良好的。
P值为3.11e-10小于0.05,满足要求。
一元线性回归模型:
结果总结
根据分析得BED,MCDAYS,TDAYS三者对调查起着普遍影响,且三者间的相关性较强。
而PCREV,NSAL,FEXP之间相对影响较弱些。
二因子分析中存在着医疗条件因子,人为投入条件因子较广泛的因素。
三因子分析中存在着人为投入条件因子,时间因子,外在设施因子较广泛的因素。
护理设施和人们的健康调查结果为偏好。
参考文献:
[1]
[2]统计建模与R软件(上下册)薛毅陈丽萍编著
[3]多元统计分析讲义信息与计算科学专用(英文版)
附录:
>txt0=read.table("C:
\\Users\\asus\\Music\\Desktop\\1.txt",header=T)
>txt0
BEDMCDAYSTDAYSPCREVNSALFEXPRURAL
124412838523521523053340
259155203916024594931
312028139221900630461150
412029141922354659063460
512023836317421536262250
6651802341053136224491
712030637222147440649981
8902143051402541739661
9961551698812195512600
1012013318811729322464421
11621481928896240912360
1212027442620987206633601
1311615432117655594642310
14591201647085192512801
158026128413089416611231
1612033837521453525752061
1780771337790198844431
1810020431818309415645851
1960972138872191416751
2011017828017881517356861
211202323361700446309070
2213531644223829748933510
23591631919424205117561
24609620212474380321230
252574834078200845311
2622151477636029128825431
2764912148782472944461
28621462048951236710640
2910825536617446593329871
3062144220616427824111
31901512862853465141970
3214610037521334685711980
33621741898082214312091
34305488394830251371
357921327811649290512790
36441271587850149812731
3712020842329035623635240
3810025530017532354725611
39491101778197281038741
4012320833622555605964021
41821141368459199519111
425816620510412224511221
4311022832316661402938931
446218322212406278422121
45866220011312372029591
4610232635514499386630061
4713515747124274748513440
48781542039327367212421
498322439012362399514841
50604821310644282011540
5154119144755620882451
5212021732720182443262740
>t.x=txt0[-7]
>t.x
>cor(t.x)
BEDMCDAYSTDAYSPCREVNSALFEXP
BED1.00000000.56800060.81829590.84377520.50942410.4602559
MCDAYS0.56800061.00000000.81162250.70707540.25413550.2583959
TDAYS0.81829590.81162251.00000000.90306080.51539650.3047354
PCREV0.84377520.70707540.90306081.00000000.58940650.4337859
NSAL0.50942410.25413550.51539650.58940651.00000000.4550656
FEXP0.46025590.25839590.30473540.43378590.45506561.0000000
>panel.hist<-function(x,...)
{
usr<-par("usr");on.exit(par(usr))
par(usr=c(usr[1:
2],0,1.5))
h<-hist(x,plot=FALSE)
breaks<-h$breaks;nB<-length(breaks)
y<-h$counts;y<-y/max(y)
rect(breaks[-nB],0,breaks[-1],y,col="cyan",...)
}
>pairs(t.x,panel=panel.smooth,cex=0.8,pch=19,bg="lightblue",diag.panel=panel.hist)
##two-factor
>t.fa2<-factanal(t.x,factors=2,method="mle")
>t.fa2
Call:
factanal(x=t.x,factors=2,method="mle")
Uniquenesses:
BEDMCDAYSTDAYSPCREVNSALFEXP
0.2090.3110.0050.1020.5450.583
Loadings:
Factor1Factor2
BED0.6520.605
MCDAYS0.8200.125
TDAYS0.9370.342
PCREV0.7550.572
NSAL0.3330.586
FEXP0.639
Factor1Factor2
SSloadings2.6661.578
ProportionVar0.4440.263
CumulativeVar0.4440.707
Testofthehypothesisthat2factorsaresufficient.
Thechisquarestatisticis11.74on4degreesoffreedom.
Thep-valueis0.0194
#three–factormodel
>t.fa3<-factanal(t.x,factors=3,method="mle")
>t.fa3
Call:
factanal(x=t.x,factors=3,method="mle")
Uniquenesses:
BEDMCDAYSTDAYSPCREVNSALFEXP
0.2010.0050.0520.0960.5290.005
Loadings:
Factor1Factor2Factor3
BED0.7860.3570.231
MCDAYS0.2570.9580.103
TDAYS0.7270.646
PCREV0.7810.5080.190
NSAL0.6130.302
FEXP0.2590.958
Factor1Factor2Factor3
SSloadings2.2651.7351.113
ProportionVar0.3780.2890.185
CumulativeVar0.3780.6670.852
Thedegreesoffreedomforthemodelis0andthefitwas0.0598
####ExplortoryFctorAnalysis
>scores<-factanal(t.x,factors=2,method="mle",scores="regression")$scores
>scores
Factor1Factor2
[1,]-0.0369218502.671355192
[2,]-0.350462992-0.898081034
[3,]0.6130531171.032205455
[4,]0.8697200680.960356708
[5,]0.4622588640.705472037
[6,]-0.122259167-0.777196477
[7,]0.5665107280.721088783
[8,]0.396620230-0.493228302
[9,]-0.863754855-0.259690114
[10,]-1.2180875001.157653403
[11,]-0.515047799-0.709122737
[12,]1.366994210-0.247012424
[13,]0.0223337280.907980790
[14,]-0.743750257-0.764307497
[15,]0.275087531-0.636934227
[16,]0.5972840270.713737203
[17,]-1.3956033650.289264687
[18,]0.1432929450.529926091
[19,]-0.323810785-0.779197381
[20,]-0.4229005641.186974422
[21,]0.505418632-0.015847124
[22,]1.1462001010.786295003
[23,]-0.529864554-0.682268826
[24,]-0.6890747900.003235437
[25,]-1.598837829-0.383652787
[26,]4.508532165-0.427147543
[27,]-0.6217963360.043219234
[28,]-0.378088839-0.807267072
[29,]0.7015382150.136667047
[30,]-0.094841249-1.242669310
[31,]0.331682545-0.924247453
[32,]0.4293523181.082982042
[33,]-0.481138564-0.866070046
[34,]-1.390529242-0.826365853
[35,]0.277944392-0.824702347
[36,]-0.749339184-0.884525314
[37,]0.7753302921.354400476
[38,]0.1614855470.093978273
[39,]-0.797737514-0.329674696
[40,]-0.0917655421.641454921
[41,]-1.225602386-0.066639283
[42,]-0.382838602-0.747565314
[43,]0.2812952590.271688447
[44,]-0.356650988-0.400035269
[45,]-0.8410923650.355351892
[46,]0.874888401-0.589273420
[47,]1.4126161130.656240715
[48,]-0.532148612-0.391462317
[49,]1.387325822-1.267561342
[50,]-0.446350373-0.447884197
[51,]-0.909428989-0.764942827
[52,]0.0029598421.153044277
#Loadingmatrixtobeusedforpre
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 作业