Logistic回归分析及应用PPT文件格式下载.ppt
- 文档编号:15553800
- 上传时间:2022-11-04
- 格式:PPT
- 页数:76
- 大小:1.76MB
Logistic回归分析及应用PPT文件格式下载.ppt
《Logistic回归分析及应用PPT文件格式下载.ppt》由会员分享,可在线阅读,更多相关《Logistic回归分析及应用PPT文件格式下载.ppt(76页珍藏版)》请在冰豆网上搜索。
y取值是二值或多项分类8表3肺癌与危险因素的调查分析例号是否患病性别吸烟年龄地区11103002101461300035130000261注:
是否患病中,0代表否,1代表是。
性别中1代表男,0代表女,吸烟中1代表吸烟,0代表不吸烟。
地区中,1代表农村,0代表城市。
9表4配对资料(1:
1)对子号病例对照x1x2x3x1x2x311301012031130301202010222000注:
X1蛋白质摄入量,取值:
0,1,2,3X2不良饮食习惯,取值:
0,1,2,3X3精神状况,取值:
0,1,210LogisticLogistic回归回归-Logistic-Logistic回归与回归与多重多重线性回归联系与区别线性回归联系与区别联系联系:
用于分析多个自变量与一个因变量的关用于分析多个自变量与一个因变量的关系,目的是矫正混杂因素、筛选自变量和更系,目的是矫正混杂因素、筛选自变量和更精确地对因变量作预测等。
精确地对因变量作预测等。
区别区别:
线性模型中因变量为连续性随机变量,线性模型中因变量为连续性随机变量,且要求呈正态分布且要求呈正态分布.Logistic.Logistic回归因变量的回归因变量的取值仅有两个,不满足正态分布。
取值仅有两个,不满足正态分布。
1133、Logistic回归模型l令令:
y=1发病(阳性、死亡、治愈等)发病(阳性、死亡、治愈等)ly=0未发病(阴性、生存、未治愈等)未发病(阴性、生存、未治愈等)l将发病的概率记为将发病的概率记为P,它与自变量它与自变量xx11,xx22,xxpp之间的之间的Logistic回归模型为:
回归模型为:
l可知,不发病的概率为:
可知,不发病的概率为:
l12经数学变换得:
定义:
为Logistic变换,即:
134、回归系数i的意义流行病学的常用指标优势比(oddsratio,OR)或称比数比,定义为:
暴露人群发病优势与非暴露人群发病优势之比。
即Xi的优势比为:
14故对于样本资料OR=exp()95%置信区间为:
可见是影响因素Xi增加一个单位所引起的对数优势的增量,反映了其对Y作用大小。
如果要比较不同因素对Y作用大小,需要消除变量量纲的影响,为此计算标准化回归系数155.假设检验
(1)回归方程的假设检验H0:
所有H1:
某个计算统计量为:
G=-2lnL,服从自由度等于n-p的分布
(2)回归系数的假设检验H0:
H1:
计算统计量为:
Wald,自由度等于1。
16
(二)Logistic回归类型及其实例分析1、非条件Logistic回归当研究设计为队列研究、横断面研究或成组病例对照研究时,可以用非条件Logistic回归。
17实例1某研讨究者调查了某研讨究者调查了3030名成年人,记录名成年人,记录了同肺癌发病的有关因素情况了同肺癌发病的有关因素情况,数据见表数据见表44。
其中是否患病中。
其中是否患病中,0,0代表否代表否,11代表是;
性别中代表是;
性别中11代表男代表男,00代表女;
吸烟中代表女;
吸烟中11代表吸烟代表吸烟,00代表不吸烟;
地区中代表不吸烟;
地区中,1,1代表农代表农村村,0,0代表城市。
试分析各因素与肺代表城市。
试分析各因素与肺癌间的关系。
癌间的关系。
18表5肺癌与危险因素的调查分析例号是否患病性别吸烟年龄地区11103002101461300035130000261注:
19SPSS操作步骤:
Analyze-Regression-BinaryLogistic-Dependent框(y)-Covariates框(x1,x2,)-ok非条件Logistic回归SPSS操作步骤:
202122结果表明,性别,吸烟,年龄三个因素都与肺癌有关.由于在对某一因素进行单因素分析时没有控制其它因素的干扰,因此结果不可靠.单因素分析的结果23多因素分析的结果2425由上最大似然估计分析知因素X2(吸烟),X3(年龄)对肺癌的发生有影响。
所得的回归方程为:
Logit(P)=-9.7544+2.5152X1+3.9849X2+0.1884X3-1.3037X4.262.条件logistic回归分析配对设计的类型:
1:
1、1:
m、n:
m(可采用分层COX模型来拟合)。
例如:
某市调查三种生活因素与胃癌的关系,资料见表5。
27表6配对资料(1:
0,1,228配对Logistic回归SPSS操作步骤:
Analyze-Survival-COXRegression-Time框(outcome)-Status框(Status)-DefineEvent:
Singlevalue1:
continue-Covariates框(x1、x2、x3)-Strata框(id)-Options-atlaststep-ok29303132333435363、逐步Logistic回归分析(11)向前法)向前法(forwardselection)(forwardselection)开始方程中没有变量,自变量由少到多一个一个引入回归方程。
按自变量对因变量的贡献(P值的大小)由小到大依次挑选,变量入选的条件是其P值小于规定进入方程的P界值Enter,缺省值P(0.05)。
37
(2)后退法(backwardselection)开始变量都在方程中,然后按自变量因变量的贡献(P值的大小)由大到小依次剔除,变量剔除的条件是其P值小于规定的剔除标准Remove,缺省值p(0.10)。
38(3)逐步回归法逐步引入-剔除法(stepwiseselection)前进前进逐步引入-剔除法是在前进法的思想下,考虑剔除变量,因此有两个p界值Enter,Remove。
39无论是条件还是非条件Logistic回归,在多变量分析时均可以采用逐步回归方法,实现的方法是:
在model后加选项:
/selection=forward、backward或stepwise再给出SLE,SLS的界值。
调试法:
P从大到小取值0.5,0.1,0.05,一般实际用时,SLE,SLS应多次选取调整40解释设第i个因素的回归系数为bi,表示当有多个自变量存在时,其它自变量固定不变的情况下,自变量Xi每增加一个单位时,所得到的优势比的自然对数。
也就是其它自变量固定不变的情况下,自变量Xi每增加一个单位时,影响因变量Y=0发生的倍数。
当bi0时,对应的优势比(oddsratio,记为ORi):
ORi=exp(bi)1,说明该因素是危险因素;
当bi0时,对应的优势比ORi=exp(bi)1,说明该因素是保护因素。
41在本例中不良饮食习惯X2,取值:
0、1,2、3,b=1.2218,OR=3.393,表示不良饮食习惯是危险因素;
精神状况X3,取值:
0、1、2,b=2.2947,OR=9.922,表示精神状况是危险因素。
42SPSS无论是条件还是非条件Logistic回归,在多变量分析时均可以采用逐步回归方法,实现的方法是:
在method后加选项:
Enter:
所有变量一次全部进入方程。
Forward:
逐步向前法Backward:
后退法变量移出方程所采取的检验方法:
Conditional;
LR;
Ward(尽量不用)4344二分类二分类LogisticLogistic回归回归methodmethod中文名称中文名称剔除依据剔除依据EnterEnter全部进入全部进入Forward:
conditForward:
conditionalional向前逐步向前逐步条件参数估计似然比条件参数估计似然比Forward:
LRForward:
LR向前逐步向前逐步最大偏似然估计似然比最大偏似然估计似然比Forward:
WaldForward:
Wald向前逐步向前逐步WaldWald统计量统计量Backward:
condiBackward:
conditionaltional向后逐步向后逐步条件参数估计似然比条件参数估计似然比Backward:
LRBackward:
LR向后逐步向后逐步最大偏似然估计似然比最大偏似然估计似然比Backward:
WaldBackward:
Wald向后逐步向后逐步WaldWald统计量统计量45SPSS软件实现方法FileFileOpenOpen相应数据相应数据(已存在已存在)AnalyzeRegressionRegressionBinaryBinaryLogisticLogisticDependent(y)Dependent(y)CovariatesCovariates(自变量)自变量)MothodMothod(逐步回归方法逐步回归方法)Specifymodel(Specifymodel(单因素或多因素)单因素或多因素)save(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Logistic 回归 分析 应用