关于疾病研究问题的数学模型.docx
- 文档编号:12028295
- 上传时间:2023-04-16
- 格式:DOCX
- 页数:25
- 大小:283.66KB
关于疾病研究问题的数学模型.docx
《关于疾病研究问题的数学模型.docx》由会员分享,可在线阅读,更多相关《关于疾病研究问题的数学模型.docx(25页珍藏版)》请在冰豆网上搜索。
关于疾病研究问题的数学模型
关于疾病研究问题的数学模型
摘要
现在与50年前相比,生出一个活泼健康的孩子越来像一个复杂的系统工程,需要精心运作每一个细节,到底是什么原因威胁胎儿的健康也是医学上一个非常复杂的问题。
本模型就题目给出的鼻炎家族史、主(被)动吸烟等12个因素的相关数据,建立多分类条件Logistic回归分析数学模型,利用SPSS软件包拟合出Sig-显著性(P)的值,再利用逐步回归中的后退法,把所有的变量引入模型,然后逐次把Sig值最大并且Sig>(=0.05)的变量剔除出模型,每次只剔除一个变量,每次剔除一个变量后重新拟合模型,按照上述剔除标准继续剔除变量,直至模型中的所有变量的Sig<0.05为止。
最后所剩Sig值<0.05所对应的因素:
鼻炎家族史,孕期用药,先兆早产,剖宫产和孕期营养即为诱发胎儿疾病的主要影响因素。
关键词:
疾病Logistic回归分析SPSS软件包Sig(P)值
逐步回归后退法
一、
问题重述
世界卫生组织最近发布的资料显示,与50年前相比,人们的生殖能力明显降低了,生一个活泼健康的孩子,越来越像一个复杂的系统工程,需要精心运作每一个细节,不敢稍有松懈麻痹,到底是什么原因威胁胎儿的健康也是医学上一个非常复杂的问题。
本题就胎儿的某种疾病影响因素做了详细的调查与记录见附表1,根据附表1中的数据,利用统计学知识判断到底该疾病的诱发因素有哪些?
二、模型分析
考虑到题目给出了病例组与对照组,且给出的多个影响因素为分类变量,不能使用线性回归模型,因此,考虑使用Logistic回归分析数学模型进行了统计分析。
在考虑用逐步后退法分析出该疾病的诱发因素。
Logistic回归分析数学模型是专门用来分析疾病与危险因素间联系的一种统计方法。
假设影响因素对疾病的影响是独立的,利用SPSS软件包输入数据,拟合出Sig值,Sig值为结果可信程度的一个递减指标(即将观察结果认为有效即具有总体代表性的犯错概率)。
本模型中取=0.05(在许多研究领域,0.05的Sig值通常被认为是可接受错误的边界水平)。
当Sig<时,就认为此Sig值对应的因素即为该疾病的诱发因素。
三、符号说明
y:
患病情况(0=未患病1=患病)
x1:
鼻炎家族史(0=无1=有)
x2:
主(被)动吸烟(0=无1=有)
x3:
孕早期病毒感染(0=无1=有)
x4:
孕期用药(0=无1=有)
x5:
先兆早产(0=无1=有)
x6:
流产史(0=无1=有)
x7:
早产(0=无1=有)
x8:
剖宫产(0=无1=有)
x9:
孕期营养(0=一般1=好)
x10:
孕期活动量(0=小1=一般)
x11:
出生体重(<2.5=12.5~4=2≥4=3)
x12:
妊娠反应(轻1中2重3)
P:
在m个自变量的作用下患病的概率
:
回归系数(j=0,1…12)
Si:
Sig的检验值
Smax:
Si的最大值
S:
Sig的临界值Sig=0.05
Sig:
“显著性”,当0.01 赞同 四、模型假设 1、影响因素对疾病的影响是独立的。 2、各个因素的有无影响程度大小不考虑。 3、除这12种因素外有可能引起该病的因素不考虑。 五、模型建立 1、y=1患病;y=0未患病;自变量 在m个自变量的作用下患病的概率记作: (1) 即: (2) 将P作logit转换为 ,有 (3) 2、建立似然函数模型: (4) 通过 ,求出 ,代入(3)得logistic回归方程同时也可求出Sig值。 m=12,j=(1,2…200) 3、逐步回归的后退法: <1>根据原始数据由SPSS软件得出多元线性回归结果; <2>找到最大的Sig值Smax与临界值S=0.05比较,如果Smax>S,剔除Smax对应变量,重新根据余下的变量数据由SPSS软件再得出多元线性回归结果,再返回 (1),否则进入(3)。 <3>如果Smax 根据上面步骤,可以简单绘出流程如下: 六、模型求解: 借助于SPSS统计软件完成 具体的过程如下: DataView: (数据窗口)(见附表1) VariableView: (变量窗口) 再如下: Analyze→Regression→Linear 再如下: Linear→dependent: y independent: x1-x12 然后单击OK,得: 以上的Coefficient,为回归参数表。 再根据逐步回归的后退法,得: 孕早期病毒感染的Sig值最大0.905>0.05,剔除。 孕期活动量Sig值最大为0.858>0.05,剔除 主(被)动吸烟Sig值最大为0.616>0.05,剔除。 早产的Sig值最大为0.397>0.05,剔除。 流产史的Sig值最大为0.192>0.05,剔除 妊娠反应的Sig值最大为0.186>0.05,剔除 出身体重Sig值最大为0.180>0.05,剔除 所有变量的Sig值<0.05,故最终回归模型 Logit(P)=0.111+0.144x1+0.184x4+0.400x5+0.186x8+0.188x9 综上知: : 鼻炎家族史,孕期用药,先兆早产,剖宫产和孕期营养为诱发胎儿疾病的主要影响因素。 七、模型检验 方法1: 根据t的检验方法,试验证,如下: 用SPSS软件得: 由于Sig的值都小于0.05,从而验证正确。 方法2: 判别分析法与回归分析的最优判别函数是一致的。 用Fisher判别法的判别函数经计算得: y=0.0051x1+0.0009x2+0.0002x3+0.0052x4+0.0116x5+0.0025x6+0.0033x7+0.0051x8+0.0047x9-0.0004x10-0.0035x11+0.0016x12 判别系数大小前五的为: x1x4x5x8x9 与上模型计算结果一致。 八、模型应用 可以用来预测在不同的自变量情况下,发生某病或某种情况的主要影响因素。 适用于与本题类似的医学研究问题,也适用于其他情况。 在生物学中生物呈s增长的相关研究问题也适用。 如基于Logistic回归服装品牌忠诚度影响因素分析等。 九、模型评价 在影响结果的混杂因素比较多的时候,难以满足均衡可比的要求,且像本题给出各因素的定性数据,不能直接利用线性回归进行分析,因而Logistic回归模型更为适合。 利用SPSS软件包计算方便、精准,易于判断、理解,但是,适用本模型的前提是自变量对疾病的影响是独立的,实际情况有时并不如此,就需利用其他方法进行降维处理,再利用本模型进行统计分析。 由这种模型,根据Sig的值,也可得到最重要的影响因素,依次次要的因素等。 如本题: 先兆早产Sig值最小,为最重要的,次要的为孕期用药,剖宫产和孕期营养,再为鼻炎家族史 十、参考文献 十一、附录 附表1: 病例组: 患儿代码 鼻炎家族史 主(被)动吸烟 孕早期病毒感染 孕期用药 先兆早产 流产史 早产 剖宫产 孕期营养 孕期活动量 出生体重(kg) 妊娠反应 无=0有=1 无=0有=1 无=0有=1 无=0有=1 无=0有=1 无=0有=1 无=0有=1 无=0有=1 一般0好1 小0一般1 <2.5=12.5~4=2≥4=3 轻1中2重3 1 1 1 1 1 0 1 0 1 0 1 2 1 2 0 0 0 0 0 1 0 1 1 1 2 2 3 0 1 1 0 0 0 0 1 0 1 2 1 4 0 1 1 1 0 0 0 0 0 1 2 1 5 0 1 0 0 1 1 0 1 1 1 2 1 6 1 1 0 1 0 1 0 1 1 0 2 3 7 0 1 0 0 0 1 0 0 0 1 2 3 8 0 1 0 1 1 0 1 1 1 0 2 2 9 0 1 0 0 0 0 0 0 0 1 2 1 10 0 0 0 1 1 0 0 0 1 0 2 1 11 1 0 0 0 1 0 0 1 1 0 2 1 12 0 0 1 1 1 1 0 1 1 0 2 2 13 1 1 0 0 0 1 0 0 0 1 3 1 14 1 0 0 1 1 0 0 1 1 0 2 3 15 1 0 0 1 0 0 0 0 1 1 2 1 16 1 1 1 0 1 0 0 1 1 0 2 2 17 0 1 1 1 0 0 0 0 0 1 2 2 18 0 0 0 1 0 0 0 0 0 1 2 1 19 0 1 1 1 0 0 0 0 1 1 3 3 20 0 0 0 0 1 1 0 0 0 1 2 1 21 0 1 0 1 1 0 0 1 1 1 2 1 22 1 0 0 0 0 0 0 1 0 1 2 1 23 0 0 0 0 0 0 0 1 0 1 2 3 24 1 0 0 1 1 1 0 1 1 1 2 1 25 0 1 1 1 1 0 0 1 0 0 2 2 26 0 0 1 1 0 1 0 1 0 1 2 3 27 1 0 0 1 0 0 0 0 1 1 2 1 28 1 0 1 1 0 0 0 1 1 1 2 2 29 0 0 0 1 1 0 1 0 1 0 2 1 30 1 0 1 1 1 0 0 1 1 0 2 1 31 0 1 1 0 0 1 0 1 1 1 2 3 32 1 1 1 1 0 1 0 1 1 0 2 1 33 1 1 0 1 0 0 1 1 1 1 2 1 34 1 1 0 1 0 0 1 1 1 1 2 1 35 0 0 0 0 1 0 0 1 1 0 1 3 36 1 0 1 1 0 1 0 0 0 1 2 1 37 0 1 0 0 0 0 0 1 0 1 2 1 38 0 1 0 0 1 0 0 1 1 1 2 1 39 1 1 1 1 0 0 0 0 0 0 2 3 40 0 0 0 0 0 0 1 1 1 1 2 1 41 1 0 0 1 1 0 0 0 0 1 3 2 42 1 1 0 1 0 1 0 1 0 0 2 3 43 1 1 1 1 1 1 0 1 0 1 2 1 44 0 1 1 0 1 0 0 1 1 0 2 3 45 1 0 1 1 0 0 0 0 1 0 2 1 46 0 0 0 1 0 1 1 1 0 0 1 2 47 1 0 1 1 1 1 0 1 0 0 3 1 48 1 0 1 1 1 0 0 1 1 1 2 1 49 0 0 0 0 0 1 0 0 0 0 2 3 50 0 1 0 1 0 1 0 1 1 1 2 1 51 1 0 0 1 0 0 0 1 0 1 2 2 52 0 0 1 1 0 1 1 0 1 0 2 3 53 1 1 1 0 1 0 0 1 0 1 2 1 54 1 1 0 1 0 0 0 1 0 0 2 2 55 0 0 0 1 0 0 0 1 1 1 2 1 56 0 0 0 0 1 0 0 0 1 1 2 1 57 0 0 0 1 0 0 0 1 0 1 2 2 58 1 1 0 1 1 0 0 1 1 1 2 1 59 1 1 0 0 0 0 0 0 0 0 2 1 60 0 0 1 1 0 1 0 1 0 1 3 1 61 0 0 1 1 1 1 0 1 1 1 2 3 62 0 0 1 0 0 1 0 1 1 1 2 1 63 0 1 0 0 1 0 1 0 0 0 2 1 64 0 1 0 0 1 0 0 1 1 1 2 1 65 0 0 0 1 0 0 0 1 0 1 2 2 66 1 1 0 1 1 0 0 0 1 0 2 2 67 1 1 0 0 0 1 0 1 1 1 2 1 68 1 1 0 1 0 0 0 1 1 1 2 3 69 0 1 1 0 1 1 0 0 1 1 2 1 70 0 1 0 1 0 0 0 0 1 1 2 1 71 0 1 1 0 1 0 0 1 1 1 2 1 72 0 1 0 1 0 0 0 0 1 1 2 3 73 1 1 0 0 0 1 0 0 1 1 2 1 74 0 1 1 1 0 0 0 0 1 1 2 1 75 1 1 0 0 1 0 0 1 0 0 2 1 76 0 0 1 1 0 1 0 1 0 1 2 2 77 0 1 0 0 0 0 0 0 1 1 2 1 78 1 1 0 0 1 1 1 1 1 0 2 1 79 1 0 1 1 0 0 0 1 0 1 2 2 80 0 1 0 0 1 1 0 0 1 0 2 1 81 1 1 1 0 0 0 0 1 1 0 2 2 82 0 0 0 1 0 0 0 0 0 1 2 1 83 0 1 0 0 1 0 0 1 1 1 2 3 84 1 1 0 0 0 1 0 1 1 1 2 1 85 0 0 1 1 0 1 0 0 0 0 2 1 86 0 1 0 1 1 1 0 1 1 1 2 3 87 1 1 1 1 0 0 0 1 1 1 2 1 88 1 1 1 1 0 0 0 0 0 1 2 1 89 0 1 0 0 0 1 0 1 1 1 2 1 90 1 0 1 0 0 1 0 1 0 0 2 1 91 1 0 0 1 0 0 0 1 0 1 2 1 92 0 0 0 0 1 0 0 0 1 1 2 3 93 0 0 1 1 0 1 0 0 1 1 2 3 94 1 1 1 1 1 0 0 0 0 1 2 1 95 1 1 1 1 0 0 0 0 0 1 2 1 96 0 1 0 0 0 0 0 1 0 1 2 3 97 1 0 1 0 0 0 0 1 1 0 2 1 98 1 0 0 1 0 1 0 1 1 1 2 1 99 0 0 0 0 0 1 0 1 1 1 3 3 100 0 0 1 1 0 1 0 0 1 1 2 1 对照组: 儿童代码 鼻炎家族史 主(被)动吸烟 孕早期病毒感染 孕期用药 先兆早产 流产史 早产 剖宫产 孕期营养 孕期活动量 出生体重(kg) 妊娠反应 无=0有=1 无=0有=1 无=0有=1 无=0有=1 无=0有=1 无=0有=1 无=0有=1 无=0有=1 一般0好1 小0一般1 <2.5=12.5~4=2≥4=3 轻1中2重3 1 0 1 0 0 0 0 0 1 0 1 2 1 2 0 0 1 1 0 0 0 0 1 1 2 1 3 0 0 1 1 1 0 1 0 0 0 2 3 4 1 0 0 0 0 1 0 0 1 1 3 2 5 1 0 1 1 0 0 0 1 0 1 2 1 6 0 1 0 0 0 1 0 0 0 1 3 1 7 0 0 0 0 0 0 0 0 1 1 2 1 8 1 1 0 1 0 0 0 0 0 1 2 1 9 0 1 0 0 0 0 0 1 0 1 2 1 10 0 1 1 0 0 1 0 0 0 1 2 1 11 1 0 1 0 0 0 0 1 0 1 2 1 12 0 1 0 0 0 0 0 0 0 1 2 2 13 0 1 1 0 0 1 0 1 0 0 2 1 14 0 1 1 1 0 0 0 0 0 1 2 1 15 0 0 0 0 0 0 0 0 1 1 2 1 16 0 1 0 1 0 0 0 0 0 1 2 2 17 1 0 0 1 0 1 0 1 1 0 3 1 18 1 0 0 1 0 0 0 0 0 1 2 2 19 0 0 0 0 0 0 0 1 1 1 2 1 20 1 0 0 0 0 0 0 0 0 1 3 1 21 0 1 1 0 0 1 0 1 1 1 3 2 22 0 1 0 1 0 1 0 0 1 1 2 3 23 0 0 0 0 0 0 0 0 0 1 2 2 24 0 0 0 0 0 1 0 1 0 1 2 2 25 0 1 0 1 0 0 0 0 0 1 2 1 26 0 1 0 1 0 0 0 1 0 1 1 1 27 0 1 0 0 0 0 0 0 0 1 2 2 28 0 1 1 0 0 0 0 0 0 1 2 1 29 0 1 0 0 0 0 0 0 0 1 2 1 30 0 0 0 0 0 1 0 0 1 0 2 1 31 0 1 0 1 0 0 0 1 0 1 2 1 32 0 0 0 0 0 0 0 0 0 1 2 1 33 0 1 0 1 0 0 0 0 1 1 2 2 34 0 1 1 0 0 1 0 0 0 1 3 1 35 1 0 0 0 0 0 0 1 0 1 2 1 36 0 1 1 0 0 0 0 0 0 0 2 1 37 0 0 0 1 0 0 0 1 0 1 2 1 38 0 1 0 0 0 0 0 0 0 1 2 2 39 0 1 1 0 0 1 0 0 1 1 1 1 40 0 0 0 0 0 0 0 0 0 1 2 1 41 0 1 0 0 0 0 0 0 0 1 2 2 42 1 1 1 0 1 0 0 1 0 1 2 3 43 0 0 0 0 0 1 0 0 1 0 2 1 44 0 1 0 1 0 0 0 0 0 1 2 2 45 0 0 0 0 0 1 0 0 0 1 3 1 46 1 0 1 0 0 0 1 0 0 1 2 1 47 0 1 0 1 0 0 0 1 0 1 2 2 48 0 0 1 0 0 1 0 0 0 1 2 1 49 1 0 0 1 0 0 0 0 0 1 3 3 50 0 1 0 0 0 0 0 1 0 1 2 1 51 1 0 0 0 0 0 0 0 0 1 2 1 52 0 1 1 0 0 0 0 0 1 1 2 2 53 0 0 0 1 0 1 0 0 0 1 3 1 54 1 1 0 0 0 0 0 1 0 1 2 1 55 0 1 1 1 0 1 0 0 0 1 2 1 56 0 0 0 0 0 0 0 0 1 0 2 2 57 0 1 0 1 0 0 0 0 0 1 2 1 58 1 0 1 0 0 0 0 1 0 1 3 1 59 0 1 1 0 0 1 0 0 1 1 2 2 60 0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关于 疾病 研究 问题 数学模型