数学建模胃癌诊断.docx
- 文档编号:6414806
- 上传时间:2023-01-06
- 格式:DOCX
- 页数:12
- 大小:53.78KB
数学建模胃癌诊断.docx
《数学建模胃癌诊断.docx》由会员分享,可在线阅读,更多相关《数学建模胃癌诊断.docx(12页珍藏版)》请在冰豆网上搜索。
数学建模胃癌诊断
诊断疾病问题数学建模
目录
一、摘要----------------------------------------------
(1)
二、问题重述----------------------------------------------
(1)
三、问题分析----------------------------------------------
(2)
四、问题假设----------------------------------------------
(2)
五、符号说明----------------------------------------------
(2)
六、模型建立与求解----------------------------------------------
(2)
七、模型分析----------------------------------------------(7)
八、模型评价----------------------------------------------(7)
九、模型推广----------------------------------------------(8)
十、附录----------------------------------------------(8)
十一、参考文献----------------------------------------------(11)
小组成员:
姓名年级与专业
胡阿娟09级数学与应用数学1班
刘琳09级数学与应用数学1班
王慧09级数学与应用数学2班
摘要
本文研究的问题是通过研究人体内各元素含量,来诊断就诊人员是否患有胃病。
我们利用Excel软件对样本数据进行了统计分析,发现各元素的含量于是否又有胃病有一定的关联,属于线性回归问题。
我们取1—3号、6—8号、11—13号病例为样本,建立线性回归模型,以各元素的含量x1、x2、x3、x4为自变量;是否患有胃病为因变量,用y表示,当y=2时,表示患有胃癌;当y=1时,表示患有萎缩性胃炎;当y=0时,表示健康。
通过对模型的不断优化,有图像分析可知,X4对于患病的影响微小,所以剔除X4,我们得到的最终模型为
:
,其中各项系数为-0.9909、0.0032、0.0026、12.0133。
确诊病例时,将各元素的含量,输入到该模型中,求出对应的y’值,然后和2,1,0比较,接近于2,则表示患有胃癌;接近于1,则表示患有萎缩性胃炎;接近于0,则表示费胃病患者。
关键词:
Excel多元线性回归最优化逐步回归
问题重述
人们到医院就诊时,胃癌患者容易被误诊为萎缩性胃炎患者或非胃病者。
从胃癌患者中抽取5人(编号为1—5),从萎缩性胃炎患者中抽取5人(编号为6—10),以及非胃病者中抽取5人(编号为11—15),每人化验4项生化指标:
血清铜蓝蛋白(X1)、蓝色反应(x2)、尿吲哚乙酸(X3)、中性硫化物(x4),测量数据如表一所示(见附录3):
问题分析
要求我们提出简便的方法,判别就诊人员是患者还是健康者。
我们根据suo9提供的确诊病例中分析得知,人是否患病与人体内某些元素的含量成相应的回归关系,我们猜想是否能通过样本中患病与元素含量的普遍关系来建立回归模型,由模型来判别病例。
因此,我们先选取其中一部分数据进行研究,待建立模型后,将剩余的数据带入模型检。
问题假设
(1)假设题目所给的数据合理正确
(2)假设胃病患者体内各种元素的含量受其他疾病的影响较小;
(3)假设医院所用的仪器准确度很高,对各种元素在人体内的含量测得的值很准确;
(4)假设用于判断胃病患者的四种元素,不受人体内其他元素或化合物的影响。
符号说明
(1)
表示人体内各元素的含量
(2)
表示患病情况.
(3)p表示误判率
(4)n表示从总体中抽取的样本
(5)
表示线性回归方程的回归系数
模型建立与求解
模型一
(1)模型一的建立:
考虑一次线性回归模型,我们从总体中选取,1——3号,6—8号,11—13号病例作为研究样本,以人体内各元素的含量
为自变量;人们是否患病为因变量。
设多元线性回归模型一般形式为:
------------
(1)
其中:
y是因变量,
(i=1,2,3,4)为四个对y有显著影响的自变量,
是5个待估参数。
对于n组实际观察数据,由
(1)得
-------
(2)
根据
(2)式多元线性回归模型可表示为:
---------------------------(3)
模型相应矩阵方程表示为:
Y=A*X--------------------(4)
由(4)式解得:
A=(X’*X)*X’*Y------------(5)
我们将样本数据代入(5)式,利用matlab(求解源程序见附录1)软件,求得个参数的线性回归系数分别为:
A=[0.0225-0.0023-0.002713.34063.9119]则
Y=0.0225-0.0023
-0.0027
+13.3406
+3.9119
----------(6)
(2)模型检验
将检测样本得值代入(6)式判别出6个样本患病情况为:
患癌症5号,萎缩性胃炎9号,非患病者4,10,14,15.由此可以看出,我们运用所求的判别函数所检验的结果与实际情况存在一定的误差,也就是说运用一次线性模型判定的结果存在一定的误判,其误判率大约为3/6=50%。
模型二
(1)模型二的建立
考虑一次项和平方项线性回归模型,我们从总体中选取,1——3号,6—8号,11—13号病例作为研究样本,以人体内各元素的含量
为自变量;人们是否患病为因变量。
设多元线性回归模型一般形式为:
(i=1,2,3,4;j=5,6,7,8)---------(7)
同模型一的解法,我们建立相应的方程和模型,我们将样本数据代入上式,利用MATLAB(求解源程序见附表2)软件,求得各参数项的线性回归系数分别为:
{
,
,
}=[-8.4679-0.09460.208979.931811.90740.0002-0.0008-256.9499-22.2668]
(2)模型检验
将检测样本得值代入(7)式判别出6个样本患病情况为:
患癌症5号,萎缩性胃炎9号,非患病者4,10,14,15.由此可以看出,我们运用所求的判别函数所检验的结果与实际情况存在一定的误差,也就是说运用一次线性模型判定的结果存在一定的误判,其误判率大约为2/6=33.3%.
模型三
综合以上模型,通过对两种模型结果的分析,我们发现一次项得到的结果检验最精确,但是拟合优度较低,为了验证各元素对胃病的影响,我们利用Excel分析了各元素的含量。
通过它们的曲线图发现X4元素的影响较为微小,所以剔除X4的数据,避免了不必要的运算,较小误差。
我们得到的最终模型为
我们将样本数据代入上式,利用Matlab软件,求得各参数项的线性回归系数分别为-0.9909、0.0032、0.0026、12.0133.
NoX1
癌症患者
萎缩性胃炎患者
费胃病患者
1
228
225
185
2
245
130
170
3
200
150
165
4
170
120
135
5
100
160
100
NoX2
癌症患者
萎缩性胃炎患者
费胃病患者
1
134
125
115
2
134
100
125
3
167
117
142
4
150
133
108
5
167
100
117
NoX3
癌症患者
萎缩性胃炎患者
费胃病患者
1
0.2
0.07
0.05
2
0.1
0.06
0.06
3
0.12
0.07
0.05
4
0.07
0.1
0.02
5
0.2
0.05
0.07
NoX4
癌症患者
萎缩性胃炎患者
费胃病患者
1
0.11
0.14
0.19
2
0.4
0.12
0.04
3
0.27
0.06
0.08
4
0.08
0.26
0.12
5
0.14
0.1
0.02
模型检验
将检测样本的值代入(8)式,判别出六个样本患病情况为患癌症者为5号,萎缩性胃炎为9、10号,非患病者为4、14、15。
其误判率为1/6=16.7%。
模型分析
在问题中,我们通过对模型的优化,最终得到了较理想的模型,利用该模型对总体样本的检验结果与题意基本相符,有较高的正确性。
模型评价
1.优点
1)本文采用了线性回归的方法对模型进行了一系列的分析、处理,并选取部分样本进行计算,用已知的数据对所的结论进行了验证,比较简方便。
2)该模型简单,而且利用了数学软件MATLAB。
2.缺点
1)提供的数据较少,结果不是特别准确。
2)本文采用的图表分析与真实数据有一定误差。
模型的推广
这种判别方法在实际生活中应用较多,所以这些方法在日常发挥着很多作用,除了判断疾病之外,还可以在各单位评先进,选有活动中得到广泛推广。
在对影响事物的一些因素进行研究、判断时,可以通过主要成分分析,在多个元素中对最重要的一些元素进行筛选后研究,这样可以减少研究的难度,提高研究的效率,还可以减少微小因素带来的误差,所以这个模型在研究中有很好的推广前景。
附录
附录1
模型一
计算系数a
X=[1,228,134,0.2,0.11;1,245,134,0.1,0.4;1,200,167,0.12,0.27;1,255,125,0.07,0.14;1,130,100,0.06,0.12;1,150,117,0.07,0.06;1,185,115,0.05,0.19;1,170,125,0.06,0.04;1,165,142,0.05,0.08;]
Y=[2;2;2;1;1;1;0;0;0;]
A=inv(X'*X)*X'*Y
A=
0.0225
-0.0023
-0.0027
13.3406
3.9119
检验模型
X1=[1,170,150,0.07,0.08;1,100,167,0.2,0.14;1,120,133,0.1,0.26;1,160,100,0.05,0.1;1,135,108,0.02,0.12;1,100,117,0.07,0.02;]
Y=X1*A
Y=
0.4702
2.5532
1.7355
0.4411
0.1545
0.4860
附录2
模型二
Y=[2;2;2;1;1;1;0;0;0;]
X1=[1,228,134,0.2,0.11;1,245,134,0.1,0.4;1,200,167,0.12,0.27;1,255,125,0.07,0.14;1,130,100,0.06,0.12;1,150,117,0.07,0.06;1,185,115,0.05,0.19;1,170,125,0.06,0.04;1,165,142,0.05,0.08;]
X2=[228,134,0.2,0.11;245,134,0.1,0.4;200,167,0.12,0.27;255,125,0.07,0.14;130,100,0.06,0.12;150,117,0.07,0.06;185,115,0.05,0.19;170,125,0.06,0.04;165,142,0.05,0.08;]
X3=X2.^2
X4=[X1X3]
A1=inv(X4'*X4)*X4'*Y
A1=
-8.4679
-0.0946
0.2089
79.9318
11.9074
0.0002
-0.0008
-256.9499
-22.2668
模型二检验
X5=[1,170,150,0.07,0.08;1,100,167,0.2,0.14;1,120,133,0.1,0.26;1,160,100,0.05,0.1;1,135,108,0.02,0.12;1,100,117,0.07,0.02;]
X6=[170,150,0.07,0.08;100,167,0.2,0.14;120,133,0.1,0.26;160,100,0.05,0.1;135,108,0.02,0.12;100,117,0.07,0.02;]
X7=[X51X6.^2]
Y1=X7*A1
Y1=
0.7316
4.4497
4.3800
-0.6197
-1.1802
2.6308
模型优化
>>Y=[2;2;2;1;1;1;0;0;0;]
Y=
2
2
2
1
1
1
0
0
0
>>X8=[1,228,134,0.2;1,245,134,0.1;1,200,167,0.12;1,255,125,0.07;1,130,100,0.06;1,150,117,0.07;1,185,115,0.05;1,170,125,0.06;1,165,142,0.05;]
X8=
1.0000228.0000134.00000.2000
1.0000245.0000134.00000.1000
1.0000200.0000167.00000.1200
1.0000255.0000125.00000.0700
1.0000130.0000100.00000.0600
1.0000150.0000117.00000.0700
1.0000185.0000115.00000.0500
1.0000170.0000125.00000.0600
1.0000165.0000142.00000.0500
>>A3=inv(X8'*X8)*X8'*Y
A3=
-0.9909
0.0032
0.0026
12.0133
>>X9=[1,170,150,0.07;1,100,167,0.2;1,120,133,0.1;1,160,100,0.05;1,135,108,0.02;1,100,117,0.07;]
X9=
1.0000170.0000150.00000.0700
1.0000100.0000167.00000.2000
1.0000120.0000133.00000.1000
1.0000160.0000100.00000.0500
1.0000135.0000108.00000.0200
1.0000100.0000117.00000.0700
>>Y2=X9*A3
Y2=
0.7860
2.1704
0.9427
1.3819
-0.0368
0.4766
附录3表一
NO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
X1
228
245
200
170
100
255
130
150
120
160
185
170
165
135
100
X2
134
134
167
150
167
125
100
117
133
100
115
125
142
108
117
X3
0.2
0.1
0.12
0.1
0.2
0.1
0.1
0.1
0.1
0.1
0.1
0.1
0.1
0.02
0.1
X4
0.1
0.4
0.27
0.1
0.1
0.1
0.1
0.1
0.3
0.1
0.2
0.08
0.1
0.1
0.02
参考文献
[1]姜启源谢金星叶俊。
数学模型(第三版)北京:
高等教育出版社,2003.8
[2]赵静但琦,数学建模与实验。
北京:
高等教育出版社,2003.6
[3]白厚义回归设计与多元统计分析。
广西:
科学技术出版社,2003.1
[4]
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 胃癌 诊断