211数学建模论文 3.docx
- 文档编号:10772357
- 上传时间:2023-02-22
- 格式:DOCX
- 页数:18
- 大小:120.08KB
211数学建模论文 3.docx
《211数学建模论文 3.docx》由会员分享,可在线阅读,更多相关《211数学建模论文 3.docx(18页珍藏版)》请在冰豆网上搜索。
211数学建模论文3
2014年中国矿业大学“元旦杯”数学建模竞赛
承诺书
我们仔细阅读了元旦杯竞赛规则。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与本队以外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们愿意承担由此引起的一切后果。
参赛队员(签名):
队长:
曾德银
队员:
佟春天
队员:
郝孟楠
目录
一.摘要
二.模型假设
三.问题重述
四.问题分析
五.模型的建立和解答
1)问题一
1.模型假设
2.模型建立
3.模型求解
2)问题二
1.模型假设
2.定义符号说明
3.模型建立
4.模型求解
3)问题三
1.模型假设
2.定义符号说明
3.模型建立
4.模型求解
六.模型的评价与改进
七.参考文献
学生成绩分析
一.摘要
本文先使用excel软件对数据进行基本的预处理,对问题一、二,使用spss统计软件对数据进行T检验,得出甲、乙专业在高数Ⅰ、高数Ⅱ、线代、概率成绩的总体均值都存在明显差别的结果;则针对每门课程分析,两个专业学生的分数有明显差异;针对专业分析,两个专业学生的数学水平有明显差异。
对问题三,使用spss统计软件对数据进行简单相关性检验及回归性分析,得出高数Ⅰ、Ⅱ的平均值与线代、概率有一定的相关性,但相关性一般的结论。
因为高数Ⅰ、Ⅱ平均值与线代、概率的线性回归拟合优度都较低。
总之,高等数学成绩的优劣,影响线性代数、概率论与数理统计的得分情况,但影响程度不算太大。
根据上述分析,总结得出大学数学课程学习的建议要点:
①注重基础的学习,
②编制数学的知识网络,
③理论知识理解,
④学会公式、定理的实践应用。
关键词:
spss软件显著性检验相关性检验回归性分析
二.模型假设
1.考试成绩反应的是学生的真实水平。
2.高数成绩和线性代数,概率论与数理统计有相关关系。
3.假设除了甲专业24号高数Ⅰ成绩433,视作无效数据,此样本不参与计算外,其它所给出的数据都是正确的。
4.两个专业的授课老师水平相同。
5.两个专业的学生人数可以真实的反应学生数学水平。
6.本题显著性水平默认为0.05。
7.学生和学生之间的成绩是相互独立的,没有影响的
8.假设两个班学生本科前的数学水平的整体程度和基础差异不大。
9.假设样本学生的成绩均来自于实际,由此做出的分析是接近实际,能够反映实际状况的。
三.问题重述
1、有关情况
题目已给出某高校甲专业和乙专业的高等数学Ⅰ、高等数学Ⅱ、线性代数、概率论与数理统计三门公共数学课程的期末考试成绩数据表格。
应用所给数据进行处理。
2、问题提出
附件一和二是甲、乙两个专业的四门数学课程的成绩数据,请根据数据分析回答以下问题:
(1)针对每门课程分析,两个专业的分数是否有明显差异?
(2)针对专业分析,两个专业学生的数学水平有无明显差异?
(3)高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况?
四.问题分析
问题一:
根据所给数据,针对每门课程分析不同专业学生成绩是否显著不同。
这一问主要是应用单因素方差分析模型的方法,方差分析就是通过对试验数据进行分析检验各正态总体的均值是否相等,以判断各因素对试验指标的影响是否显著。
问题二:
模型同问题一。
针对专业分析,两个专业学生的各科数学水平有无明显差异。
对于问题二,用层次分析法求得各门课程占总成绩的比重,得出两专业的总成绩,我们用加权后的总成绩来作为判断数学水平高低的标准。
然后继续用到了单因素方差分析法,同样以甲乙两专业为不同水平进行显著性检验,结果p=0.1483>0.05,表明专业不同对数学水平没有显著性的影响。
问题三:
要判断学生高等数学成绩的优劣,对线性代数、概率论与数理统计课的成绩是否有显著性相关,和高数成绩与线代成绩、概率成绩的相互影响关系,此时不在考虑专业因素,我们以全体数据进行讨论,要解决此问题我们可以试建立关于高数-线代成绩的一元线性回归模型和高数-概率成绩的一元线性回归模型,通过计算高数与线代和概率的一元线性相关关系,得出线代和概率论的成绩与高数成绩成正相关但无显著性影响。
五.模型建立和求解
问题一:
模型假设
1、单因素方差分析模型
我们在单因素模型中将专业看作因子来讨论专业对各门成绩是否会产生明显差异。
专业甲和专业乙看成两个不同的水平,而每个学生在每个学期的成绩即是试验的样本。
现研究专业对各科成绩是否会产生差异,我们对各科的成绩进行了数据统计,如表
高数Ⅰ数据表1-1
平均分
最高分
最低分
方差
中位数
甲专业
71.5535
95
0
267.8709
72
乙专业
69.3425
97
0
192.9376
66
高数Ⅱ数据表1-2
平均分
最高分
最低分
方差
中位数
甲专业
70.6339
96
46
96.3242
67
乙专业
70.1944
100
0
173.1674
65
线代数据表1-3
平均分
最高分
最低分
方差
中位数
甲专业
71.4643
98
0
202.359
72
乙专业
70.1944
100
0
173.1674
69
概率数据表1-4
平均分
最高分
最低分
方差
中位数
甲专业
75.8392
97
24
197.34
77
乙专业
74.4537
97
0
199.0539
75
从上表可以看出,很明显甲乙两专业高数Ⅱ的方差差异最大,方差反应了数据的稳定水平,方差的差异说明甲乙两个专业在分数的稳定方面存在显著差异。
为了更精确地分析数据的差异性,根据数据的性质,下面将各科的成绩数据分段处理,分为[0,20﹚,[20,40﹚,[40,60﹚,[60,70﹚,[70,80﹚,[80,90﹚,[90,,100]七个分段区间,并计算出各分段区间人数占专业总人数的百分比,得出数据,并绘制表格如下:
高数Ⅰ数据比较表1-5
0~20
20~40
40~60
60~70
70~80
80~90
90~100
甲
2
3
2
41
26
24
13
111
比例
1.80%
2.70%
1.80%
36.94%
23.42%
21.62%
11.71%
乙
3
0
4
56
21
15
9
108
比例
2.78%
0.00%
3.70%
51.85%
19.44%
13.89%
8.33%
高数Ⅱ数据比较表1-6
0~20
20~40
40~60
60~70
70~80
80~90
90~100
甲
0
0
1
58
27
21
4
111
比例
0.00%
0.00%
0.90%
52.25%
24.32%
18.92%
3.60%
乙
2
2
6
66
20
9
3
108
比例
1.85%
1.85%
5.56%
61.11%
18.52%
8.33%
2.78%
线代数据比较表1-7
0~20
20~40
40~60
60~70
70~80
80~90
90~100
甲
2
1
1
43
30
30
4
111
比例
1.80%
0.90%
0.90%
38.74%
27.03%
27.03%
3.60%
乙
1
0
3
49
28
19
8
108
比例
0.93%
0.00%
2.78%
45.37%
25.93%
17.59%
7.41%
概率数据比较表1-8
0~20
20~40
40~60
60~70
70~80
80~90
90~100
甲
0
2
4
32
23
29
21
111
比例
0.00%
1.80%
3.60%
28.83%
20.72%
26.13%
18.92%
乙
0
3
2
33
22
38
10
108
比例
0.00%
2.78%
1.85%
30.56%
20.37%
35.19%
9.26%
为了能更直观的分析出专业因素对各科成绩的影响,对该数据绘制出甲、乙两专业各科成绩的比例分析图。
如下图:
从图中曲线的拟合度可以看出,甲乙两专业的各科的成绩都存在差异,但并不是非常明显,并且近似的符合正态分布。
下面建立t检验模型
检验模型:
t检验
有模型可以得到,判断专业对成绩有无影响,可以转化为假设检验:
假设
成立,则甲、乙专业学科成绩没有显著差异,有:
组间平均值:
标准差:
其中:
在置信水平为α=0.05的情况下,拒绝域为
分别用t检验模型对四个科目进行计算,求出各自的p值,若p小于0.10,则存在显著差异,经计算得表1-9:
表1-9
课程名称
高数Ⅰ
高数Ⅱ
线代
概率
p
0.462432
0.003563
0.678990
0.66873
根据上表的计算结果不难看出,只有高数Ⅱ(p=0.003563<0.10)存在显著差异,而其他三门科目没有显著差异。
所以,综合单因素方差分析模型和t检验模型,在这四个学科中,专业的不同对数学Ⅱ有显著影响。
问题二:
加权平均的模型
我们将专业看做因子,讨论专业对成绩高低的影响。
甲和乙看做因子所处的两个不同水平。
而每个班的成绩即是试验的样本。
最后讨论两个专业学生成绩是否显著性不同的问题即转化为讨论两个水平之间是否相同的问题。
根据实际情况,学校评价相关成绩指标时均用平均成绩计算。
我们在比较不同专业学生各科成绩是否显著不同时,把每科该专业各班所有人的平均成绩作为该班的综合成绩。
则本文中处理数据均用平均值计算。
建模背景:
基于我们中国矿业大学对这三门课程的学分安排:
高数I为5学分,高数II为3学分,线性代数为2.5学分,概率论与数理统计为3学分。
总共为13.5学分,因此建立一个加权平均的模型来定义学生的数学水平。
建立如下模型:
将甲乙专业分开,分别计算各个学生的数学水平,得到相关统计量,并绘制表格得表2-1:
表2-1
人数
最高分
最低分
极差
众数
中位数
平均分
方差
及格率
优秀率
甲专业数学水平
111
94.81
44.44
50.37
60.89
71.37
71.29
104.23
94.74%
16.45%
乙专业数学水平
108
97.00
0.00
97.00
69.00
68.78
69.77
135.46
93.52%
13.89%
从表5可以看出甲专业方差小于乙专业,中位数、平均分都要高于乙专业,而甲方差要小于乙专业,说明数学水平分布更为集中,并且甲专业的及格率和优秀率都要好于乙专业。
由此可以粗略的得出一个结论:
甲专业的数学水平要好于乙专业。
为了能更近一步的了解甲乙两专业的数学水平情况,我们利用上文的表1-1、表1-1
、表1-3和表1-4对甲乙专业单独的各个数学学科的数据进行分析,可以看出,甲专业各科的平均分都高于乙专业对应科目的平均分。
而其他统计数据相差无几,着就说明了甲专业的数学水平好于乙专业。
问题三:
建立一元线性回归模型
要解决学生高等数学对线性代数、概率论与数理统计课是否有影响,判断学生高等数学成绩的优劣,对线性代数、概率论与数理统计课的成绩是否有显著性相关,和高数成绩与线代成绩、概率成绩的相互影响关系,可以试建立关于高数-线代成绩的一元线性回归模型和高数-概率成绩的一元线性回归模型,此时不在考虑专业因素。
高数-线代成绩的一元线性回归模型求解与检验:
因为高数分为高数I和高数II,仍依据开始的假设,现取两者均值来代替高数成绩(甲专业24号高数I成绩433,视作无效数据,此样本不参与计算),再定义高数成绩x为横坐标,以线性代数成绩y1(概率论与数理统计成绩y2)为纵坐标,建立关于高数-线代成绩的一元线性回归模型。
利用数据处理工具对数据进行处理得到高数成绩与线代成绩如下:
高数线代高数线代高数线代高数线代高数线代高数线代高数线代
41
50
61.5
63
62
60
72
80
91
97
90.5
95
88.5
87
63
68
49
41
69
76
72
64
68
69
63.5
60
88
80
76
60
64.5
76
78.5
84
62
72
62.5
70
65.5
69
78.5
82
60.5
77
50
50
69
89
61
76
94.5
70
84.5
75
74
82
65
69
63
60
68
82
62.5
73
64
65
62
91
79
81
67
67
50
60
69.5
68
70
80
84.5
72
89.5
94
74.5
74
71
71
55
74
62.5
61
60.5
60
64.5
70
62
71
71
88
70.5
60
87
93
71
82
79.5
83
74
76
69.5
72
86
83
66
67
41
50
67.5
81
61.5
60
65.5
77
89
86
84.5
80
62
60
64.5
60
88
93
62
61
64.5
63
93.5
75
83.5
80
60
60
81.5
65
52.5
68
0
0
68
70
93
98
73
82
72.5
63
80.5
69
66.5
66
64.5
60
60.5
62
84.5
60
75.5
93
65
77
56.5
60
62
70
68
60
74
60
91
89
74.5
68
72.5
83
54
60
62
68
60.5
71
60.5
60
87.5
90
75.5
79
63.5
81
69.5
60
62
64
80
89
78.5
79
87.5
89
86.5
67
51
66
61.5
81
61
60
73
78
94
100
85.5
87
83
75
77.5
91
69.5
68
68
61
62
65
73
73
73.5
63
77.5
82
82
62
79.5
65
66.5
65
75.5
73
69.5
73
73.5
60
72.5
80
63
69
71.5
85
64
71
77.5
84
54.5
60
83
87
84.5
87
75
88
63.5
71
58.5
70
92.5
95
83.5
65
42
66
80.5
66
80
73
70
66
72
63
63.5
63
70
73
63.5
68
51
60
78
74
79.5
85
65.5
67
79.5
69
63
74
71.5
72
32
67
77.5
82
74.5
60
68
79
77.5
67
76.5
83
69.5
77
76.5
60
72.5
64
67
80
65
67
76.5
86
75
82
67
65
66.5
63
82.5
67
77.5
60
70
79
75.5
70
69.5
89
66.5
83
66.5
73
81
51
73.5
68
69
66
74
74
69.5
71
62
60
66
68
75
63
78
68
67
74
71.5
77
69.5
72
62
64
61.5
65
82
90
75
86
64.5
39
71.5
85
67
76
54.5
63
61.5
78
76
60
63
66
72.5
0
62.5
79
60
45
48.5
78
64.5
76
71
70
61
75
69
72
62.5
60
60
60
54.5
60
60.5
63
71
73
61
80
66
72
62
82
51.5
60
53
0
63.5
60
61
71
48.5
65
相关解释:
r是相关系数,相关系数R^2是r的平方,也叫拟合优度、可决系数。
相关系数R^2越接近于1说明回归方程越显著,线性相关性质越好,模型的拟合优度越高。
函数-自变量图线越趋近于一条平直线。
如果其绝对值越靠近0,那么就说明线性相关性越差,根据数据点描出的图线和拟合曲线相差越远,表达式是:
R^2=ESS/TSS=1-RSS/TSS
运算公式为:
对数据进行计算和分析得到图表输出如下:
表5甲乙专业高数与线代统计结果
高数(Ⅰ,Ⅱ)平均分
线代平均分
r
R^2
69.34474886
70.87671233
0.564654151
0.31883431
由已平均高数成绩x=[x1x2…x219];线性规划成绩y.=[y11y12…y219];
进行回归分析计算:
由上表数据经计算我们得到高数-线代线性回归方程y=0.66x+25.104
检验:
下方为使用数据处理工具得到的散点图形,我们使用spss软件进行线性自动拟合得到如下图形,从图中可以看到线性回归方程与计算相得无差别。
图10
分析计算结果:
计算得r=0.564654151,
=0.318833431观察图10发现数据点基本上均匀的分布在回归方程的两侧。
这说明回归模型y=0.66x+25.104能较好的符合原始数据,因此可以得出结论:
高数成绩的好坏将影响到线代成绩的好坏,而且是正相关。
高数-概率成绩的一元线性回归模型求解与检验:
类似地应用上边的方法对数据进行处理分析得到图表输出如下:
表5甲乙专业高数与概率统计结果
高数平均分
概率平均分
r
R^2
69.34474886
75.2283105
0.51156622
0.2617
由已知平均高数成绩x=[x1x2…x219];概率成绩y.=[y11y12…y219];进行回归分析计算得到高数-概率线性回归方程y=0.6127x+32.742
下方为使用数据处理工具得到的散点图形,我们使用spss软件进行线性自动拟合得到如下图形,从图中可以看到线性回归方程与计算相得无差别。
图11
分析计算结果:
计算得r=0.51156622,
=0.2617,观察图11发现数据点基本上均匀的分布在回归方程的两侧。
这说明回归模型y=0.6127x+32.742能较好的符合原始数据,因此可以得出结论:
高数成绩的好坏将影响到线代成绩的好坏,而且是正相关。
结论:
通过2个模型的建立,得出y=0.66x+25.104和y=0.6127x+32.742两个线性回归方程,这就说明了高数成绩的好坏将影响到线性代数、概率论与数理统计的得分情况,而且是正相关。
六.模型的评价与改进
(1)优点:
①本文大量地使用spss软件来整理数据及绘图,减少了计算工作量,大大降低了建模的难度。
②本文大量地使用图表来分析及显示结果,使分析更结果清晰明了。
③本文删去了四门数学课程成绩均为0的学生的所有成绩,增大了数据的代表性,使问题的分析更能反映真实情况。
④定义出5个阶段的成绩标准,比4个阶段的优良中差更全面,而且据此验
证分析得出的结论,增加了结果的合理性。
(2)缺点:
①使用的数据、考虑的影响因素不够全面,造成一定的误差。
②分析数据差异性的方法较为单一,得出的结果不够全面。
模型优点:
在问题
(1)、
(2)、(3)中建立的模型是图解模型,线性回归拟合模型,可以很直观的分析各个学科成绩的差异。
模型缺点:
数学水平是一个很难定义的量,因为数学水平的衡量涉及到很多变量,这个模型中的数学
水平的定义比较简单,不一定能反应现实中学生的数学水平,还有在考虑高数与另两门课的相关关系时没
有去考虑有无可能是二次回归方程或飞线性回归方程。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 211数学建模论文 211 数学 建模 论文