数学建模A题的论文.docx
- 文档编号:24082967
- 上传时间:2023-05-24
- 格式:DOCX
- 页数:26
- 大小:816.80KB
数学建模A题的论文.docx
《数学建模A题的论文.docx》由会员分享,可在线阅读,更多相关《数学建模A题的论文.docx(26页珍藏版)》请在冰豆网上搜索。
数学建模A题的论文
关于葡萄酒质量的评价分析
摘要
本文主要讨论了关于葡萄酒质量的品评研究,统计学方法应用到葡萄酒质量分析与评价中,更加清晰地了解葡萄酒成分。
由于品酒员间存在评价尺度、评价位置和评价方法等方向的差异,导致不同品酒员,我们对其海量数据展开讨论、分析和建立数学模型,利用数学软件进行求解,利用数学知识联系实际问题,作出相应的解答和处理。
对于问题1,我们运用Excel软件里面的工具数据分析对附表一里的数据进行处理,然后进行t检验,得出相应数据的P值,再与检验水准
进行显著性分析的判定,我们得出两组数据均显著。
然后我们再次对该两组数据进行方差分析判断出可信性,通过比较我们的出第二组数据具有可信性
对于问题2,为了更真实地反应实际情况,通过对附录2中27种红葡萄酒的各项物化指标计算平均值,然后应用SPSS中的系统聚类分析,按ward法进行聚类,结果表明27份样品可以聚为4类,
对于问题3,参考实际需求,我们利用数学分析结合MATLAB数学软件进行拟合相结合来推导出
的值,需要考虑
与单位、溶解度、挥发性、沸点等物理化学性质的关系。
其他物质含量可以与此同样的方法得出其关系。
最后根据每组的样品
和模型在matlab中作出折线图,进行对比。
对于问题4,根据前面讨论的葡萄酒质量级别来归类,并用Excel工具进行理化指标分析,分别看一、二、三、四级别的酒各种理化指标的分布范围,然后列出表格,总结出理化指标与葡萄酒级别之间的关系
最后,我们针对论文的实际情况,对论文的优缺点做了简要的评价。
与此同时,对于我们建立的模型中存在的不足之处,我们在文章最后还给出了其他的改进方向,以用于指导实际应用。
关键词:
葡萄酒品评指标t检验方差分析主成分分析法ward法聚类分析
1.问题的重述
通常确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
下面需要尝试建立数学模型讨论解决下列问题:
1.分析附件1中两组评酒员的评价结果的显著性差异,并确定哪一组结果更可信
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标与理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
2.问题的分析
对题目所给的条件、要解决问题做详细的分析说明,并说明解决问题所采用的方法、思路和理由。
要逐个问题进行分析。
通过聘请一批又资质的评酒员进行品评,然后对各部分进行分类指标评分,总分100分,将葡萄酒分为红葡萄酒和白葡萄酒,红葡萄酒有27组样品,白葡萄酒有28组样品,品酒员又有两组,每组10人。
来那个组分别对红葡萄酒和白葡萄酒的每组样品进行品尝,然后对其分类指标打分得出附件一的表格
问题一“分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更信?
“分析:
在品酒师品酒的过程中,目的是检验葡萄酒的质量。
因此,根据品酒师对各个样品的打分,可以分析出各个样品酒的好坏。
但是由于考虑到题中所给的众多数据,所以我们通过统计手段,对数据进行处理,然后得到需要的平均值。
但由于问题中要求求出两个组的可信度,所以我们采用SPSS将相关数据录入,然后求出方差进行分析,对比比较进行说明。
问题二“根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
“分析:
该题是根据酿酒葡萄的理化指标和葡萄酒的质量进而对葡萄进行分级,因此我们利用问题一的结果,取更可信的评酒员评价的结果来判断酒的质量,然而酿酒葡萄的理化指标对葡萄酒质量的影响还没有标准的值,我们只能根据评酒员对葡萄酒的评分来划分葡萄酒的级别,由于葡萄酒的质量与加工方式和过程无关,所以酿酒葡萄的指标就成为了影响葡萄酒质量的关键,于是我们局可以根据葡萄酒的质量来划分酿酒葡萄的级别了,再次利用评酒员的评分作为建模基础,分析出酿酒葡萄的级别。
在红白两种酿酒葡萄的多项物化指标中以及两种葡萄酒的质量中,我们需要统计并计算相关数据,然后用系统聚类分析方法求出结果。
问题三“分析酿酒葡萄与葡萄酒的理化指标与理化指标之间的联系。
“分析根据问题一和问题二的分析结果以及附件二、三的综合分析假设影响葡萄酒质量的诸多因素,进而建模,导出酿酒葡萄和葡萄酒理化指标之间的关系。
通过问题二的解答,可以值得葡萄酒于酿酒葡萄的划分级别。
问题四“分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
”分析:
根据问题三建立的模型,进行讨论并论证酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响关系。
3.模型的假设与符号说明
3.1模型的假设
(1)题目给出的数据真实可靠,没有主观性的打分情况
(2)不同种类酿酒葡萄的成分数据值统一标准无差异。
(3)不同种类葡萄酒的成分数据值统一标准无差异。
(4)酿酒方式机酿酒过程对葡萄酒的质量无影响。
(5)题目中各葡萄酒的物化指标都是经过精密仪器等措施所得,误差很小可忽略。
(6)品酒先后对打分没有影响。
(7)检测理化指标为标准无误差。
(8)每位品酒员对两种葡萄酒的喜好程度无太大偏差。
3.2符号的说明
:
(原假设)
(备择假设)
:
检验水准
N:
样本数据个数
:
葡萄酒中的含量平均值
:
酿酒葡萄中的含量平均值
:
与单位、溶解度、挥发性、沸点等物理化学性质相关的系数。
4.模型的建立与求解
4.1问题1的模型建立与求解
对问题
(1)用T检验来判定两组评酒员的评价结果,观察两组样品酒平均值(见附录一)的差异是否显著。
因为T检验就是用于小样本,总体标准差
未知的正态分布资料,是用于小样本的两个平均值差异程度的检验方法。
它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
4.1.1.建立假设、确定检验水准
:
(原假设)
(备择假设)
双侧检验,检验水准:
2.计算检验统计量。
3.用spss软件得出相应结果,确定P值,下结论。
4.1.2.我们分别对第一组红葡萄酒评分,第一组白葡萄酒评分,第二组红葡萄酒评分,第二组白葡萄酒评分,用T检验对两组评酒员样本求出它们的P值,若P值小于0.1,则差异显著,比较P(第一组红葡萄酒评分)=0.362586、P(第二组红葡萄酒评分)=0.003922、P(第一组白葡萄酒评分)=0.779552、P(第二组白葡萄酒评分)=0.718893的数据.所以针对红酒和白酒,两组评酒员的差异均显著。
(表1-1):
对白葡萄酒的t检验成分
(表1-2):
对红葡萄酒的t检验成分
t-检验:
成对双样本均值分析
变量1
变量2
平均
73.05741
70.51481
方差
53.84052
15.82439
观测值
27
27
泊松相关系数
0.700143
假设平均差
0
df
26
tStat
2.462194
P(T<=t)单尾
0.010377
t单尾临界
1.705618
P(T<=t)双尾
0.020754
t双尾临界
2.055529
4.1.3对于哪一组更加可信,我们对两组评酒员的10位评酒员打分的均值算出来,并且看这一组评酒员10位评酒员的打分是否稳定,求出方差。
对于白酒,第一组的方差(129.1893)大于第二组的方差(56.01944),对于红酒,第一组的方差(58.61932)与第二组的方差(33.79054)差距不大,所以第二组对白酒打分更可信。
综上所述可以认为第二组结果更可信。
部分数据见下表(表1-4).详细数据见附录二。
(表1-3)
关于第一、二组品酒员的统计样本检验
均值
N
标准差
均值的标准误
对1
第一红
73.0959
27
7.34991
1.41449
第二红
70.5148
27
3.97799
.76556
对2
第一白
74.0107
28
4.80404
.90788
第二白
76.5321
28
3.17094
.59925
第一组评酒员对红葡萄酒评分间的方差
第二组评酒员对红葡萄酒评分间的方差
第一组评酒员对白葡萄酒评分间的方差
第二组评酒员对白葡萄酒评分间的方差
58.61932
33.79054
129.1893
56.01944
(表1-4)
4.2问题2的模型建立与求解
4.2.1等级划分
问题二“根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
”我们通过对附录2中27种红葡萄酒的各项物化指标计算平均值来区分级别,但不能采取去掉一个最高分和一个最低分制,需要采用分析法(利用问题一的数据分析结果)去掉那些人为因素产生过大的误差数据,例如一组数据中标准差方差与其它悬殊太大的数据就需要去掉,那些数据是人为过大误差数据。
葡萄酒的划分级别尽量按国际划分标准,划分为四个等级,分数范围尽量满足成公差分布。
这样一来就可以将葡萄酒划分为四个级别。
与之相对应的酿酒葡萄就划分为四个级别了,然后应用SPSS中的系统聚类分析,按ward法进行聚类,结果表明27份样品可以聚为4类,然后根据级别图讨论葡萄酒质量于酿酒普通理化指标的关系,进而就可以确定酿酒葡萄理化指标的标准要求了。
此步为下面的题做铺垫。
红酒的聚类图:
(表2-1)
然后对红酿酒葡萄的各项物化指标进行系统聚类分析,得到以下该图,
红葡萄的聚类图:
(表2-2)
结果表明27份样品可以分为5类,第1类包括样品7,26,16,17,13,6,25,10,15,4,22,21,12,27,18,20,11等共17个,第2类包括2,9,8共3个,第3类包括3,23,5,19,14,24等共6个,第4类为1共1个。
对酒分类结果:
第1类包括样品10,27,25,26,6,15,13,19,4,16,18,20,7,12,11共15个,第2类包括样品14,22,17,5,24,21共6个,第三类包括样品3,9,23,2共4个,第4类包括样品1,8共两个。
第一类:
7,26,16,13,6,25,10,15,4,12,27,18,20,11
第二类:
17,21,22
第三类:
2,9,8
第四类:
5,19,14,24,3,23
第五类:
1
再结合第二组品酒员对27种酒样的评分(见附录),得到分类等级如下:
A:
2,8,9
B:
17,21,22
C:
5,19,14,24,3,23
D:
1
E:
7,26,16,13,6,25,10,15,4,12,27,18,20,11
白葡萄的聚类图:
(表2-3)
对白葡萄酒的理化指标分析得,数据中的28份样品可以聚为5类,第1类包括6,23,2,21,1,9,17,19,8,26,22等共11个,第2类包括4,10,5,15,20,12等共6个,第3类包括3,7共2个,第4类包括11,25,13,16,14,18等共6个,第5类包括24,27共2个。
白酒的聚类图:
(表2-4)
对28组白酿酒葡萄的理化指标进行分析得,28份样品可以聚为5类,第一类为1,20,14,4,8,21,16,19,23,2等共10个,第2类包括样品22,26,9,10等共4个,第3类包括样品11,12,5,17,3,25,15,共7个,第4类包括6,7,18,13,24共5个,第5类包括27共1个。
白葡萄酒的理化指标分析得,数据中的28份样品可以聚为5类,第1类包括6,23,2,21,1,9,17,19,8,26,22等共11个,第2类包括4,10,5,15,20,12等共6个,第3类包括3,7共2个,第4类包括11,25,13,16,14,18等共6个,第5类包括24,27共2个。
结果:
23、25、17、4、28、5、21、16、
2、8、19
9、12、22、26、3、11
14、20、1、10、15、6、18、7
13、24
再结合第二组品酒员的评分(见附录)得到对葡萄的分类等级如下:
分类等级如下:
A:
23、25、17、4、28、5、21、16、
B:
9、12、22、26、3、11
C:
14、20、1、10、15、6、18、7
D:
2、8、19
E:
13、24
4.3问题三的模型建立与解答
利用附表二和附表三的资料,在每一种理化指标的数据中,有多组数据的时候,要取其平均值,然后根据对应的含量建立模型,就红葡萄酒中的“花色苷”为例,另葡萄酒中的含量为
,酿酒葡萄中的含量为
,
取表中的平均值,建立模型
,其中
为与单位、溶解度、挥发性、沸点等物理化学性质相关的系数。
进行到此时,我们需灵活运用数学知识,利用数学分析结合MATLAB数学软件进行拟合相结合来推导出
的值,需要考虑
与单位、溶解度、挥发性、沸点等物理化学性质的关系。
其他物质含量可以与此同样的方法得出其关系。
最后根据每组的样品
和模型在matlab中作出折线图,进行对比。
4.4问题四的模型建立与评价
对于问题四,我们需要根据前面讨论的葡萄酒质量级别来归类,并用Excel工具进行理化指标分析,分别看一、二、三、四级别的酒各种理化指标的分布范围,然后列出表格,总结出理化指标与葡萄酒级别之间的关系,假设将评价的分值作为等式左边的值,那么右边就是各种理化指标的数据及系数因子,讨论出两者的数学关系。
最后进行论证,利用分值在matlab中画出“理化指标-分值”折线,再利用理化指标及评分的关系在同一个图中画出“理化指标-分值”折线。
最后两个折线图进行比较,相似则说明关系式正确,其中系数因子就是确定能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的标量,如果关系式推导不出或者找不出多大关系,则表明不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
6.模型结果的分析与检验
对模型求解结果的实际意义进行分析,说明其合理性和实用性。
对求解方法和结果做适当的误差分析、灵敏度分析等。
7.模型的推广与改进方向
在问题一对葡萄酒的感官评价中,由于品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价差异很大。
从而不能真实地反映不同酒样间的差异。
因此,在对感官评价结果进行统计分析时.必须对品酒员的原始数据进行相应的处理,以真实反映样品间的差异。
对有关数据处理方法的比较分析结果表明:
标准化法不仅没有消除品酒员间的异质性,反而加大了品酒员间的差异;而置信区间法对原始数据进行调整,能有效地降低品酒员间的差异,真实地反映酒样间的客观差异。
参考文献
[1]孔程仕.葡萄酒香气成分分析[J].饮料工业,2012,(03).
[2]姜启源.数学模型(第三版)[M].北京:
高等教育出版社,1999.
[3]韩中庚.数学建模方法及其应用(第二版)[M].北京:
高等教育出版社,2009.
[4]李华.葡萄酒感官品评的客观方法[J].湖南轻专学报,1990,3
(1):
1~8.
[5]葛庆龙.SPSS的聚类分析功能再试卷分析中的应用[J].统计教育,2008
(1):
53-54.
附录
附录一综合评价
酒样号
第一组白葡萄酒品尝综合评分
第二组白葡萄酒品尝综合评分
第一组红葡萄酒品尝综合评分
第二组红葡萄酒品尝综合评分
1
82
77.9
62.7
68.1
2
74.2
75.8
80.3
74
3
85.3
75.6
80.4
74.6
4
79.4
76.9
68.6
71.2
5
71
81.5
73.3
72.1
6
68.4
75.5
72.2
66.3
7
77.5
74.2
71.5
65.3
8
71.4
72.3
72.3
66
9
72,.9
80.4
81.5
78.2
10
74.3
79.8
74.2
68.8
11
72.3
71.4
70.1
61.6
12
63.3
72.4
53.95
68.3
13
65.9
73.9
74.6
68.8
14
72
77.1
73
72.6
15
72.4
78.4
58.7
65.7
16
74
67.3
74.9
69.9
17
78.8
80.3
79.3
74.5
18
73.1
76.7
59.9
65.4
19
72.2
76.4
78.6
72.6
20
77.8
76.6
78.6
75.8
21
76.4
79.2
77.1
72.2
22
71
79.4
77.2
71.6
23
75.9
77.4
85.6
77.1
24
73.3
76.1
78
71.5
25
77.1
79.5
69.2
68.2
26
81.3
74.3
73.8
72
27
64.8
77
73
71.5
28
81.3
79.6
附录二可信度数据处理
酒样品
第一组红葡萄酒品尝综合评分
第二组红葡萄酒品尝综合评分
第一组白葡萄酒品尝综合评分
第二组白葡萄酒品尝综合评分
第一组评酒员对红葡萄酒评分间的方差
第二组评酒员对红葡萄酒评分间的方差
第一组评酒员对白葡萄酒评分间的方差
第二组评酒员对白葡萄酒评分间的方差
1
62.7
68.1
82
77.9
92.9
81.8778
92.2222
25.8778
2
80.3
74
74.2
75.8
39.7889
16.2222
201.067
49.0666
3
80.4
74.6
85.3
75.6
45.8222
30.7111
365.122
142.489
4
68.6
71.2
79.4
76.9
108.044
41.2889
44.7111
42.1
5
73.3
72.1
71
81.5
62.0111
13.6556
126.444
26.2778
6
72.2
66.3
68.4
75.5
59.7333
21.1222
162.711
22.7222
7
71.5
65.3
77.5
74.2
103.611
62.6778
39.1667
42.1778
8
72.3
66
71.4
72.3
44.0111
65.1111
183.6
31.1222
9
81.5
78.2
72,.9
80.4
32.9444
25.7333
92.7667
106.267
10
74.2
68.8
74.3
79.8
30.4
36.1778
212.678
70.4
11
70.1
61.6
72.3
71.4
70.7667
38.0444
177.122
87.8222
12
53.95
68.3
63.3
72.4
79.6556
25.1222
115.789
140.044
13
74.6
68.8
65.9
73.9
44.9333
15.2889
170.767
46.7667
14
73
72.6
72
77.1
36
23.1556
114.222
15.8778
15
58.7
65.7
72.4
78.4
85.5667
41.3444
131.6
54.0444
16
74.9
69.9
74
67.3
18.1
20.1
178
82.2333
17
79.3
74.5
78.8
80.3
88.0111
9.1667
144.178
38.4556
18
59.9
65.4
73.1
76.7
47.2111
50.2667
156.544
30.2333
19
78.6
72.6
72.2
76.4
47.3778
55.1555
46.4
26.0444
20
78.6
75.8
77.8
76.6
26.0444
39.0667
64.4
50.0444
21
77.1
72.2
76.4
79.2
116.1
35.5111
172.711
64.4
22
77.2
71.6
71
79.4
50.6222
24.2667
138.667
53.6
23
85.6
77.1
75.9
77.4
32.4889
24.7667
43.6555
11.6
24
78
71.5
73.3
76.1
74.8889
10.7222
111.122
38.5444
25
69.2
68.2
77.1
79.5
64.6222
43.7333
33.8778
106.5
26
73.8
72
81.3
74.3
31.2889
41.5556
72.9
102.9
27
73
71.5
64.8
77
49.7778
20.5
144.4
35.5556
28
无
无
81.3
79.6
无
无
80.4556
25.3778
平均值
73.055556
70.514815
74.31111
76.53214
58.61932
33.79054
129.1893
56.01944
酿酒红
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
4 ─┐
15 ─┤
20 ─┤
18 ─┤
19 ─┤
12 ─┤
11 ─┤
7 ─┤
22 ─┤
9 ─┤
23 ─┤
1 ─┤
8 ─┤
2 ─┤
13 ─┼───┐
25 ─┤ │
17 ─┤ │
24 ─┤ │
5 ─┤ │
10 ─┤
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 论文