文档库 最新最全的文档下载
当前位置:文档库 › 数学建模A葡萄酒的评价

数学建模A葡萄酒的评价

数学建模A葡萄酒的评价
数学建模A葡萄酒的评价

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):

参赛队员 (打印并签名) :1.

2.

3.

指导教师或指导教师组负责人 (打印并签名):

日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页

赛区评阅编号(由赛区组委会评阅前进行编号):

全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价

摘要

目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与酿

酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄酒和

酿酒葡萄的质量。

对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评

价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两组

评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第二组

的结果更可信。

对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分级。

基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指标的8

种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄酒的质量,

对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要依据。此方法

消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因某一指标数值上

远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最终将酿酒葡萄分为

了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。

对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对

比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归方

程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。

对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。

文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应用

和推广。

关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验

1.问题的重述

确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信?

2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡

萄酒的理化指标来评价葡萄酒的质量?

2.问题的分析

对问题1,我们对附件一所给的葡萄酒品尝评分表进行统计学分析,根据各组评酒员对同一种葡萄酒的评价结果算出每种酒样品的得分,并对每组的数据进行方差分析,利用F检验求出两组间的显着水平,并与0.05的显着水平比较,从而判断两组评酒员的评价结果有无显着性差异。确定哪组更可信时,分别求出两组评价结果的方差进行比较,方差越小,可信度也就越高。

对问题2,要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,属于分类问题。对该问题,可以采用主成分分析法,建立综合评价模型。选取附件2中关于葡萄的一级指标作为影响等级划分的因素,采用因子分析法,确定主成分,结合问题1所得出的葡萄酒的质量对酿酒葡萄进行综合评价并分级。

对问题3,分析酿酒葡萄与葡萄酒的理化指标之间的联系,既然是分析两指标之间的联系,就少不了作比较,从比较数据成对出现这一方面考虑,应该选取酿酒葡萄与葡萄酒理化指标中的共有指标进行分析,用一元线性回归模型求出对应指标之间的函数关系,进而确定酿酒葡萄与葡萄酒的理化指标之间的联系。

对问题4,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,参照问题2中酿酒葡萄的理化指标的处理方法,对葡萄酒的理化指标做同样分析。加权处理得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量产生影响的综合因子E,根据葡萄酒质量排名和E排名比较出产生的影响大小。

3.模型的假设

(1)假设评酒员都有很高的品评资质,给出的评价结果客观可信。

(2)假设问题1中葡萄酒的质量只与评酒员的评分有关。

(3)假设更可信的评分组给出的数据可以代表葡萄酒的真实质量。

4.符号说明

符号一SS方差

符号二df自由度

符号三MS标准差

符号四F统计量

符号五value

P 假定值

符号六crit

F F临界值

符号七Sig F值实际显着性概率

F对应的主成分值

符号八

i

符号九G总主成分值

y因变量

符号十

i

x自变量

符号十一

i

符号十二 E 综合因子

5.模型的建立与求解

5.1 问题1的模型建立与求解

在评价结果采用百分制的前提下,对每一个品酒员所给出的每一种样品酒的评价结果求和,并求出每一组10名评酒员对同一种酒评价结果总分的平均值,此平均值即为本组针对该样品酒给出的评分,得到两组分别对27个红葡萄酒样品和28个白葡萄酒样品给出的评分。用Excel 中的数据分析对每组的数据进行方差分析,利用F 检验判断两组评酒员的评价结果有无显着性差异。

方差分析结果如下:

(1)分析两组评酒员对红葡萄酒的评价

表(1):方差分析

方差分析:单因素方差分析

SUMMARY

组 观测数

求和

平均

方差

列 1 27 1972.9 73.07037 53.51524 列 2

27 1903.9 70.51481 15.82439

方差分析

差异源 SS df

MS F P-value F crit

组间 88.16667 1 88.16667 2.543038 0.116842 4.026631

组内

1802.83

52 34.66981

总计

1890.997

53

因为统计量)52,1(0266.45430.205.0F F ≈<≈,所以对红葡萄酒而言,两组评酒员的评价结果没有显着性差异。

因为第二组的方差远小于第一组,所以第二组的可信度高于第一组,即第二组的结果更可信。

(2)分析两组评酒员对白葡萄酒的评价

表(2):方差分析

方差分析:单因素方差分析

SUMMARY

组 观测数

求和

平均

方差

列 1 28 2079.3 74.26071 27.05284 列 2

28 2142.9 76.53214 10.05485

方差分析

差异源 SS df

MS F P-value F crit

组间 72.23143 1 72.23143 3.89307 0.053613 4.019541

组内

1001.908

54 18.55385

总计

1074.139

55

因为统计量)54,1(0195.48931.305.0F F ≈<≈,所以对白葡萄酒而言,两组评酒员的评价结果没有显着性差异。

因为第二组的方差小于第一组,所以第二组的可信度高于第一组,即第二组的结果更可信。

综上所述,两组评酒员的评价结果无显着性差异,且第二组的结果更可信。 5.2 问题2的模型建立与求解

对于问题2,要求根据酿酒葡萄的理化标准及葡萄酒的质量,对酿酒葡萄进行分级,我们考虑红白两种酿酒葡萄及葡萄酒,建立模型,采运因子分析的方法进行主成分分析。

(1) 首先对所给附件二的数据进行求平均值等优化处理,以便于进行运算。为了对酿酒葡萄进行客观分级,采用主成分分析法,应用SPSS 软件对数据进行因子分析,具体实施步骤如下:

1、数据的标准化

2、求出R 及其特征值,贡献率

运用SPSS 软件计算出相关矩阵R 及其特征值,贡献率。在主成分个数选取时,按照

特征值大于1的原则,计算结果如下表:

表(3):方差分解主成分提取分析表

成份初始特征值提取平方和载入

合计方差的 % 累积 % 合计方差的 % 累积 %

1 6.966 23.221 23.221 6.966 23.221 23.221

2 4.940 16.467 39.687 4.940 16.467 39.687

3 3.737 12.457 52.14

4 3.737 12.457 52.144

4 2.840 9.467 61.611 2.840 9.467 61.611

5 1.999 6.663 68.274 1.999 6.663 68.274

6 1.742 5.808 74.082 1.742 5.808 74.082

7 1.418 4.728 78.810 1.418 4.728 78.810

8 1.270 4.234 83.044 1.270 4.234 83.044

9 .961 3.203 86.247

10 .738 2.461 88.708

11 .691 2.302 91.010

12 .514 1.713 92.723

13 .494 1.645 94.368

14 .372 1.240 95.608

15 .296 .986 96.594

16 .254 .846 97.440

17 .218 .728 98.169

18 .200 .668 98.836

19 .112 .375 99.211

20 .070 .234 99.445

21 .062 .206 99.651

22 .043 .143 99.794

23 .032 .108 99.902

因此我们选取前8个成分作为主要成分,即:F1、……、F8。

然后求出成分矩阵,得出主成分的线性表达式。

8个主成分的成分矩阵如下表:

表(4):成分矩阵

成份

1 2 3 4 5 6 7 8

总酚.863 -.171 -.177 .224 -.018 .184 -.011 .088 花色苷.847 -.106 -.106 -.302 .097 .196 -.093 .063 DPPH自由基.756 -.461 -.013 .215 -.023 .114 .212 .114 单宁.756 -.152 -.280 -.068 -.166 .246 .243 -.057 葡萄总黄酮.719 -.286 -.197 .284 .031 .297 .124 .057 蛋白质.614 -.499 .181 .272 .193 -.129 .081 -.126 果梗比.583 -.212 .172 -.215 -.411 -.405 .088 .040 L* -.564 -.330 .305 -.038 .050 -.307 .076 .345 黄酮醇.558 .022 .028 -.070 -.173 -.501 .476 .216 出汁率.545 -.181 -.271 .169 .016 .398 -.144 .015 百粒质量-.534 -.355 -.472 .079 .269 .149 .222 .194 干物质含量.375 .856 -.189 .094 .095 -.024 .054 .034 总糖.256 .785 -.150 .261 .103 -.040 -.072 .297 还原糖.079 .769 -.113 .128 .116 -.108 -.050 .073 可溶性固形物.246 .760 -.316 .147 .121 -.048 -.025 .266 氨基酸总量.375 .543 .016 .455 -.241 -.297 .167 -.009 白藜芦醇.064 -.060 .818 .075 -.217 .165 .293 .294 果皮颜色-.332 .278 .738 .052 -.020 .294 .257 .213 果皮质量-.257 -.247 -.613 -.112 .325 -.080 .477 .221 b* -.138 .488 .601 -.023 .191 .455 .295 .090 可滴定酸-.302 .458 -.596 -.004 -.330 .220 .296 -.138

褐变度 .597 -.090 .054 -.707 -.020 -.057 -.081 .110 PH 值 .270 -.280 .184 .696 .130 -.115 -.286 .240 苹果酸 .391 .321 .166 -.661 .087 .367 -.114 .117 多酚氧化酶活力 .313

.087

-.214

-.594

.235

-.339

-.007

.165

果穗质量 -.343 -.460 -.220 .067 .598 .044 .227 .093 VC 含量 -.142 -.397 .094 -.009 -.546 .132 -.022 .160 固酸比 .396 -.052 .431 -.002 .534 -.104 -.317 .223 酒石酸 .381 .099 .367 .386 .312 -.145 .202 -.516 柠檬酸

.305

.190

.400

-.367

.356

-.072

.292

-.428

由上面表(4)可以看出:总酚、花色苷、单宁、DPPH 自由基、葡萄总黄酮、蛋白质、果梗比、黄酮醇、多酚氧化酶活力、出汁率和褐变度为第一主成分,干物质含量、总糖、还原糖、可溶性固体物、氨基酸总量和可滴定酸为第二主成分,白藜芦醇、果皮颜色、b*和柠檬酸为第三主成分,PH 和酒石酸为第四种主成分,百粒质量、果穗质量、固酸比为第五主成分,苹果酸为第六主成分,果皮质量为第七主成分,VC 含量、L*为第八主成分。

然后计算出8个主成分用原来指标表达出的线性关系式,其中各变量前的系数为表(4)中数据除以其对应主成分的特征值开平方得到,即:

/ji ji Z x =(ji x j i .30,3,2,1.8,,3,2,1ΛΛ==为表(4)中相应特征值,j a 为主成分特征值)(所得系数见附录2)

*i ji hj F Z b = (1,2,3,,8.1,2,3,30,1,2,3,b hj i j h ===L L ,

…,27。为酿酒葡萄原始数据)

最后计算出综合指标,用8个主成分的贡献率分别乘以F1、F2、F3……F8的值得出最终的G 值,其表达式如下:

由问题一得到的结果可知,第二组的评价结果更可信,所以,该问题建模时使用第二组的评分作为葡萄酒质量的依据,因为酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,故两者之间有着很强的相互依赖关系。

综合考虑酿酒葡萄的理化标准和葡萄酒的质量来对酿酒葡萄进行分级。分级见下表:

表(5):对酿酒红葡萄的分级

含量多少等因素直接相关,由于酿酒葡萄的理化标准是按主成分分析得出的,其F值不能与葡萄酒质量的评分直接叠加使用进行综合排名,加之葡萄酒质量除与酿酒葡萄的好坏直接相关。我们进行了主成分分析F值的排名和根据葡萄酒的质量进行两种排名。对于综合排名分级,我们为了避免讨论两者所占的权重,采取了两种排名名次的求和重新进行排名分级,结果显得更加客观。最后,我们以10作为区间长度,将葡萄分为五个等级。

(2)同理,我们对酿酒白葡萄运用SPSS软件进行主成分分析,取特征值大于1的因子作为主成分,得出的主成分提取分析表如下:

表(6):方差分解主成分提取分析表

19 .176 .585 98.744

20 .117 .391 99.135

21 .096 .320 99.455

22 .064 .213 99.668

23 .051 .171 99.839

24 .023 .077 99.917

25 .014 .047 99.963

26 .008 .026 99.990

27 .003 .010 100.000

28 8.222E-17 2.741E-16 100.000

29 -4.434E-18 -1.478E-17 100.000

30 -1.318E-16 -4.393E-16 100.000

由上表可知,有10种成分的特征值大于1,总贡献率达到83%,适宜做主成分分析,因此我们选取前10个成分作为主要成分。

各主成分的的成分矩阵如下:

表(7):成分矩阵

成份

1 2 3 4 5 6 7 8 9 10

.835 -.175 .105 .155 -.062 -.091 .114 .222 -.137 -.067 干物质含量

g/100g

.802 -.300 -.028 -.041 -.274 .297 .067 -.034 .162 -.042 可溶性固形物

g/l

总糖g/L .756 -.189 -.097 .018 -.346 .037 .082 -.035 .169 -.143 还原糖g/L .721 -.073 .004 .164 -.273 -.199 .276 .245 -.028 .073 果皮颜色b* .646 .152 -.613 .004 .275 -.085 .044 -.188 -.078 .107 氨基酸总量.592 .111 .181 .532 .061 .126 -.060 -.159 .070 .164 出汁率(%) -.577 .204 -.231 .216 .210 -.057 .173 -.301 -.012 -.450 果穗质量/g -.576 .478 .278 .226 -.013 -.167 -.046 -.138 .057 .179 L* .519 .366 -.497 -.071 .357 -.019 -.182 -.145 -.208 .091

宁(mmol/kg)

.472 .372 .231 -.134 -.211 .260 -.301 .319 -.143 -.340

百粒质量/g -.462 .301 -.142 -.071 -.388 .282 .113 -.003 .328 .265

多酚氧化酶活力 -.450 -.385 -.076 -.195 -.051 .305

.372

.135 -.284 -.055

(mmol/kg) .071 .763 .465 -.140 .221 .167 -.163 .050 -.034 -.150

葡萄总黄酮(mmol/kg ) .002 .763 .502 -.050 .132

.202 -.187 .094 -.129 -.044

蛋白质 .224 .640 .232 -.301 .004 -.250 .273 -.054 .011 -.068

固酸比 .151 -.628 .583 -.213

.127

.024 -.029 -.222 -.117 .146

可滴定酸(g/l ) -.020

.625 -.547 .286 -.174 .059

.092

.212

.205 -.170

酒石酸 .342 -.492 .019 .223 .410 .435 -.092 -.115 .329 -.053

DPPH 自由基1/IC50(g/L ) .435

.452 -.133 -.126 -.210 .198 -.326 -.015 -.070

.278

花色苷 -.380 -.421 .129 .279 .187 .238 -.142

.302 -.369 .308

果皮颜色a* -.280 -.496 .576 -.012 -.062 -.132

.003

.281 .276 -.251 VC -.292 .014 -.553 -.341 .133 .305 -.312 .139 .215 .006 黄

醇(mg/kg) .270

.288

.501 -.357

.441

.068

.081

.283

.260

.083

果梗比(%) -.170 -.390 -.480 .117

.342

.065 -.194 .312

.337 -.058 果皮质量(g ) -.261 .368 .371 .220 -.331 .351 .129 -.264

.299

.177

苹果酸 .133 .386

.101

.610

.389

.149

.281 -.008 -.029 -.147 褐变度 .215 .149 -.128 -.591 .324 -.193

.395 -.023

.278 .157 白藜芦醇(mg/kg) .066

.062

.235

.387

.127 -.607 -.247

.241

.284

.212

柠檬酸 .223 -.107 .289

.066

.301

.353

.455

.006

.000

.097

PH 值

.284 -.403

.355 -.127 .012 -.082 -.411 -.489 .148 -.201

与(1)采用相同的方法进行处理得出主成分数据。从而根据所得数据对酿酒白葡萄进行分级如下:

表(8):对酿酒白葡萄的分级

5.3问题3的模型建立与求解

画出酿酒葡萄与葡萄酒的相同指标的散点图,我们以单宁含量为例

图(1):酿酒葡萄和葡萄酒的单宁含量

不妨假设散点有线性关系,做一元线性回归分析,建立酿酒葡萄和葡萄酒的理化指标之间的函数关系。把酿酒葡萄的理化指标作为自变量,葡萄酒的理化指标作为因变量,建立线性回归的数学模型:

运用SPSS统计功能,分别对每一组指标进行求解,求得每一组指标之间的函数关系,下面以酿酒红葡萄和红葡萄酒的单宁含量对比值为例

表(9)模型汇总b

模型

R R 方调整 R 方标准估计的误差Durbin-Watson

1 .718a.516 .496 2.06150 1.577

R方(拟合优度):是线性回归的决定系数,说明自变量和因变量形成的散点与回归曲线的接近程度,数值介于0和1之间,这个数值越大说明回归越好,也就是散点越集中于回归线上。

表(10)方差分析表

模型 平方和 df

均方 F Sig.

1

回归 113.084 1 113.084 26.609

.000a

残差

106.245

25

4.250

总计 219.329 26

此表时所用的模型的检验结果,一个标准的方差分析表。Sig 值是回归关系的显着性系数,Sig 是F 值实际显着性概率即P 值。当Si g<=0.05的时候,说明回归关系具有统计学意义。如果Sig>0.05,说明二者之间用当前模型进行回归没有统计学意义,应该换一个模型来进行回归。

由表可见所用的回归模型F 统计量值26.609,P 值为0.000,因此我们用的这个回归模型是有统计学意义的。

表(11) 系数

模型

非标准化系数 标准系数 t Sig.

B

标准 误差

试用版

1

(常量)

2.891

.936

3.088

.005

酿酒葡萄 .315 .061 .718

5.158 .000

此表给出了包括常数项在内的所有系数的检验结果,用的是t 检验,同时还会给出标化/未标化系数。

表(12) 残差统计量

极小值 极大值 均值 标准 偏差

N

预测值 4.0812 10.8980 7.2661 2.08552 27 残差 -6.91305 3.94995 .00000 2.02147 27 标准 预测值 -1.527 1.742 .000 1.000 27 标准 残差

-3.353

1.916

.000

.981

27

上面的回归分析结果表明:酿酒红葡萄的单宁含量与红葡萄酒的单宁含量关系极为密切,有显着的线性关系。

综合以上得出回归方程为:

图(2):回归 标准化残差的标准P-P 图

由以上结果及图(2)的标准化残差的线性关系可以验证出假设的合理性,所以可

以用线性回归对各个指标进行线性回归。用同样的方法可以得出各有效指标(Sig 小于0.05)的回归分析结果(见附表)和回归方程:

酿酒红葡萄与红葡萄酒的总酚回归方程: 1.3620.333y x ∧

=+ 酿酒红葡萄与红葡萄酒的DPPH 回归方程:0.080.886y x ∧

=-+

酿酒红葡萄与红葡萄酒的花色苷回归方程:14.335 2.386y x ∧∧

=+ 酿酒红葡萄与红葡萄酒的总黄酮回归方程:0.7630.503y x ∧

=+ 酿酒白葡萄与白葡萄酒的单宁回归方程:0.9640.237y x ∧

=+ 酿酒白葡萄与白葡萄酒的总酚回归方程:0.7220.099y x ∧

=+ 酿酒白葡萄与白葡萄酒的DPPH 回归方程:0.0160.124y x ∧

=+ 酿酒白葡萄与白葡萄酒的总黄酮回归方程:0.4420.533y x ∧

=-+ 5.4 问题4的模型建立与求解

问题4要求分析酿酒葡萄和葡萄酒的理化指标对葡萄质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。以白葡萄为例,根据问题2中对酿酒白葡萄的理化指标的分析方法,对白葡萄酒的理化指标进行同理分析,得出以下两组分析结果:

表(13) 白葡萄G 值和白葡萄酒的G 值及质量

价中不起作用,把酿酒白葡萄的G 值按照降序排列得出的序号作为第一个变量t1,把白葡萄酒的G 值按照降序排列得出的序号作为第二个变量t2。定义一个量E ,令21t t E +=,算出E 值并按升序排序将其作为第三个变量t3,把葡萄酒的质量按打分结果进行降序排列,排出的序号作为变量t4,结果如下:

表(14) 白葡萄和白葡萄酒的各项排名

E 的排名t3做双样本方差的

F 检验,检验结果如下表:

表(15) 双样本方差分析

F-检验 双样本方差分析

25

1

平均 15 方差

63 观测值 27 27 df 26

26

F

P(F<=f) 单尾 F 单尾临界

查F 分布表得(27,27,05.021===n n α):

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

数学建模--葡萄酒的分级(正式版)

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子 邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关 的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其 他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式 在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违 反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西安理工大学 参赛队员 (打印并签名) :1. 郑晓东 2. 罗璐 3. 宫维静 指导教师或指导教师组负责人 (打印并签名): 日期: 2013 年 05月 10 日

葡萄酒质量的综合评价分析 摘要 近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。 对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。 对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。 对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。

葡萄酒的评价完整版

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价方法研究 摘要 在本文中,我们分析葡萄酒和酿酒葡萄的理化指标与所酿的葡萄酒的质量之间的关系,研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。 针对问题一,本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果,运用方差分析法来分析两组评价结果差异的显着性。在显着性水平取为0.05的情况下,发现两组评价结果的均值和方差均满足齐性,即两组评酒员的评价结果没有显着性差异。因无显着差异,本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值,计算两组评酒员对于各酒样品评分的方差并求和,结果显示第二组的总方差明显小于第一组,即其评分稳定性更高,得出第二组的评价结果更可信。 针对问题二,本文借助问题一中第二组的评价结果,将葡萄酒的质量数量化。运用主成分分析方法,得出酿酒葡萄的主要理化指标,在此基础上运用相关性分析法,分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度,将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准,其中权重取为理化指标的相关系数。把各葡萄样品的主要理化指标代入表达式,得到最终加权平均值,对其划分级别,并作为葡萄的级别。结果显示红葡萄样品集中在第2,3,4级,而白葡萄大多数集中在第2级(级别数值越小代表葡萄质量越好)。 针对问题三,本文依据问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,分析了葡萄酒的理化指标与酿酒葡萄的主要理化指标之间的相关程度,我们得到的主要结论为:红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关,与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关;白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。 针对问题四,考虑到除葡萄与葡萄酒的理化指标外,葡萄与葡萄酒的芳香物质可能对葡萄质量也会造成影响。首先,运用主成分分析法,得出芳香物质中的主要成分,并借助问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。根据所得结果,取与葡萄酒质量关联程度较大的因素作为自变量,以葡萄酒质量作为因变量,运用多元线性回归模型建立相应的函数关系。通过上述定性与定量分析,说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响,因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。 以上结果具有较高的可靠性和可行性,对于葡萄酒的评价具有一定的指导意义。关键词:葡萄酒质量理化指标方差分析主成分分析多元线性回归相关性分析 一:问题重述

数学建模A葡萄酒的评价完整版

数学建模A葡萄酒的评 价 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开 展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与 酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄 酒和酿酒葡萄的质量。 对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评 价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两 组评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第 二组的结果更可信。 对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分 级。基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指 标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄 酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要 依据。此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因 某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最 终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。 对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对 比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归 方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。 对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。 文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应 用和推广。 关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验 1.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

基于数据挖掘技术的葡萄酒评价体系研究

Advances in Applied Mathematics 应用数学进展, 2015, 4(4), 376-384 Published Online November 2015 in Hans. https://www.wendangku.net/doc/a76283087.html,/journal/aam https://www.wendangku.net/doc/a76283087.html,/10.12677/aam.2015.44047 The Study on Evaluation System of Wine Based on Data Mining Sizhe Wang1, Zhigang Wang2*, Yong He2 1Automation Professional Class 1301, School of Information Science and Engineering, Central South University, Changsha Hunan 2College of Information Science and Technology, Hainan University, Haikou Hainan Received: Nov. 8th, 2015; accepted: Nov. 23rd, 2015; published: Nov. 30th, 2015 Copyright ? 2015 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.wendangku.net/doc/a76283087.html,/licenses/by/4.0/ Abstract Based on Question A of Mathematical Contest in Modeling for college students in 2012, the empha-sis in this paper is mainly on the establishment of evaluation system of wine based on data mining technology. The wine quality is determined by the score of the wine tasting. We analyze the credi-bility of the liquor score by one-way ANOVA. We classify the wine grape by extracting common factors of some physical and chemical indicators from the wine grape, and by clustering the factor score and wine score. The stepwise regression model is established through the correlation be-tween the physical and chemical indicators and the physical and chemical indicators of wine grapes. By the regression model between the aroma substances and the score of the wine, the key physical and chemical indicators of wine quality will be found. In the end, some shortcomings of current rating system of wine will be pointed out. Keywords Evaluation System of the Wine, Data Mining Technology, One-Way ANOVA, Cluster Analysis, Regression Analysis 基于数据挖掘技术的葡萄酒评价体系研究 王思哲1,王志刚2*,何勇2 1中南大学信息科学与工程学院自动化专业1301班,湖南长沙 2海南大学信息科学技术学院,海南海口 *通讯作者。

数学建模葡萄酒评价.docx

A题:葡萄酒的评价 摘要 本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理 化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型, 解决了葡萄酒的评价问题。 问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel 画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。 问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各 因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表: 等级优良中合格葡萄种类 红葡萄54108 白葡萄8892 问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP 神经网络进行比较验证。 问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量 间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价 分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。 本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。 关键词:方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述 通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题: 1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 问题一:观察附表 1 中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡 萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型, 对各个数量指标进行分析比较,得出更有可信度组。 问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。 问题三:题中葡萄与葡萄酒指标数分别为 60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。 问题四:考虑参数过多,为剔除微小影响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。 三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i:表示第 i 个处理观测值总体平均数。 ij :表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss :表示误差平方和。 e ss t表示处理间平方。

葡萄酒的评价大学生数学建模竞赛

葡萄酒的评价大学生数学建模竞赛

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西南科技大学 参赛队员 (打印并签名) :1. 周立 2. 李婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名):杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。 问题一: (1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。 (2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的α信度系数,分别求出两组评分的α信度系数。综合考虑这两个方面,得出第二组评分较为可信。 问题二: (1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。 (2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。 问题三: 对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。 问题四: (1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。 (2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:t检验α信度系数主成分分析 BP神经网络 GA优化BP神经网络

有关葡萄酒评价的数学建模论文

葡萄酒的评价 摘要 本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。 关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得 P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。 关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。 关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。 关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。 关键词:葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2.问题分析 问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据,我们采用曲线拟合处理这一问题。因为所给数据是小样本,总体标准差 未知的正态分布资料,因此采用T检验,根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,方差大的一组则说明其打分较为严格,即说明他们对待评酒较为认真,从而认为其较为可信。 问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系,所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序,根据综合评分的排序结果对酿酒葡萄样品分级;然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级,此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。 问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系,即要求得出它们各项理化指标之间联系的紧密程度,所以采用回归分析的方法计算它们的各理化指标的相关系数,然后以相关系数的绝对值大小表示它们之间联系的紧密程度。 问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系,且葡萄酒的理化指标相对较少,因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果,得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素,再依据这几个因素结合葡萄酒质量排序,便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来,判断其对葡萄酒质量是否有影响,从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

葡萄酒评语

葡萄酒评语 篇一:葡萄酒评价 葡萄酒的评价 摘要 对于解决葡萄酒的评价问题及其之间的联系,需要运用到统计学中不同的分析方法,同时建立模型,再利用相应的软件进行求解。 针对问题一,通过分析十位评酒员对不同葡萄酒的打分进行统计整理,得到每位评酒员对所有酒样品的总得分,利用个spss软件,通过对总得分进行T检验分析得到均值,标准差,误差等相应的数据,可以得出两组评酒员的评价结果存在的差异性,根据数值比较可知,第二组评酒员评价结果之间的浮动较小,因此确定第二组的评价结果比较可信。 针对问题二,采用主成分分析和聚类分析对酿酒葡萄进行分级,首先通过spss软件对酿酒葡萄的理化指标进行主成分分析,对主成分累计贡献率进行归一化分析得出其权重和酿酒葡萄中的主要物质的相关系数矩阵。再通过相关数据利用maTLaB得出聚类图。因为酿酒葡萄的组数较多,可将其分为4类,以便聚类图能清晰表明酿酒葡萄的等级。 针对问题三,运用spss软件及问题二的模型对酿酒葡萄和葡萄酒理化指标分析,从红葡萄和红葡萄就中提取9中主要物质(见表三1),

白葡萄与白葡萄酒中提取8中主要物质(见表四1)。再对酿酒葡萄和葡萄酒理化指标进行通过典型相关分析。更加准确的反应出酿酒葡萄与葡萄酒理化指标之间联系。 针对问题四,建立多元线性回归模型分析葡萄和葡萄酒的理化指标及芳香物质对葡萄酒的影响,利用spss软件得出图四和图六,由图中数值分析得出拟合线性回归的残差浮动区间为[-1,1],因此葡萄酒的质量可以由酿酒葡萄和葡萄酒的理化指标以及芳香物质共同反应。 关键字:T检验、主成分分析、聚类分析、典型相关分析、多元线性回归分析 一问题重述 1.1问题背景与条件 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。 1.2预解决的问题 1、问题一分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结信? 2、问题二根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3、问题三分析酿酒葡萄与葡萄酒的理化指标

全国大学生数学建模竞赛题葡萄酒的评价答案全解

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析

葡萄酒质量的综合评价分析模型

葡萄酒质量的综合评价分析模型 专家点评: 本文问题一方法合理,结论正确。问题二对葡萄理化指标进行聚类,然后根据葡萄酒质量进行分级,思路简明正确。问题三进行多元线性回归,尚可,但如果能进行相关性分析会更好。问题四用逐步回归的方法,适当,加入芳香类物质,使结论更加合理。如果问题二和问题三也能将附件三考虑入内会使结论更加有力。 【摘要】 近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增,特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平,如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。本文主要研究了葡萄酒的品质与葡萄酒自身以及酿酒葡萄的理化指标的关系,给出了基于葡萄酒自身的理化指标以及酿酒葡萄的理化指标与芳香物质的定量综合评价模型。 首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,得到了两组评酒员的评分存在显著差异的结论,并通过对两组数据进行方差分析,以判别结果具有的稳定性作为标准,得到第二组比较可靠。 接下来我们结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 更进一步,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。 最后我们将提取葡萄及葡萄酒的理化指标与芳香物质中的主成分,利用逐步回归的方法考察理化指标与芳香物质对葡萄酒质量的影响程度,通过对芳香物质对葡萄酒质量影响比重得到芳香物质对葡萄酒的质量有30%以上的影响比重(白葡萄的芳香物质对白葡萄酒的质量影响相对更大),故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。 关键词:假设检验聚类分析主成分分析逐步回归

基于改进层次分析法的葡萄酒品质评价模型

基于改进层次分析法的葡萄酒品质评价模型 【摘要】葡萄酒理化指标众多,这些理化指标是评价葡萄酒品质过程中必不可少的参考因子。本文通过几项葡萄酒理化指标的国家标准进行建立葡萄酒的评分模型,对模型所得结果与专业评酒员的评分作排序对比。一般的层次分析法具有定性色彩,因此建模过程中使其与数据进一步关联,使之更为客观的定量分析评价。最后检验得知模型评分排名与专业评酒员评分排名相近,因此认为利用三标度法对葡萄酒品质评价进行数学建模可行。 【关键词】层次分析法;三标度法;数据关联 0 引言 美国运筹学家匹茨堡大学教授萨蒂于本世纪70年代初,提出的一种层次权重决策分析方法。所谓层次分析法,是指将一个复杂的多目标决策问题作为一个系统,将目标分解为多个目标或准则,进而分解为多指标(或准则、约束)的若干层次,通过定性指标模糊量化方法算出层次单排序(权数)和总排序,以作为目标(多指标)、多方案优化决策的系统方法。葡萄酒的评价多依赖人工评价,因此评价过程中不可避免的带有主观因素。对此,结合客观的评价方法可减少人工评价过程中主观因素所造成的误差,较准确的对葡萄酒进行分级。由于层次分析法具有一定的定性色彩,与数据的关联程度不高,因此为了使其能在需要定量分析的问题中得以应用,本文将在建模过程中使其与数据的关联程度增加,从而使其在定量分析的问题中更加客观。(本文数据均取自于2012年全国大学生数学建模竞赛A题。) 1 确定评价因子权重 根据现有葡萄酒国家标准葡萄酒中葡萄糖、干浸出物、乙酸、柠檬酸、二氧化硫、甲醇、苯甲酸、山梨酸的含量限定值的比较构建比较矩阵来计算8种理化指标的权重,代入,构建基于改进层次分析法的加权平均综合指数法。 1.1 比较矩阵的建立 依据中华人民共和国国家标准中葡萄酒标准得出葡萄酒各理化指标的限量值: 其中根据(1)式得到比较矩阵 1.3 根据判断矩阵算得权重 在矩阵被验证有效的基础上,运用matlab软件计算,得到(4)式标准化后最大特征值对应的特征向量即权重ω=(0.2574,0.4232,0.1164,0.1164,0.024,0.0249,0.0117,0.0249)对计算结果进行一致性检验,得到λ 8.6645,

相关文档
相关文档 最新文档