文档库 最新最全的文档下载
当前位置:文档库 › 葡萄酒质量的评价模型 全国数学建模

葡萄酒质量的评价模型 全国数学建模

葡萄酒质量的评价模型 全国数学建模
葡萄酒质量的评价模型 全国数学建模

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A

我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):长江师范学院

参赛队员(打印并签名) :1. 李蓉

2. 马艳

3. 周成楷

指导教师或指导教师组负责人(打印并签名):廖江东

日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页

赛区评阅编号(由赛区组委会评阅前进行编号):

全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进

葡萄酒质量的评价模型

摘要

本文围绕葡萄酒的质量评价问题进行讨论,主要应用数据的统计原理以及数据的处理方法对酿酒葡萄的分级、葡萄酒和葡萄的理化指标的联系、以及葡萄酒质量评价问题建立了模型,并对模型做了较详细的模型检验,客观地实现了问题的解决。

问题(1),是一个数据统计问题,首先对红、白葡萄酒每类酒的样本数据建立了两独立样本的T检验模型,通过对比T统计量t值与T分布表给出的相伴概率值之间的大小,得出两组数据样本具有显著性差异。对于两数据样本的可信度问题,本文巧妙通过对每类的两个数据样本的均值方差的图像分析和对客观的评价准则考虑,得出结果:第二组评酒员给出的分数更具有可信性。

问题(2),属于多方案排序问题,首先利用问题(1)中的结果得到两组样品的有效性较高的评分数据样本,并借以建立了排序模型。同时本文还应用逼近理想解排序法(TOPSIS法),得出了两类葡萄酒质量的排序,然后通过权重法筛选出氨基酸、糖、蛋白质作为核心理化指标。最后基于“层次分析法”评价模型建立分级评价模型,通过权重算法得到以核心量化指标的贴近度作为分级的标准,确定出了对酿酒葡萄的四个等级:(见表4-15、4-16)。

问题(3),对附件2中一级指标下的多重数据进行求平均值处理获得该级指标的最优值,建立了多元线性回归模型,首先对酿酒红、白葡萄的30种一级指标进行筛选,筛选出众多核心理化指标的最优值,并采用“逐步回归”的方法,针对多重数据下的多种指标进行分别拟合,从中抽出拟合最好的一组数据和结果进行图像分析,得出整体的酿酒葡萄与葡萄酒的理化指标成正相关的关系。

问题(4),本文基于问题(1)、问题(2)和问题(3)的研究结果,首先针对酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响问题,建立了多元回归分析模型,并运用逐步回归方法对这里的最优值进行有效而合理的筛选,之后将筛选得到的多个理化指标给与拟合,并对其进行图像分析,得出筛选出来的5个一级指标就可以反映出整体的关系,最后应用这个结果论证出:用葡萄和葡萄酒的理化指标来判断葡萄酒的质量是不全面的。

关键词:葡萄酒的评价 T检验层次分析法多元线性回归分析逐步回归法

1 问题重述

目前在现实生活中,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

题目中附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

现需完成以下任务:

(1)要分析出两组评酒员评价结果的显著性差异,并确定出哪一组结果更可信;

(2)在解决问题(1)的基础上,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级;

(3)在解决完问题(1)与(2)之后,还要对酿酒葡萄与葡萄酒的理化指标进行分析,从而确定他们之间的联系;

(4)结合上面三个问题的结果,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

2 问题分析

2.1 问题(1)的分析

该问题要求通过对附件1两组评酒员的葡萄酒品尝评分表中的数据作出综合性评价。题目给出了两组评酒员(每组10人)分别对27种红葡萄酒和28种白葡萄酒的评价分数,该问题旨在从给出的评价分数中找出差异的显著程度,并从中确定出哪一组评酒员的结果更具可信性。

对于解决评价结果是否具有显著差异性问题实质是一个两独立样本的T检验问题,他满足检验的前提条件,考虑到方差是表示一组数据分布的离散程度,方差越大,说明变量值的差异越大,距离平均数这个“中心”的离散趋势越大,我们通过建立两独立样本的T检验模型,很好的解决了两组评价结果有误显著差异性问题。而对于两组评酒员给出的评分结果的可信程度问题,我们通过简单计算得到两组样本的平均值的方差,并作出两个葡萄酒样品评价结果分析折线图,通过对图形反映出来两个评分样本的波动剧烈程度可以知道该样本对应的评酒员打分的可信性。对于这个问题,也可采用信度分析法,通过SPSS进行数据分析,得到两组数据的可信度值,进而得到哪一组数据更可信。

2.2 问题(2)的分析

该问题是一个根据所给的数据特点进行综合的分析,研究对各种酿酒葡萄的多个方案的分级问题。我们应该对评价对象的各个指标的联系进行综合性评价。

综合评价的方法有多种,诸如模糊综合评判、灰色关联等,对与此种多属

性问题,可以借助“空间距离”概念的角度来解决,这样就可以通过逼近理想解排序法(TOPSIS 法)建立“逼近理想解的排序模型”,其过程为:首先从问题(1)中数据的可信性判断模型中找出一组可行性较高的样品酒质量的排序结果,并对该组评价对象的各个评酒员的评价指标均找出最优值,设成正理想值;对该组评价对象的各个评酒员的评价指标均找出最劣值,设为负理想解,分别计算每一个评价对象到正理想解和负理想解的距离,从而得到每种酒的各个评价指标的贴近度,应用数据中的权重,计算出最终各酒品种的贴近度,进而排名,得到各个酒品种的贴近值。同时对附件2中的酿酒葡萄各指标数据整合,并筛选出成分含量相对较多的几种指标,结合各个酒品种的贴近值,通过“层次分析法”中的排序模型计算各个指标的权重,进而计算出最终的各个酿酒葡萄的指标总值,进而对其分级。

2.3 问题(3)的分析

问题(3)要求对建立酿酒葡萄和葡萄酒的理化指标之间的联系。首先,我对附件2的各个理化指标进行整体的分析得出二级理化指标的总和近似等于相应的一级指标,因此我们就只用一级理化指标来建立多元回归模型,并采用“逐步回归(stepwise regression )”的方法,对众多理化指标有效的选出核心的理化指标,并通过对这些核心指标进行适当的拟合,最后得出酿酒葡萄和葡萄酒之间的相对关系。 2.4 问题(4)的分析

问题(4)主要是要求我们对酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响的分析。我们采用了问题(3)的处理方法——多元回归分析中的“逐步回归(stepwise regression )”法,分别对酿酒葡萄和葡萄酒的理化指标与葡萄酒质量进行数据拟合,进而得出对葡萄酒影响成正相关和负相关的相应物质的分类,得出结论。

3 模型的假设及符号说明

3.1 模型的假设

(1)假设两组样本之间彼此独立,且来自两个服从正态分布的总体;

(2)假设两组样本数据的总体方差相等,即22

12=σσ;

(3)假设所调查到的数据真实可靠,能很好的反映出大部分人的看法; (4)假设所有的评酒员评酒时的外部环境相同,评酒时不考虑外界因素的影响; (5)假设问题中提供的每个评酒员所打的分数能够充分地反映出每个酒样品的真实情况;

(6)假设每个评酒员在评价每个酒样品时互不影响,而且具有互补性,即每个组的评分员的评分水平相当;

(7)假设计算时附件3中空白处数据默认为0;

(8)假设酿酒葡萄中对所酿的葡萄酒影响较小的成份予以不计;

(9)假设由于白葡萄酒和白葡萄一级指标中的白藜芦醇含量都比较少,视为白葡萄对白葡萄酒的影响较小,即白葡萄对白葡萄酒中的白藜芦醇影响较大的指标没有;

3.2 符号的使用及说明

i 表示i 号评分项目(1,2,i = (10)

j 表示j 号评酒员(1,2,j =…10)

k 表示第k 号酿酒葡萄的样品(对于红葡萄1,2,,27k = ;对于白葡萄

1,2,,28k = )

ij x 表示评酒员j 在评分项目i 之下的取值 k M 表示酿酒葡萄的样品k 号的数据样本均值

k S 表示酿酒葡萄的样品k 号的数据样本均值的方差,

即:10

2

1

()10

jk k j k x M S =-=∑

k S 表示红/白葡萄酒第j 个酒样品的评分方差的平均值 ij f 表示每个样品酒中评酒员j 在评分项目i 上给出的分值 ij r 表示每个样品酒的每一个分值ij f 无量纲化之后的结果 ij v 表示评价项目j 对于评酒员i 的权重

j D + 表示是在评分项目j 下的正距离尺度 j D - 表示在评分项目j 下的付距离尺度 j C 表示在评分项目j 下的理想贴近度

4 模型的建立与求解

4.1问题(1)的模型建立与求解

4.1.1 基于方差分析法的显著差异性评价模型

根据对问题(1)的分析,建立“两独立样本T检验”模型。首先可以将附件1中的数据按照不同的评酒员和相同的样品酒分成两类,一类是红葡萄酒的评分结果,一类是白葡萄酒的评分结果,其中每一类包括两个样本,样本一是第一组评酒员给出的每个酒样品的得分平均值,样本二是第二组评酒员给出的每个酒样品的得分平均值。并由假设可以知道他们的总体得分服从正态分布,且都是相互独立的。

因此我们可以建立“两独立样本T检验”模型来进行样本数据体现出的方差进行较好的分析,进而可以根据T检验原理判断出每类评分结果的两个样本之间是否有显著性差异。

首先对附件1的数据进行如下处理:用EXCEL软件实现对样本一中各个酒样品的得分平均值(如表4-1)

表4-1第一类样本一中的酒样品1的得分平均值计算

那么在通过对各个总和的求平均值,即得到样本一中的酒样品1总得分的平M=62.7

均值

1

对之后的各个酒样品得分重复上述操作可得红葡萄酒的评分均值的样本一和样本二,以及白葡萄酒的评分均值的样本一和样本二(如表4-1)

表4-2 对于红、白葡萄酒的两个样本均值和样本方差表

T 统计量的计算公式:

0t =

(2)

计算得出第一类的0x t 统计量

0x t ≈10.8135

T 统计仍然服从T 分布,但由自由度采用修正的自由度:

22

12

12

2

2

221

2

1212

S S n n f S S n n n n +=

???? ? ?????+ (3)

通过查寻T 分布表我们得到()i t f ≈0.2704, 显然

0x t >()i t f

从两种情况下的T 统计量计算公式可以看出,如果待检验的两样本均值差异较小,0x t 较小,则说明两样本的均值不存在显著差异;反之,0x t 越大,则说明

两个样本的均值存在显著差异性。

进而说明第一类评分数据具有显著的差异。

对于的第二类数据的两个样本我们做同样的分析,最后计算得到

0y t ≈0.5300

()j t f ≈0.500

显然

0y t >()j t f

即说明对于第二类的数据均值也存在显著的差异 4.1.2 基于可信性建立模型

在表1-1的基础之上我们对已经得到的样品得分的各个平均值(M )进行求方差(s1)得到表4-3,和表4-4

表4-3红葡萄酒得分数据样本一平均值方差表

酒样

1 2

3

4

5

6

7

8

9

10 11 12 13 14

样本

方差(s1)

92.900 39.7888 45.8222 108.044 62.0111 59.7333 103.611 44.0111 32.9444 30.400 70.766 79.655 44.933 36.000 酒样

15 16 17 18 19 20 21 22 23 24 25 26 27

样本

方差(s1) 85.566 18.100 88.011 47.211 47.377 26.044 116.100 50.622 32.488 74.888 64.622 31.288 49.777

表4-4 红葡萄酒得分数据样本二平均值方差表

酒样品i

1

2

3

4

5

6

7

8

9

10 11 12 13 14

样本

方差

(s2)

81.877 16.222 30.711 41.288 13.655 21.122 62.677 65.111 25.733 36.177 38.044 25.122 15.288 23.155

品i

15161718192021222324252627

样本方差(s2)41.34

4

20.1

9.166

6

50.26

6

55.15

5

39.06

6

35.51

1

24.26

6

24.76

6

10.72

2

43.73

3

41.55

5

20.50

综合表4-3和表4-4画出:

图4-1红葡萄酒总得分数据样本方差分析折线示意图

再根据对图4-1的观察分析,考虑到方差是表示一组数据分布的离散程度的平均值,方差越大,说明变量值的差异越大,距离平均数这个“中心”的离散趋势越大,进而说明第一组的评酒员在同一酒样品上评分标准的分歧就越大,也就说明有改组评酒员给出的分数是相对不可信的(这个标准是根据在各种评价活动中都遵循的约定,目的正是为了数据的可信性)。

显然从图4-1中看出样本一样本均值的方差明显高出样本二(即第一组酒样品的方差)我们可以得到对于红酒的质量评价的两组评价结果具有显著的差异,其中第二组的数据更具有有效性。

同理:对第二类样本得分数据的相似分析得出:

表4-5

酒样

品i

1 2 3 4 5 6 7 8 9 10 11 12 13 14 样本

方差(si )92.2

22

201.

066

66.4

55

44.7

11

126.

444

162.

711

39.1

66

183.

600

92.

766

212.

679

177.

122

115.

788

170.

767

114.

222

酒样15 16 17 18 19 20 21 22 23 24 25 26 27 28

样本

方差(si )131.

600

178.

000

144.

179

156.

544

46.4

00

64.4

00

172.

711

138.

666

43.

655

111.

122

33.8

78

72.9

00

144.

400

80.4

55

表4-6

酒样

品i

1234567891011121314

样本方差(si)25.8

78

49.0

67

142.4

89

42.1

00

26.2

78

22.7

22

42.17

8/

31.1

22

106.2

67

70.4

00

87.82

2

140.0

44

46.7

67

15.8

78

品i

1516171819202122232425262728

样本方差(si)54.0

44

82.2

33

38.45

6

30.2

33

26.0

44

50.0

44

64.453.611.6

38.5

44

106.5

00

102.9

00

35.5

56

25.3

78

根据两组评酒员对28种酒样品的方差平均值,用EXCEL软件画出图像如图4-2:

图4-2白葡萄酒总得分数据样本方差分析折线示意图

对图4-2的观察分析,我们发现两组白葡萄酒样品的平均值方差值的变化情况相对均衡,表明我们的假设(1)具有合理性。

再从图4-2的两组样本均值的方差值进行同对图4-1的相同分析,并根据数据同样的有效性分析,我们仍然得到关于白葡萄酒的质量评价的两组评价结果中第二组样本评价数据更具有有效性。

4.2 问题(2)的模型建立与求解

问题(1)解决了我们选取样本数据的可信性问题,所以我们将采用附件1

中的第二组评价员评价数据对酿酒红、白葡萄进行分级评价。 4.2.1建立“逼近理想解”的排序模型

首先根据逼近理想解排序法(TOPSIS 法)建立“逼近理想解的排序模型。选取数据中的10个评分项目作为n 个评价指标,选取10个评酒员作为m 个评价目标,那么构成了一个10阶的矩阵()210ij f (即:决策矩阵),并在EXCEL 软件中输入样品酒1的决策矩阵如下:

表4-7

ij f r =

(4)

进行无量纲话处理得到了关于样品酒1决策矩阵对应的规范化矩阵()210ij r ,在EXCEL 中的得出:

表4-8

规范化矩阵 澄清度 0.296 0.296 0.296 0.394 0.099 0.394 0.296 0.394 0.296 0.296

色调 0.329 0.247 0.329 0.329 0.247 0.329 0.411 0.329 0.329 0.247 纯正度 0.426 0.255 0.341 0.170 0.255 0.341 0.255 0.426 0.341 0.255 浓度 0.339 0.339 0.339 0.226 0.226 0.396 0.339 0.226 0.339 0.339 质量 0.348 0.290 0.405 0.232 0.290 0.348 0.290 0.348 0.290 0.290 纯正度 0.243 0.324 0.406 0.162 0.243 0.406 0.324 0.324 0.324 0.324 浓度 0.213 0.373 0.373 0.106 0.213 0.373 0.373 0.319 0.319 0.373 持久性 0.261 0.365 0.313 0.261 0.261 0.365 0.365 0.261 0.365 0.313 质量 0.297 0.365 0.434 0.228 0.228 0.297 0.297 0.365 0.297 0.297 平衡/

整体评

价 0.337 0.337 0.300 0.262 0.262 0.337 0.300 0.337 0.337 0.337

根据题目附表1中的数据我们得出每种样品酒每个评价指标的权重,如表4-9

表4-9评价指标的权重1j w

外观分析

香气分析

口感分析

平衡/

整 体评

澄清度 色调 纯正度 浓度 质量 纯正度 浓度 持久性 质量

0.05

0.10

0.06

0.08

0.16

0.06

0.08

0.08 0.22 0.11

即得评价指标的权重矩阵()110ij w ?, 再次根据TOPSIS 法计算权重矩阵()1010ij v ?,

()

()()

2

21010

110

ij ij ij v f w ?= (5)

在EXCEL 中的得出()1010ij v ?结果如下:

表4-10

权重矩阵

()

1010

ij v ?

澄清度

0.015 0.015 0.015 0.020 0.005 0.020 0.015 0.020 0.015 0.015

色调 3 5 3 3 5 3 1 3 3 5 纯正度 0.026 0.015 0.020 0.010 0.015 0.020 0.015 0.026 0.020 0.015 浓度 0.027 0.027 0.027 0.018 0.018 0.032 0.027 0.018 0.027 0.027 质量 0.056 0.046 0.065 0.037 0.046 0.056 0.046 0.056 0.046 0.046 纯正度 0.015 0.019 0.024 0.010 0.015 0.024 0.019 0.019 0.019 0.019 浓度 0.017 0.030 0.030 0.009 0.017 0.030 0.030 0.026 0.026 0.030 持久性 0.021 0.029 0.025 0.021 0.021 0.029 0.029 0.021 0.029 0.025 质量

0.065 0.080 0.095 0.050 0.050 0.065 0.065 0.080 0.065 0.065

平衡/整体评价 0.037 0.037 0.033 0.029 0.029 0.037 0.033 0.037 0.037 0.037

对于()1010ij v ?矩阵的第1行中的元素取其中的最大值,记为1max i v ,那么整个

()

1010

ij v ?矩阵的每一行都取最大值则得到

正理想解:()()12101210=max ,max ,,max ,,,i i i i v v v v v v α+++

=u u v L L

对于()1010ij v ?矩阵的第1行中的元素取其中的最小值,记为1min i v ,那么整个

()

1010

ij v ?矩阵的每一行都取最小值则得到

负理想解:()()12101210=min ,min ,

,min ,,,i i i i v v v v v v β---=u u v L L

再根据TOPSIS 法计算正负距离尺度D +、D -公式

j D +=

6)

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

数学建模--葡萄酒的分级(正式版)

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子 邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关 的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其 他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式 在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违 反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西安理工大学 参赛队员 (打印并签名) :1. 郑晓东 2. 罗璐 3. 宫维静 指导教师或指导教师组负责人 (打印并签名): 日期: 2013 年 05月 10 日

葡萄酒质量的综合评价分析 摘要 近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。 对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。 对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。 对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。

葡萄酒的评价完整版

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价方法研究 摘要 在本文中,我们分析葡萄酒和酿酒葡萄的理化指标与所酿的葡萄酒的质量之间的关系,研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。 针对问题一,本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果,运用方差分析法来分析两组评价结果差异的显着性。在显着性水平取为0.05的情况下,发现两组评价结果的均值和方差均满足齐性,即两组评酒员的评价结果没有显着性差异。因无显着差异,本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值,计算两组评酒员对于各酒样品评分的方差并求和,结果显示第二组的总方差明显小于第一组,即其评分稳定性更高,得出第二组的评价结果更可信。 针对问题二,本文借助问题一中第二组的评价结果,将葡萄酒的质量数量化。运用主成分分析方法,得出酿酒葡萄的主要理化指标,在此基础上运用相关性分析法,分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度,将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准,其中权重取为理化指标的相关系数。把各葡萄样品的主要理化指标代入表达式,得到最终加权平均值,对其划分级别,并作为葡萄的级别。结果显示红葡萄样品集中在第2,3,4级,而白葡萄大多数集中在第2级(级别数值越小代表葡萄质量越好)。 针对问题三,本文依据问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,分析了葡萄酒的理化指标与酿酒葡萄的主要理化指标之间的相关程度,我们得到的主要结论为:红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关,与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关;白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。 针对问题四,考虑到除葡萄与葡萄酒的理化指标外,葡萄与葡萄酒的芳香物质可能对葡萄质量也会造成影响。首先,运用主成分分析法,得出芳香物质中的主要成分,并借助问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。根据所得结果,取与葡萄酒质量关联程度较大的因素作为自变量,以葡萄酒质量作为因变量,运用多元线性回归模型建立相应的函数关系。通过上述定性与定量分析,说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响,因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。 以上结果具有较高的可靠性和可行性,对于葡萄酒的评价具有一定的指导意义。关键词:葡萄酒质量理化指标方差分析主成分分析多元线性回归相关性分析 一:问题重述

数学建模A葡萄酒的评价完整版

数学建模A葡萄酒的评 价 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开 展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与 酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄 酒和酿酒葡萄的质量。 对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评 价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两 组评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第 二组的结果更可信。 对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分 级。基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指 标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄 酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要 依据。此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因 某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最 终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。 对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对 比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归 方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。 对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。 文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应 用和推广。 关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验 1.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

基于数据挖掘技术的葡萄酒评价体系研究

Advances in Applied Mathematics 应用数学进展, 2015, 4(4), 376-384 Published Online November 2015 in Hans. https://www.wendangku.net/doc/0a15302815.html,/journal/aam https://www.wendangku.net/doc/0a15302815.html,/10.12677/aam.2015.44047 The Study on Evaluation System of Wine Based on Data Mining Sizhe Wang1, Zhigang Wang2*, Yong He2 1Automation Professional Class 1301, School of Information Science and Engineering, Central South University, Changsha Hunan 2College of Information Science and Technology, Hainan University, Haikou Hainan Received: Nov. 8th, 2015; accepted: Nov. 23rd, 2015; published: Nov. 30th, 2015 Copyright ? 2015 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.wendangku.net/doc/0a15302815.html,/licenses/by/4.0/ Abstract Based on Question A of Mathematical Contest in Modeling for college students in 2012, the empha-sis in this paper is mainly on the establishment of evaluation system of wine based on data mining technology. The wine quality is determined by the score of the wine tasting. We analyze the credi-bility of the liquor score by one-way ANOVA. We classify the wine grape by extracting common factors of some physical and chemical indicators from the wine grape, and by clustering the factor score and wine score. The stepwise regression model is established through the correlation be-tween the physical and chemical indicators and the physical and chemical indicators of wine grapes. By the regression model between the aroma substances and the score of the wine, the key physical and chemical indicators of wine quality will be found. In the end, some shortcomings of current rating system of wine will be pointed out. Keywords Evaluation System of the Wine, Data Mining Technology, One-Way ANOVA, Cluster Analysis, Regression Analysis 基于数据挖掘技术的葡萄酒评价体系研究 王思哲1,王志刚2*,何勇2 1中南大学信息科学与工程学院自动化专业1301班,湖南长沙 2海南大学信息科学技术学院,海南海口 *通讯作者。

数学建模葡萄酒评价.docx

A题:葡萄酒的评价 摘要 本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理 化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型, 解决了葡萄酒的评价问题。 问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel 画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。 问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各 因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表: 等级优良中合格葡萄种类 红葡萄54108 白葡萄8892 问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP 神经网络进行比较验证。 问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量 间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价 分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。 本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。 关键词:方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述 通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题: 1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 问题一:观察附表 1 中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡 萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型, 对各个数量指标进行分析比较,得出更有可信度组。 问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。 问题三:题中葡萄与葡萄酒指标数分别为 60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。 问题四:考虑参数过多,为剔除微小影响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。 三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i:表示第 i 个处理观测值总体平均数。 ij :表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss :表示误差平方和。 e ss t表示处理间平方。

葡萄酒的评价大学生数学建模竞赛

葡萄酒的评价大学生数学建模竞赛

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西南科技大学 参赛队员 (打印并签名) :1. 周立 2. 李婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名):杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。 问题一: (1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。 (2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的α信度系数,分别求出两组评分的α信度系数。综合考虑这两个方面,得出第二组评分较为可信。 问题二: (1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。 (2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。 问题三: 对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。 问题四: (1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。 (2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:t检验α信度系数主成分分析 BP神经网络 GA优化BP神经网络

有关葡萄酒评价的数学建模论文

葡萄酒的评价 摘要 本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。 关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得 P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。 关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。 关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。 关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。 关键词:葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2.问题分析 问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据,我们采用曲线拟合处理这一问题。因为所给数据是小样本,总体标准差 未知的正态分布资料,因此采用T检验,根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,方差大的一组则说明其打分较为严格,即说明他们对待评酒较为认真,从而认为其较为可信。 问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系,所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序,根据综合评分的排序结果对酿酒葡萄样品分级;然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级,此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。 问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系,即要求得出它们各项理化指标之间联系的紧密程度,所以采用回归分析的方法计算它们的各理化指标的相关系数,然后以相关系数的绝对值大小表示它们之间联系的紧密程度。 问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系,且葡萄酒的理化指标相对较少,因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果,得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素,再依据这几个因素结合葡萄酒质量排序,便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来,判断其对葡萄酒质量是否有影响,从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

葡萄酒评语

葡萄酒评语 篇一:葡萄酒评价 葡萄酒的评价 摘要 对于解决葡萄酒的评价问题及其之间的联系,需要运用到统计学中不同的分析方法,同时建立模型,再利用相应的软件进行求解。 针对问题一,通过分析十位评酒员对不同葡萄酒的打分进行统计整理,得到每位评酒员对所有酒样品的总得分,利用个spss软件,通过对总得分进行T检验分析得到均值,标准差,误差等相应的数据,可以得出两组评酒员的评价结果存在的差异性,根据数值比较可知,第二组评酒员评价结果之间的浮动较小,因此确定第二组的评价结果比较可信。 针对问题二,采用主成分分析和聚类分析对酿酒葡萄进行分级,首先通过spss软件对酿酒葡萄的理化指标进行主成分分析,对主成分累计贡献率进行归一化分析得出其权重和酿酒葡萄中的主要物质的相关系数矩阵。再通过相关数据利用maTLaB得出聚类图。因为酿酒葡萄的组数较多,可将其分为4类,以便聚类图能清晰表明酿酒葡萄的等级。 针对问题三,运用spss软件及问题二的模型对酿酒葡萄和葡萄酒理化指标分析,从红葡萄和红葡萄就中提取9中主要物质(见表三1),

白葡萄与白葡萄酒中提取8中主要物质(见表四1)。再对酿酒葡萄和葡萄酒理化指标进行通过典型相关分析。更加准确的反应出酿酒葡萄与葡萄酒理化指标之间联系。 针对问题四,建立多元线性回归模型分析葡萄和葡萄酒的理化指标及芳香物质对葡萄酒的影响,利用spss软件得出图四和图六,由图中数值分析得出拟合线性回归的残差浮动区间为[-1,1],因此葡萄酒的质量可以由酿酒葡萄和葡萄酒的理化指标以及芳香物质共同反应。 关键字:T检验、主成分分析、聚类分析、典型相关分析、多元线性回归分析 一问题重述 1.1问题背景与条件 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。 1.2预解决的问题 1、问题一分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结信? 2、问题二根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3、问题三分析酿酒葡萄与葡萄酒的理化指标

全国大学生数学建模竞赛题葡萄酒的评价答案全解

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析

葡萄酒质量的综合评价分析模型

葡萄酒质量的综合评价分析模型 专家点评: 本文问题一方法合理,结论正确。问题二对葡萄理化指标进行聚类,然后根据葡萄酒质量进行分级,思路简明正确。问题三进行多元线性回归,尚可,但如果能进行相关性分析会更好。问题四用逐步回归的方法,适当,加入芳香类物质,使结论更加合理。如果问题二和问题三也能将附件三考虑入内会使结论更加有力。 【摘要】 近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增,特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平,如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。本文主要研究了葡萄酒的品质与葡萄酒自身以及酿酒葡萄的理化指标的关系,给出了基于葡萄酒自身的理化指标以及酿酒葡萄的理化指标与芳香物质的定量综合评价模型。 首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,得到了两组评酒员的评分存在显著差异的结论,并通过对两组数据进行方差分析,以判别结果具有的稳定性作为标准,得到第二组比较可靠。 接下来我们结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 更进一步,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。 最后我们将提取葡萄及葡萄酒的理化指标与芳香物质中的主成分,利用逐步回归的方法考察理化指标与芳香物质对葡萄酒质量的影响程度,通过对芳香物质对葡萄酒质量影响比重得到芳香物质对葡萄酒的质量有30%以上的影响比重(白葡萄的芳香物质对白葡萄酒的质量影响相对更大),故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。 关键词:假设检验聚类分析主成分分析逐步回归

基于改进层次分析法的葡萄酒品质评价模型

基于改进层次分析法的葡萄酒品质评价模型 【摘要】葡萄酒理化指标众多,这些理化指标是评价葡萄酒品质过程中必不可少的参考因子。本文通过几项葡萄酒理化指标的国家标准进行建立葡萄酒的评分模型,对模型所得结果与专业评酒员的评分作排序对比。一般的层次分析法具有定性色彩,因此建模过程中使其与数据进一步关联,使之更为客观的定量分析评价。最后检验得知模型评分排名与专业评酒员评分排名相近,因此认为利用三标度法对葡萄酒品质评价进行数学建模可行。 【关键词】层次分析法;三标度法;数据关联 0 引言 美国运筹学家匹茨堡大学教授萨蒂于本世纪70年代初,提出的一种层次权重决策分析方法。所谓层次分析法,是指将一个复杂的多目标决策问题作为一个系统,将目标分解为多个目标或准则,进而分解为多指标(或准则、约束)的若干层次,通过定性指标模糊量化方法算出层次单排序(权数)和总排序,以作为目标(多指标)、多方案优化决策的系统方法。葡萄酒的评价多依赖人工评价,因此评价过程中不可避免的带有主观因素。对此,结合客观的评价方法可减少人工评价过程中主观因素所造成的误差,较准确的对葡萄酒进行分级。由于层次分析法具有一定的定性色彩,与数据的关联程度不高,因此为了使其能在需要定量分析的问题中得以应用,本文将在建模过程中使其与数据的关联程度增加,从而使其在定量分析的问题中更加客观。(本文数据均取自于2012年全国大学生数学建模竞赛A题。) 1 确定评价因子权重 根据现有葡萄酒国家标准葡萄酒中葡萄糖、干浸出物、乙酸、柠檬酸、二氧化硫、甲醇、苯甲酸、山梨酸的含量限定值的比较构建比较矩阵来计算8种理化指标的权重,代入,构建基于改进层次分析法的加权平均综合指数法。 1.1 比较矩阵的建立 依据中华人民共和国国家标准中葡萄酒标准得出葡萄酒各理化指标的限量值: 其中根据(1)式得到比较矩阵 1.3 根据判断矩阵算得权重 在矩阵被验证有效的基础上,运用matlab软件计算,得到(4)式标准化后最大特征值对应的特征向量即权重ω=(0.2574,0.4232,0.1164,0.1164,0.024,0.0249,0.0117,0.0249)对计算结果进行一致性检验,得到λ 8.6645,

相关文档
相关文档 最新文档