文档库 最新最全的文档下载
当前位置:文档库 › 2012国赛A题论文

2012国赛A题论文

2012国赛A题论文
2012国赛A题论文

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):A

我们的参赛报名号为(如果赛区设置报名号的话):J0414

所属学校(请填写完整的全名):西安电子科技大学

参赛队员(打印并签名) :1. 龚天成

2. 张翰宗

3. 刘春锐

指导教师或指导教师组负责人(打印并签名):教练组

日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页

赛区评阅编号(由赛区组委会评阅前进行编号):

赛区评阅记录(可供赛区评阅时使用):

全国统一编号(由赛区组委会送交全国前编号):

全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价

摘要

本文以数据挖掘及多元统计分析方法为基础,通过建立因子分析和灰色关联的模型,分析了酿酒葡萄的理化指标、葡萄酒的理化指标与葡萄酒质量三者之间的联系,并通过进一步的分析得出葡萄和葡萄酒的理化指标不能用来评价葡萄酒的质量。

针对问题一,本文采用截尾法剔除极端数据,得到每项指标的综合评分,将衡量每个样品酒质量的所有指标的综合分相加,得到该样品酒的综合得分。对于每个样品酒,都有配对的两组得分,运用基于成对数据的t检验对两组数据进行假设检验,结果表明对红与白葡萄酒,两组评酒员的评价结果都存在显著性差异。在可靠性的检验上,本文采用方差比较法分别从两个角度对两组评酒员的评分进行检测,得到结论:无论对红葡萄酒还是白葡萄酒来说,第二组评酒员的评价结果均更为可靠。

针对问题二,首先通过分析葡萄酒质量与酿酒葡萄理化指标之间的相关性,得到相关性较大的酿酒葡萄理化指标。进一步采用主成分分析法,把新的综合指标作为葡萄酒质量的指标。根据法国葡萄酒分级的帕克评分体系,通过非线性最小二乘法拟合找到酿酒葡萄的各项主要理化指标同葡萄酒质量之间的映射关系。在帕克评分体系下对葡萄酒的质量进行分级后,通过反映射找到主要理化指标的数值范围,以此作为酿酒葡萄的分级标准。结果见表13。

针对问题三,考虑到酿酒葡萄和葡萄酒理化指标间复杂、模糊的关系特点,本文引入灰色关联的模型,找到与葡萄酒的每一项理化指标相关联的酿酒葡萄理化指标,并对关联度进行排序,结果见表14和表15。

针对问题四,首先将酿酒葡萄以及葡萄酒的理化指标同葡萄酒质量之间进行一次灰色关联分析,找到它们之间的关联性,结果参见表16和表17。然后再次运用灰色关联分析得到芳香物质与葡萄酒质量之间的关联性,结果显示:关联性较大。因此可知仅按照葡萄酒以及葡萄的理化指标不能评价葡萄酒质量。其他查阅相关资料发现,除了理化指标外,还存在感官指标以及卫生指标可以评价葡萄酒质量。

关键词:截尾法假设检验因子分析帕克评分体系非线性最小二乘法拟合灰色关联

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

二、问题分析

2.1 问题一的分析

问题一要求分析两组评酒员的评价结果有无显著性差异,并分析哪一组结果更可信。

对两组评酒员的评价结果有无显著性差异这一问,不妨以红葡萄酒为例,每组10位品酒员分别对27个样品酒的10项指标进行打分。为了避免极端数据造成的不良影响,本文采用截尾法求出各项指标的综合得分,然后将10项指标的综合分相加,得出两组27个样品酒的总得分。按同一样品酒两种总得分的方式,将得到的两组27个样品酒的总得分进行配对。同一样品酒中成对数据得分的差值可看成仅由两组评酒员评价结果的差异引起。对成对数据的差值进行正态性检验,利用单样本t检验求出两组评酒员评价结果的差异。

对于哪一组结果更可信这一问,本文基于稳定性理论从两个角度进行方差分析,角度一:对于酒样品,有十个品酒员打分,根据这十个总分作方差分析。方差的大小表征十个品酒员对于同一种酒打分的偏差情况,方差越大的,说明品酒员的水平越参差不齐,可信度就不够高。角度二:对于酒样品,根据各个打分细则作方差分析,由于每个评分细则分值不同,所以先进行归一化处理,再求出该评分项目的方差,最后将所有评分项目的方差求和,得到综合的方差。

2.2 问题二的分析

问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

由题干可知,酿酒葡萄的理化指标在一定程度上影响葡萄酒的质量。通过分析葡萄酒质量与酿酒葡萄理化指标间的相关性,可以得出影响葡萄酒质量的酿酒葡萄理化指标。再对这些指标运用主成分分析,消除这些指标间相关性对结果带来的不良影响,并用重新组合成的一组新的互相无关的综合指标作为酿酒葡萄的指标。

对于得到的互不相关的综合指标,拟合出它们与葡萄酒质量之间的函数关系。由于葡萄酒质量可以在帕克评分体系下分级,通过反映射的思想,可以找到对应指标的数值范围,并以此作为酿酒葡萄分级的标准。

2.3 问题三的分析

问题三要求分析酿酒葡萄与葡萄酒的理化指标之间的联系。

若考虑运用回归分析的方法,不仅要求大样本,而且还要有典型的概率分布,而灰色系统理论中提出的灰色关联分析方法不受这些条件的局限,适合于具有复杂关系的酿

酒葡萄、葡萄酒的理化指标之间关系的分析。运用灰色关联分析方法找到和样品酒的每一项理化指标相关联的葡萄的理化指标,并可以对关联度进行排序。 2.4 问题四的分析

问题四要求分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

将酿酒葡萄以及葡萄酒的理化指标同葡萄酒质量之间进行一次灰色关联分析,找到它们之间的关联性,得到酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。再将芳香物质与葡萄酒质量之间运用灰色关联分析。通过比较关联度的大小,论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

三、 模型假设

1、 所给数据在去除少数坏点后真实可靠。

2、 不考虑酿酒葡萄的二级理化指标。

3、 对于多组样本值的理化指标,可以取平均值作为综合理化指标。

4、 葡萄酒质量可以用评酒员的综合评价分数量化表示。

5、 评酒员之间相互独立,即所评分数合理可靠。

四、 主要变量符号说明

符号

解释与说明

ijl x 第i 位评酒员对第j 种葡萄酒样品第l 个指标所打分数(1,2,,10)i = jl A

第j 种样品酒第l 个指标的综合得分jl A j X 第一组评酒员对第j 种样品酒的评价总分 j Y

第二组评酒员对第j 种样品酒的评价总分 j D

两组品酒员对第j 个样品酒评价差异指标值 d 样本的均值 2D s 样本的方差

ij P 第i 位评酒员对第j 种葡萄酒样品的综合评价(1,2,,10)i = 2j S

第j 种样品酒的总方差

注:其他未注明符号在文章中会具体说明

五、 模型建立与求解

5.1 问题一:评价结果的显著性差异及可信度分析

对于红葡萄酒以及白葡萄酒,均有两组评酒员对其进行评价,其中每一组中包含十位评酒员,每位评酒员在对葡萄酒进行品尝后对其分类指标进行打分。因此,本文先对两组评酒员的评价结果是否有显著性差异进行讨论。 5.1.1 模型Ⅰ:基于成对数据的t 检验模型

有时为了比较两种产品、两种仪器、两种方法等的差异,常在相同条件下做对比实验,得到一批成对的观察值,然后分析观察数据做出推断,这种方法称为逐对比较法。本文以逐对比较法为基础建立以下模型。

1.数据预处理

设ijl x 为第(1,2,,10)i i = 位评酒员对第j 种葡萄酒样品第l 个指标所打分数,对于红葡萄酒来说,1,2,27j = ,1,2,,10l = ,分别代表外观分析中的澄清度、色度,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久性、质量和整体评价十项指标。

参照截尾平均数[1]的定义及应用范围,本文将每个样品酒的每项指标去掉一个最高分,去掉一个最低分,求得其它8位评酒员分数的平均值,将其作为第j 种样品酒第l 个指标的综合得分jl A ,计算公式如下:

min()max()

8

ijl

ijl ijl i

jl x

x x A --=

∑ (1)

再将每个样品酒所得的十项指标值相加,得到该种样品酒的最终综合得分。其中第一组评酒员对第j 种样品酒的评价总分为j X ,第二组评酒员对第j 种样品酒的评价总分

为j Y ,计算公式为:

∑==10

1)(l jl j j A Y X (2)

通过对数据的观察,发现在附件1所给数据中有以下两处明显错误:

(1)第一组白葡萄酒 样品3 品酒员7号 持久性 打分77(满分8分) (2)第一组红葡萄酒 样品20 品酒员4号 色调 未打分(满分10分)

但是在该种处理方法下,由于去掉了一个最高分,去掉了一个最低分,避免了极端数据造成的不良影响,具有较大的可行性。 2.模型建立

设有n 对相对独立的观察结果:),(,),,(),,(2211n n Y X Y X Y X ,令:

),,2,1(n j Y X D j j j =-= (3)

则n D D D ,,,21 相互独立。又由于n D D D ,,,21 是由同一因素所引起的,可认为它们

服从同一分布。现假设2

(,),1,2,,j D D

D N j n μσ= ,也就是说n D D D ,,,21 构成正态总体2

(,)D D N μσ的一个样本,其中2,D D μσ未知,本文基于这一样本检验假设:

01:0,:0D D H H μμ=≠

本文取显著性水平为95%,即0.05α=,可知拒绝域为:

0.025(1)/D d

t t n s n

=

≥- (4)

其中d ,2D s 表示样本均值和方差,若t 的值不落在拒绝域内,则接受0H ,认为两

组评酒员的评价结果无显著性差异;若t 的值落在拒绝域内,则认为两组评酒员的评价结果在显著性水平为95%的条件下存在显著性差异。 3.模型求解

按照公式(1)、(2)、(3)处理数据得下表:

表1 葡萄酒评价差异性统计表

红葡萄酒差异性统计表

白葡萄酒差异性统计表

编号 j D 编号

j D 编号 j D 编号 j D 1 -5.5 15 -7.375

1

5.125 15 -5.5 2

6.5 16 5.25 2 -1.25 16

7.125 3 5.625 17 4.375 3 2.125 17 -1 4 -2.625 18 -4.986 4 2.375 18 -1.625 5 1.375 19 7.125 5 -

8.75 19 -5.125 6 6.5 20 3.347 6 -6.75 20 1.75 7 5.375 21 5 7 3.875 21 -3 8 6.375 22 5.75 8 -1.25 22 -8.25 9 3.375 23 8.375 9 -8.875 23 -1.125 10 6.375 24 6.75 10 -4 24 -3.125 11 7.75 25 1.875 11 2.125 25 -4.25 12 -14.875 26 2.5 12 -10.5 26 6.875 13 6.375 27 1.875 13 -7.875 27 -11.75 14 1.375

14

-3.875

28

2.75

对两组数据中的两组评酒员对样品酒的差异指标值D 进行正态性检验,做出Q-Q 图如下:

图1 红葡萄酒差异指标值正态检验Q-Q 图 图2 白葡萄酒差异指标值正态检验Q-Q 图

分析上图发现,正态性检验Q-Q 图大致是一条直线,所以其均服从正态分布,适合使用t 检验。

分别求出红葡萄酒和白葡萄酒的观测值及t 值如下:

(1) 红葡萄酒: 2.73559, 5.454388, 2.606C d s t === (2) 白葡萄酒: 2.27679, 5.203760, 2.315C d s t =-==

对于红葡萄酒来说,/20.02527,(26)(26) 2.0555n t t α===。因为 2.606 2.0555t =>,所以拒绝0H ,认为两组评酒员的评价结果在显著性水平为95%的条件下存在显著性差异。

对于白葡萄酒来说,/20.02528,(27)(27) 2.0518n t t α===。因为 2.315 2.0518t =>,所以拒绝0H ,认为两组评酒员的评价结果在显著性水平为95%的条件下也存在显著性差异。

5.1.2 模型Ⅱ:可信度评价模型

在可信度的比较中,最主要的参考标准是方差,方差反应了测量结果与均值的偏离程度。若对于同一种葡萄酒的同一项指标,10位评酒员的评判结果差距较大,那么这一组数据的可信度势必较低。基于这种思想,本文建立了以下的可信度评价模型。 1.模型建立

本文从以下两个角度进行方差比较: 角度一:设ijl x 为第(1,2,,10)i i = 位品酒员对第j 种葡萄酒样品第l 个指标所打分数,

ij P 为第(1,2,,10)i i = 位评酒员对第j 种葡萄酒样品的综合评价,则:

ij ijl l

P x =∑ (5)

对于第j 种葡萄酒样品,共有十种评判总分ij P (1,2,,10)i = ,计算其方差2j S 。 角度二:对于第j 种葡萄酒样品,设第l 个指标的满分为jl M ,首先将所有的评判结果ijl x (1,2,,10)i = 进行归一化处理,得到归一化后的结果ijl g (1,2,,10)i = ,则:

(1,2,,10)ijl

ijl jl

x g i M == (6)

对于每一个指标,求出其方差2jl S ,再将所有指标的方差相加,得到这一种酒样品的总方差2j S ,计算公式为:

22

j

jl l

S S =∑ (7) 角度一中的方差是从评酒员的角度考虑,以每位评酒员对样品酒的综合评价得分为

样本计算的;角度二中的方差是从评价指标的角度考虑,以该指标在不同评酒员评价下的得分为样本计算的。 2.模型求解

根据模型求解出每种样品酒的方差值(见附录一),并将折线图绘制如下:

图3 红葡萄酒方差比较图(角度一) 图4 白葡萄酒方差比较图(角度一)

图5 红葡萄酒方差比较图(角度二) 图6 白葡萄酒方差比较图(角度二)

通过折线图,可以直观的看出:在两种不同的角度下,第一组的方差值均普遍大于第二组的方差值,表明无论对红葡萄酒还是白葡萄酒来说,第二组评酒员对同一种样品酒的评价相对稳定,可信度较高。 5.2 问题二:酿酒葡萄的分级 5.2.1 模型Ⅲ:非线性拟合模型

法国葡萄酒的评分体系即帕克评分体系[2]能对葡萄酒的质量进行分级,本文找到酿酒葡萄的各项主要理化指标同葡萄酒质量之间的映射关系,在帕克评分体系下对葡萄酒的质量进行分级后,通过反映射找到主要理化指标的数值范围,以此作为酿酒葡萄的分级标准。

因此,本文首先对酿酒葡萄的各项理化指标同葡萄酒质量之间进行相关性分析,找到与葡萄酒质量之间相关性较大的理化指标,再对这些指标进行一次主成分分析,提取出彼此之间相关性较小的主要理化指标。则这些主要理化指标与葡萄酒质量之间的相关性均较高,并且相互之间的相关性较低,可以认为能够全面的代表所有影响葡萄酒质量的酿酒葡萄理化指标。 1.模型建立

(1)相关性分析

酿酒葡萄的理化指标较多,就红葡萄而言共有28项,并不是所有的理化指标均可以影响酿酒葡萄的质量,进而影响葡萄酒的质量。故本文首先对酿酒葡萄的各项理化指标同葡萄酒质量之间进行相关性分析,得到与葡萄酒质量之间相关性较大的理化指标。

设ij a 为第i 个样本葡萄的第j 项理化指标值,i b 为第i 个样本酒质量的综合评分值(取可信度较大一组的评分值),N 为样本容量值,则j r 为第j 项理化指标值同葡萄酒质量之间的Pearson 相关系数[3],计算公式为:

2

2

22

()

()

ij i ij i

j ij

i ij

i N a b a b r N a b N a b -=

--∑∑∑∑∑∑∑ (8)

Pearson 相关系数的绝对值越大,相关性越强,相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。

通常情况下通过以下取值范围判断变量的相关强度:相关系数0.8-1.0为极强相关;0.6-0.8为强相关;0.4-0.6为中等程度相关;0.2-0.4为弱相关;0.0-0.2为极弱相关或无相关。

(2)主成分分析

对于与葡萄酒质量之间相关性较大的理化指标,均可显著影响葡萄酒质量。这些指标之间往往是相伴产生的,即产生过程并非是独立的。所以要想找到影响葡萄酒质量的酿酒葡萄主要理化指标,需要采取因子分析法[4],将多个指标中相关性较大的指标归为一类,从而达到降维的目的,并且提高精确性。

设ij Y 为样本中第i 个样本的第j 个指标值,为了消除不同变量间量纲的影响,本文将样本数据指标标准化。标准化公式如下:

()/ij ij j j

Y Y Y σ'=-

(9)

其中j Y 和j σ分别为指标的均值和标准差。本文将n 种理化指标作为因子分析的n 个

变量因子,建立因子分析模型如下:

111112211221122222

1122+++++++++m m m m n n n nm m n Y X X X Y X X X Y X X X αααεαααεαααε=+??=+???

?=+?

(10) 其中,12,,,n Y Y Y 是已标准化的可观测的指标。12,,,m X X X 为公共因子,i ε是特

殊因子,它与公共因子之间彼此独立。ij α是指标i Y 在公共因子j X 上的载荷。因子载荷ij α的统计含义是指标i Y 在公共因子j X 上的相关系数。表示i Y 与j X 的线性相关程度。

12,,,i i im ααα 说明了指标i Y 依赖于各个公共因子的程度。12,,,j j mj ααα 说明了公共因子

j X 与各个指标的联系程度。

(3)利用非线性最小二乘法拟合关系曲线

对于找到的主要理化指标,本文以葡萄酒的质量总评分为横坐标,以每一项指标值为纵坐标,运用非线性最小二乘法拟合出每一项指标与葡萄酒质量总评分之间的关系曲线,并且找到拟合度最高的函数关系方程。

设非线性系统的模型为(,)y f x θ=,其中y 是系统的输出,x 是输入,θ是参数,现有n 组样本1122(,),(,),,(,)n n x y x y x y ,则估计参数的目标函数为:

[]2

1min (,)n

k k k Q y f x θ==-∑ (11)

在此目标函数下,找出(,)y f x θ=的具体形式,并且拟合得到关系曲线。 (4)分级标准的确定

借用帕克评分体系首先对葡萄酒进行分级。在帕克的评分标准中,基于以下四个因素:外观,香气,风味,总体质量或潜力。具体的打分体系如下:

表2 帕克评分等级表

等级 得分

描述

优质 96-100 Extraordinary 经典:顶级葡萄酒

90-95 Outstanding 优秀:具有高级品味特征和口感的葡萄酒 良好 80-89 Above average 优良:口感纯正、制作优良的葡萄酒 合格 70-79 Average 一般:略有瑕疵,但口感无尚大碍的葡萄酒

不合格

60-69 Below average 低于一般:不值得推荐

50-59 Unacceptable 次品

由于已经通过拟合的方法找到了每一项指标与葡萄酒质量总评分之间的关系曲线,

故在用帕克标准对葡萄酒进行分级时,通过映射的观点,找到该等级下对应的酿酒葡萄理化指标的数值范围,以此作为酿酒葡萄的分级标准。

2.模型求解

(1)相关性分析

首先运用SPSS软件求出酿酒葡萄的28项理化指标与葡萄酒质量的Pearson相关系数(见附录二),找到相关系数的值大于0.4所对应的理化指标,结果列表如下:

表3 相关系数大于0.4的红葡萄理化指标结果表

蛋白质DPPH自由总酚葡萄总黄PH值果皮颜色相关系数0.516 0.598 0.650 0.685 0.558 -0.486 对于红葡萄酒来说,这6项酿酒葡萄理化指标与红葡萄酒质量之间的相关程度均为中等以上。

表4 相关系数大于0.4的白葡萄理化指标结果表

酒石酸总糖可溶性固形果穗质量果皮颜色相关系数0.436 0.442 0.462 -0.453 -0.486 对于白葡萄酒来说,这5项酿酒葡萄理化指标与白葡萄酒质量之间的相关程度均为中等以上。

(2)主成分分析

对于相关性分析中得出的酿酒葡萄的理化指标,本文从相关矩阵出发,采用主成分分析法提取公共因子。以红葡萄酒为例,首先做KMO和Bartlett检验如下表:

表5 红葡萄酒KMO和Bartlett检验

取样足够多Kaiser Meyer Olkin

--度量。0.736 Bartlett的球形度检验近似卡方106.084

df15

Sig0.000

.

由表可知,KMO统计量是0.736>0.5,Bartlett球面检验值为106.084,2χ统计量的显著性水平为0.000<0.01,说明各个指标之间存在着较高的相关性,即说明选取的6项指标适合做主成分分析。

本文提取累计贡献率高于85%的公共因子,运用SPSS得到结果如下:

表6 红葡萄酒特征值和累计贡献率表

序号总的特征量占总变量百分率% 累计贡献率%

1 3.64

2 60.695 60.695

2 1.018 16.961 77.656

3 0.70

4 11.739 89.395

用SPSS画出因子分析的碎石图如下:

图7 红葡萄酒因子分析碎石图

计算因子载荷矩阵,由于主成分的系数阵的特征向量与因子初始载荷矩阵存在如下关系:

ij ij j a

r λ= (12)

利用主成分的系数矩阵和因子载荷初始矩阵,计算出各个特征值所对应的特征向量,如下表所示:

表7 红葡萄酒因子载荷表

因子 1 2 3 蛋白质 0.785 0.322 -0.05 DPPH 自由基

0.935 0.044 0.221 总酚 0.926 -0.168 0.119 葡萄总黄酮 0.889 -0.206 0.276 PH 值 0.519 0.668 -0.444 果皮颜色

-0.482

0.628

0.605

于是可以建立主成分表达式:

112621263126

0.7850.9350.4820.3220.0440.6280.050.2210.605Y X X X Y X X X Y X X X =++-??

=+++??=-+++? 得出三个主因子的占总变量的百分率分别为60.695%、16.961%、11.739%,累计贡献率达89.395%,三个主因子可以较好的影响红葡萄酒质量。

第一类主因子中,DPPH 自由基、总酚、葡萄总黄酮因子载荷值较高;第二类主因子中,PH 值、果皮颜色因子载荷值较高;第三类主因子中,果皮颜色因子载荷值较高。

在每一类主因子中提取因子载荷值最高的指标,则一共可以提取出三项指标:DPPH 自由基、PH 值以及果皮颜色。这三项指标与红葡萄酒质量之间的相关性均较高,并且相互之间的相关性较低,可以认为能够全面的代表所有影响红葡萄酒质量的酿酒葡萄理化指标。

同理,可以得到白葡萄酒的主成分分析结果(见附录二),提取出酿酒葡萄的主要理化指标为:可溶性固形物、果皮颜色以及酒石酸。

(3)拟合关系曲线,确定分级标准

对于红葡萄酒而言,酿酒葡萄理化指标中的DPPH 自由基、PH 值以及果皮颜色三项指标显著并且独立的影响红葡萄酒的质量。

运用非线性最小二乘法分别拟合出这三种指标与葡萄酒质量之间的关系曲线,并求出曲线方程。在用帕克标准对葡萄酒进行分级后,通过映射的观点找到对应指标的数值范围,如下表所示:

表8 DPPH 自由基与葡萄酒质量拟合分组结果表

31

22

172033.612569.2550.270.8 2.7y x x x x -=-+-+

拟合程度 2R =0.55

级别 DPPH 自由基分级区间

不合格 小于0.25 合格 0.25-0.33 良好 0.33-1.07

优质

大于1.07

表9 PH 值与葡萄酒质量拟合分组结果表

2345567566.54791.3135.7 1.90.01 3.810y x x x x x -=-+-+-?

拟合程度 2R =0.40 级别 PH 值分级区间 不合格 小于3.1 合格 3.1-3.5 良好 3.5-3.7

优质

大于3.7

表10 果皮颜色与葡萄酒质量拟合分组结果表

(62)/(0.032)0.06y x x x =---

拟合程度 2R =0.90

级别 果皮颜色分级区间

不合格 大于29.1 合格 27.0-29.1 良好 26.4-27

优质

小于26.4

由上图可以得出,对应不同等级的红葡萄酒,酿酒葡萄可以根据以下标准划分为四个等级:

表11 红葡萄分级标准表

红葡萄等级 DPPH 自由基(g/L )

PH 值 果皮颜色 红葡萄酒得分 优质 大于1.07 大于3.7 小于26.4 90-100 良好 0.33-1.07 3.5-3.7 26.4-27 80-89 合格 0.25-0.33 3.1-3.5 27.0-29.1 70-79 不合格 小于0.25 小于3.1 大于29.1 小于70

同理,对于白葡萄而言,运用相同的分析方法(分析结果见附录三),对应不同等级的白葡萄酒,酿酒葡萄可以根据以下标准划分为四个等级:

表12 白葡萄分级标准表

白葡萄等级 可溶性固形物(g/L )

果皮颜色 酒石酸(g/L ) 白葡萄酒得分 优质 大于209.5 大于54.5 大于8.3 90-100 良好 170.6-209.5 48.3-54.5 7.2-8.3 80-89 合格 140.4-170.6 20-48.3 3.2-7.2 70-79 不合格 小于140.4 小于20 小于3.2 小于70

(4)葡萄分级结果如下表:

表13 葡萄分级结果表

葡萄级别

葡萄样品编号

红葡萄

优质 2,3,9

良好 1,5,13,14,17,19,20,21,24

合格 4,6,7,8,10,11,12,15,16,18,22,23,25,26,27 白葡萄

优质 3,5,9,17,20,21,23,28

良好 2,4,6,7,8,10,11,12,14,15,18,19,22,24,25,26,27 合格

1,13,16

5.3 问题三:酿酒葡萄与葡萄酒的理化指标之间的联系 5.3.1 模型Ⅳ:灰色关联模型

关于酿酒葡萄与葡萄酒的理化指标之间的联系,若考虑运用回归分析的方法,不仅要求大样本,而且还要有典型的概率分布。而灰色系统理论中所提出的灰色关联分析方法[5]不受这些条件的局限,适合于具有复杂关系的酿酒葡萄、葡萄酒的理化指标之间关系的分析。因此,应用灰色系统理论将能更好地揭示酿酒葡萄与葡萄酒的理化指标之间的关系。本文应用灰色关联模型求解影响葡萄酒理化指标的主导酿酒葡萄理化指标。 1.模型建立

考虑到本文涉及的各因子序列值的正负、量纲的不同,变化程度及其量级的差异,以及因子之间关联性质的差别,本文通过参考文献资料[6],运用了一种改进后的分析方法[6],将各因子原始序列集合构成的空间转化为一个度量空间,在此基础上进行关联度的计算和分析。

第一步:确定分析数列

设:{}(0)(0)

0()1,2,,X X t t N == 为参考因子数列(本文指葡萄酒各理化指标序列) {}(0)(0)()1,2,,i i X X t t N == ,1,2,,i M = 为比较因子数列(本文指酿酒葡萄理化指

标序列)

第二步:构造斜率序列

将参考因子数列和比较因子数列按下式作变换:

(0)(0)

(1)

(1)()(),0,1,2,,;1,2,,1j j j X t X t X t j M t N t

+-===-? (13)

式中:(1)1t t t ?=+-= (14)

变换后的新数列实际上是各因子的斜率序列。由此,本文的分析属于斜率关联度的分析。

第三步:标准化处理

(1)(2)

()(),0,1,2,,;1,2,,1j j j

X t X t j M t N σ===- (15)

2

(0)1

1

(())N

j j

j t X t X N

σ==-∑,(0)

11()N j j t X X t N ==∑ (16) 通过上述处理之后,各因子原始序列集合构成的空间便转化为一个度量空间。 第四步:正负关联性判别

考虑到如果一个比较因子与参考因子之间的关联程度和另一个比较因子与参考因子之间的关联程度一致,而关联性质正好相反,那么这两个比较因子数列与参考因子数列之间的距离应相等。因此,在该度量空间中将比较因子与参考因子之间的距离定义为:

(2)(2)(2)(2)

0100100???()sgn()()sgn()()sgn()()()?i i i t X t X t X t X t σσσσ

?=-=- (17)

1,2,,;1,2,,1i M t N ==-

sgn 为符号函数:sgn()1,0sgn()0,0sgn()1,0a a a a a a =+>??

==??=-

(18)

关于比较因子与参考因子之间关联性质(即关联记性)的判别,可对于各因子的原始序列值先作下面的运算:

(0)

(0)1111?()(),0,1,2,,N N N

j i j k k k kX k X k k j M N σ

===??=-=????

∑∑∑ (19) 2

21

11?N

N k k k k k N σ

==??

=- ???∑∑ (20) 再按下述规则进行判别:

若????sgn()sgn(),i k j k σ

σσσ=则i X 和j X 为正关联。 若????sgn()-sgn(),i k j k σ

σσσ=则i X 和j X 为负关联。 第五步:求解关联系数与关联度

由文献资料[7]可知上述考虑因子间关联性质的距离的定义形式满足距离的三个条件。(0)i X 与(0)0X 的关联系数定义为:

0()()

(),1,2,,1

()()

oi oi i t i t

i oi oi i

t

Min Min t Max Max t t t N t Max Max t ρζρ?+?==-?+? (21) 0()i i

t

Min Min t ?为两级最小差;0()i i

t

Max Max t ?为两级最大差;ρ为分辨率系数,

(0,)ρ∈+∞,ρ越小,分辨率越高。通常取0.5ρ=。因此本文计算时取0.5ρ=。

(0)i X 与(0)

0X 的关联度定义为:

1

001

1(),1,2,,11N i i t t t N N γξ-===--∑ (22)

从式(21)、(22)可以看出,按式(17)定义的距离求出的关联度满足关联度的四条公理,即规范性、偶对对称性、整体性和接近性。有了关联度,就可以根据其由大到小的顺序(即关联序)判断所有比较因子数列与参考因子数列接近程度的顺序,或所有比较因子的变化对参考因子变化的影响程度大小的顺序。

2.模型求解

红葡萄酒对应了9个理化指标,白葡萄酒对应了8个理化指标,酿酒葡萄对应了30个理化指标,运用MATLAB 软件(程序见附录四)求得葡萄酒各个理化指标与酿酒葡萄所有理化指标的关联度(结果见附录五),并对其进行排序,由于样本比较大,这里就选取了葡萄酒各个指标中与酿酒葡萄理化指标关联度最大的3个理化指标。

表14 红葡萄酒与酿酒葡萄关联度排序结果表

酒的理化指标 正负相关性

关联度排序

花色苷

正相关

花色苷(0.82)>葡萄总黄酮(0.78)>总酚(0.77) 负相关 果皮颜色a (0.77)>果皮颜色b (0.72)>百粒质量(0.70) 单宁

正相关

单宁(0.75)> DPPH 自由基(0.73)>总酚(0.73) 负相关 果皮颜色a (0.67)>果皮颜色L (0.67)>固酸比(0.66) 总酚

正相关

葡萄总黄酮(0.82)> DPPH 自由基(0.79)>总酚(0.78) 负相关 果皮颜色a (0.71)>果皮颜色L (0.69)>果皮颜色b (0.67) 酒总黄酮

正相关

葡萄总黄酮(0.82)>总酚(0.78)> DPPH 自由基(0.77) 负相关 果皮颜色a (0.7)>氨基酸总量(0.7)>果皮颜色b (0.7) 白藜芦醇

正相关

葡萄总黄酮(0.72)>总酚(0.7)>氨基酸总量(0.7) 负相关 百粒质量(0.69)>果皮颜色a (0.69)>苹果酸(0.67) DPPH 半抑制体

积 正相关 葡萄总黄酮(0.79)>总酚(0.78)> DPPH 自由基(0.77) 负相关

果皮颜色a (0.69)>果皮颜色b (0.66)>百粒质量(0.65) 色泽L*

正相关

果皮颜色a>(0.72)百粒质量(0.65)>果皮颜色b (0.64) 负相关 花色苷(0.77)> DPPH 自由基(0.71)>单宁(0.7) 色泽a*

正相关

酒石酸(0.69)> PH 值(0.69)>出汁率(0.68) 负相关 果皮颜色b (0.78)>果皮颜色a (0.77)>白藜芦醇(0.72) 色泽b*

正相关

还原糖(0.71)>酒石酸(0.69)>黄酮醇(0.68)

负相关 果皮颜色L (0.73)>褐变度(0.69)>白藜芦醇(0.66)

上述表格可以直观的反应出酿酒葡萄与葡萄酒的理化指标之间的联系。例如,对于

红葡萄酒理化指标中的花色苷一项,可以发现,其与酿酒葡萄理化指标中花色苷、葡萄总黄酮以及总酚等正关联度较大,与果皮颜色a 、果皮颜色b 以及百粒质量等指标的负关联度较大。

表15 白葡萄酒与酿酒葡萄关联度排序结果表酒的理化指标正负相关性关联度排序

单宁正相关黄酮醇(0.75)>葡萄总黄酮(0.72)>单宁(0.71)负相关果梗比(0.72)>褐变度(0.71)>白藜芦醇(0.71)

总酚正相关黄酮醇(0.77)>葡萄总黄酮(0.77)>总酚(0.75)

负相关果梗比(0.71)>多酚氧化酶活力(0.71)>褐变度(0.69)

酒总黄酮正相关总酚(0.77)>葡萄总黄酮(0.75)>蛋白质(0.72)负相关果梗比(0.7)>酒石酸(0.7)>花色苷(0.69)

白藜芦醇正相关果皮颜色a(0.69)>还原糖(0.68)>可溶性固形物(0.67)负相关果皮颜色L(0.69)>黄酮醇(0.69)>褐变度(0.68)

DPPH半抑制体

积正相关单宁(0.75)>黄酮醇(0.74)>DPPH自由基(0.73)

负相关果梗比(0.74)>多酚氧化酶活力(0.7)>褐变度(0.7)

色泽L* 正相关总酚(0.75)>百粒质量(0.73)>葡萄总黄酮(0.71)负相关固酸比(0.7)>干物质含量(0.69)>果皮颜色b(0.67)

色泽a* 正相关葡萄总黄酮(0.72)>总酚(0.72)>苹果酸(0.7)

负相关酒石酸(0.68)>果梗比(0.68)>可溶性固形物(0.67)

色泽b* 正相关固酸比(0.71)>果皮颜色b(0.67)>白藜芦醇(0.67)负相关总酚(0.75)>出汁率(0.73)>葡萄总黄酮(0.73)

5.4 问题四:葡萄和葡萄酒的理化指标对酒质量的影响分析

5.4.1 模型Ⅴ:灰色关联模型

1.模型建立

由于考虑酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,总共有38-39项理化指标,运用灰色关联分析方法,计算出所有理化指标与葡萄酒质量的关联度,并根据正负相关性,进行关联度排序,选取关联度前10的理化指标,说明这些理化指标对葡萄酒质量的影响比较大。

2.模型求解

酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响(红葡萄酒):

表16 红葡萄酒和酿酒葡萄理化指标对葡萄酒质量关联度排序结果表

类别理化指标正关联度类别理化指标负关联度红葡萄酒花色苷0.722 红葡萄酒色泽L* 0.704

酿酒葡萄

果皮质量0.700

酿酒葡萄干物质含量0.607

花色苷0.678 可溶性固形物0.599

酒石酸0.639 褐变度0.592 红葡萄酒白藜芦醇0.611 果皮颜色L* 0.588

酿酒葡萄

PH值0.599 果皮颜色b* 0.583 单宁0.593 果皮颜色a* 0.575 黄酮醇0.587 可滴定酸0.568 百粒质量0.579 苹果酸0.566 果穗质量0.570 白藜芦醇0.558

通过上表计算结果发现,酿酒葡萄的理化指标例如果皮质量、花色苷、酒石酸等以及红葡萄酒的理化指标例如花色苷、白藜芦醇等均能显著影响红葡萄酒的质量。

酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响(白葡萄酒):

表17 白葡萄酒和酿酒葡萄理化指标对葡萄酒质量关联度排序结果表类别理化指标正关联度类别理化指标负关联度

酿酒葡萄黄酮醇0.679

酿酒葡萄果穗质量0.736

白葡萄酒DPPH半抑制体积0.675 百粒质量0.688 酿酒葡萄可溶性固形物0.671 出汁率0.666

白葡萄酒

总酚0.662 果梗比0.655 色泽b* 0.654 单宁0.627

酿酒葡萄

还原糖0.652 蛋白质0.615 干物质含量0.605 总酚0.611 白藜芦醇0.602

白葡萄酒

白藜芦醇0.608 VC含量0.596 单宁0.607 氨基酸总量0.588 酒总黄酮0.603

通过上表计算结果发现,酿酒葡萄的理化指标例如黄酮醇、可溶性固形物等以及白葡萄酒的理化指标例如DPPH半抑制体积、总酚、色泽b*等均能显著影响白葡萄酒的质量。

5.4.2 论证用葡萄和葡萄酒的理化指标评价酒质量的合理性

本文为了讨论能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,而引入葡萄和葡萄酒的芳香物质,并分析其对葡萄酒质量的影响。将葡萄以及葡萄酒的总芳香物质相加,并分别计算它们与葡萄酒质量之间的相关度,结果如表:

表18 葡萄和葡萄酒芳香物质对葡萄酒质量关联度排序结果表

芳香物质正关联度芳香物质正关联度红葡萄总芳香物质0.532 白葡萄总芳香物质0.586

红葡萄酒总芳香物质0.582 白葡萄酒总芳香物质0.471

由结果可以发现每一类总芳香物质对各自葡萄酒质量的影响均比较大。因此可以直观的认为芳香物质也能够评价葡萄酒的质量,故仅仅考虑用葡萄和葡萄酒的理化指标来评价葡萄酒的质量是不合理不全面的。

通过参阅相关资料[8]发现葡萄酒质量的评价主要包括感官指标,理化指标以及卫生指标。

(1)感官指标:包括葡萄酒的外观(颜色、浓度、色调、澄清度、气泡存在与否及持续性);香气(类型、浓度、和谐程度);滋味(协调性、结构感、平衡性、后味等);典型性(外观、香气与滋味之间的平衡性)等。

(2)理化指标:指由葡萄酒的成分(糖、酒精、矿物质元素、干浸出物、有机酸等)所构成的指标。

(3)卫生指标:指葡萄酒中的微生物(酵母菌、细菌、大肠杆菌)和一些对人体健康有影响的限量成分。

葡萄酒的感官分析(品尝)就是利用感官去了解,确定某一产品的感官特征及其优缺点,并最后估价其质量。即利用视觉、嗅觉和味觉对葡萄酒进行观察、分析、描述、定义、分级。

葡萄酒的质量检定,单单依靠化学分析或仪器分析,即使完全符合国家标准或部颁标准,也是远远不够的,因为化学分析和仪器分析只能表示葡萄酒的化学成分或卫生指标,无法表示酒的风味质量。只有通过目测、鼻嗅与口尝,依靠视觉、嗅觉、味觉对酒的色泽、芳香、滋味做出精密的检定,才能准确的评价出葡萄酒的质量。

综上所述,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量有影响,可是却不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。需要综合考虑理化指标、感官指标及卫生指标来对葡萄酒质量进行评价。

六、模型评价

6.1 模型Ⅰ的评价

优点:模型一采用了逐对比较法,将每个样本在两组评酒员下的分数进行了配对,运用了基于成对数据的t检验,具有较高的理论性。

缺点:模型一中的显著性水平是人为设置的,在不同的显著性水平下可能得到不同的结果。

6.2 模型Ⅱ的评价

优点:模型二运用的方差比较法实现较为简单,变量较少,并且方差能够很好的反应出可靠性大小。

缺点:方差比较法的结果比较主观,缺乏客观分析。

6.3 模型Ⅲ的评价

优点:模型三通过相关性分析以及主成分分析,将原本的大量指标降维成少量指标,并且这少量指标具有较高的代表性。

缺点:模型三的拟合模型具有较大的随机性,不能够充分反应出变化趋势。

6.4 模型Ⅳ的评价

优点:模型四运用了灰色关联分析,适合于具有复杂关系的酿酒葡萄、葡萄酒的理化指标之间关系的分析。并且得到的结果具有较高的可信度。

缺点:模型四不能够定量的找出两个变量之间的关系,只是定性的给出关联程度的大小排序,对两个变量之间的关系分析不够彻底。

参考文献

[1] 盛骤,谢式千,潘承毅,概率论与数理统计(第四版),北京:高等教育出版社,2008.6。

[2] 张一天,法国葡萄酒评分体系介绍,

https://www.wendangku.net/doc/351616714.html,/view/eb80ef0390c69ec3d5bb7546.html,2012/9/9。

[3] 张宇镭,党琰,贺平安,利用Pearson相关系数定量分析生物亲缘关系,计算机工程与应用, 2005,(33):(1),2005。

[4] 李洪成,SPSS 18数据分析基础与实践,北京:电子工业出版社,2010.7。

[5] 邓聚龙,灰色系统理论教程,武汉:华中理工大学出版社,1990。

[6] 王宁练,冰川平衡线变化的主导气候因子灰色关联分析,冰川冻土,1995(17):(9-10),1995.3。

[7] 袁嘉祖,灰色系统理论及其应用,北京:科技技术文献出版社,1991。

[8] 彭德华,影响葡萄酒质量的主要因素分布,中外葡萄与葡萄酒,2004(05):(41-44),2004。

附录

附录一(问题一方差分析)

方差分析结果表

角度一角度二

红葡萄白葡萄红葡萄白葡萄

第一组第二组第一组第二组第一组第二组第一组第二组

92.981.8777892.2222225.877780.2600370.2096430.1686260.096334 39.7888916.22222201.066749.066670.1216690.1035450.3191410.132384 45.8222230.7111166.45556142.48890.1186940.1021720.3293390.242672 108.044441.2888944.7111142.10.3232380.1384440.1345230.114477 62.0111113.65556126.444426.277780.1887430.0893170.2315270.097381 59.7333321.12222162.711122.722220.1551460.1112090.275510.122499 103.611162.6777839.1666742.177780.1837040.1837740.1274140.102314 44.0111165.11111183.631.122220.190470.1847130.4538240.085571 32.9444425.7333392.76667106.26670.1532520.1212050.1967810.184693

30.436.17778212.677870.40.1441190.1312290.3370620.148463 70.7666738.04444177.122287.822220.2138150.198770.2686040.16772 79.6555625.12222115.7889140.04440.1568870.1235470.2387110.267843 44.9333315.28889170.766746.766670.1846050.093680.2666390.12658

3623.15556114.222215.877780.1855320.1065170.2345370.075034 85.5666741.34444131.654.044440.2408340.1325820.2653780.125847

18.120.117882.233330.1751250.1078570.2828440.201636 88.011119.166667144.177838.455560.1751280.0676020.2584680.116059 42.7666750.26667156.544430.233330.1478550.1692020.2848390.114964 47.3777855.1555646.426.044440.1449570.1406910.1578780.104075 15.5111139.0666764.450.044440.1014580.1363050.1975440.134311

116.135.51111172.711164.40.2253540.1054910.2905190.133428 50.6222224.26667138.666753.60.1243290.1311660.286370.13606 32.4888924.7666743.6555611.60.1378580.0981040.1572920.093728 74.8888910.72222111.122238.544440.1428990.1035710.2527840.103048 64.6222243.7333333.87778106.50.1798170.1140020.1174240.168049 31.2888941.5555672.9102.90.1303480.1140740.1256420.213984 49.7777820.5144.435.555560.2028830.0999110.2630490.116177

80.4555625.377780.1864530.079485

附录二(问题二相关性分析与主成分分析)

酿酒葡萄的理化指标与葡萄酒质量的Pearson相关系数表

元素红葡萄总评分白葡萄总评分氨基酸总量0.156 0.322 蛋白质0.516 -0.084

VC含量0.264 0.175

花色苷0.274 -0.23

酒石酸0.294 0.436

苹果酸-0.336 0.206

相关文档