当前位置：文档库 › 2012年全国大学生数学建模竞赛A题(葡萄酒理化指标与质量的评鉴分析,获全国二等奖)

2012年全国大学生数学建模竞赛A题(葡萄酒理化指标与质量的评鉴分析,获全国二等奖)

葡萄酒理化指标与质量的评鉴分析

摘要

用好的葡萄也许酿不出好酒，但没人能用劣质葡萄酿出好酒。巧妇难为无米之炊，再优秀的酿酒师，如果没有优质的葡萄，也很难酿出好酒。不同葡萄品种酿制出的葡萄酒是不同的，但是，除了品种间的差异，葡萄自身的质量是酿制高品质葡萄酒的关键。本文通过建立means

K-聚类模型、典型相关分析等模型，逐步探求用葡萄和葡萄酒的理化指标来评鉴葡萄酒质量的方法。

问题一要求我们分析附件1中两组评酒员的评价结果是否存在显著性差异，为此我们依据小概率原理建立模型Ⅰ-显著性检验模型。首先我们利用F检验求解两组评酒员之间是否存在显著性差异，再利用配对t检验对检验样本做再次检验，以提高研究效率，确保评价结果的准确性。利用Excel软件处理数据后，进行t、F的联合检验，当联合检验均被接受，得到两组评酒员的评价结果有显著性差异的结论。同时通过对两组品酒员对55种葡萄酒样品评分的稳定性、统一性分析，确定第二组品酒员的评价结果更可信。

针对问题二本文根据附件2提供的数据，利用模糊数学原理[3]，建立模型Ⅲ

K-聚类模型，对酿酒葡萄进行分类，再以葡萄酒品尝评分作为质量评价依据，means

对酿酒葡萄进行分级。首先，考虑到酿酒葡萄的理化指标过多，不便分类，我们利用多元统计分析原理对红、白酿酒葡萄进行主成分分析，得出红、白酿酒葡萄分别有8个和11个主成分，从而大大减少了分类指标。再利用means

K-算法求出最佳聚类数k，建立means

K-聚类模型对各种葡萄样品在各个主成分上的得分进行聚类，将红、白葡萄样品分别划分为3类和4类。最后，根据每个类别中葡萄样品对应的葡萄酒的品尝评分，对各类酿酒葡萄进行分级。

针对问题三建立模型Ⅳ-典型相关分析模型，定量分析酿酒葡萄与葡萄酒的理化指标之间的联系。我们首先选取酿酒葡萄与葡萄酒皆含有的花色苷、单宁等成分作为理化指标，然后构建典型相关分析模型，研究酿酒葡萄与葡萄酒两组样品的理化指标之间的相关性。得出的结论是：红葡萄与红葡萄酒的理化指标有显著相关性，而因酿造工艺的不同，白葡萄与白葡萄酒的理化指标并无显著相关性。

针对问题四建立模型Ⅴ-多元回归模型。我们在模型Ⅳ给出的结论基础上，对酿酒葡萄的理化指标与葡萄酒理化指标之间的联系作进一步讨论。根据原始数据使用Excel作出红葡萄样品中芳香物的含量与红葡萄酒的芳香物含量的对比图，从图中可明显看出两者之间存在较强的相关性。由于酿造工艺的差异，白葡萄样品中芳香物的含量与白葡萄酒的芳香物含量没有明显的相关性。因此，我们仅以讨论葡萄酒的理化指标与葡萄酒质量的影响，利用最小二乘原理，建立多元回归分析模型，用MATLAB软件求解得到红葡萄酒的理化指标与红葡萄酒的质量的评价方程，由此得出能够用红葡萄酒的理化指标来评价红葡萄酒的质量。由于无法得出白葡萄和白葡萄酒理化指标对白葡萄酒质量的关系，故无法使用白葡萄和白葡萄酒理化指标来白葡萄酒的质量。

本文在问题二中选择影响葡萄酒质量的理化指标时方法具有一定的特点，采用主成分分析法与means

K-聚类方法相结合，以较少的综合指标代替较多的原有指标，既简化，又使计算结果具有可靠性。

关键词：葡萄酒；理化指标；典型相关分析；means

K-聚类分析；MATLAB

§1 问题的重述

一、背景知识

1.葡萄酒的发展历史

葡萄酒的酿造起源于公元前6000年古代的波斯，即现今的伊朗。对于葡萄的最早栽培，大约是在7000年前始于前苏联南高加索、中亚细亚、叙利亚、伊拉克等地区。后来随着古代战争、移民传到其它地区。初至埃及，后到希腊，传至法国等欧洲国家时，葡萄酒的发展达到了新的高峰。在被人誉称为浪漫之都的法国，葡萄酒被视为快乐的泉源，幸福的象征。

随着中国不断的对外开放，葡萄酒业也随之加快了发展的脚步。加入世界贸易组织，中国葡萄酒行业更是发生巨大变化：生产成本不断降低；全国性品牌减少；行业整流整合，强者愈强，弱者难以为继；生产优质低价的葡萄酒去占领国际市场成为发展的趋势。

图1 葡萄酒酿造国家分布图

2.葡萄酒的介绍

葡萄酒又称红酒，被视为幸福的象征。它是用新鲜的葡萄或葡萄汁经发酵酿成的酒精饮料。葡萄酒的品种很多，因葡萄的栽培、葡萄酒生产工艺条件的不同，产品风格各不相同，通常分红葡萄酒和白葡萄酒两种。前者是红葡萄带皮浸渍发酵而成，有多种的红，根据葡萄酒的年龄的不同，色泽浅到浅3红，深到深褐色；后者是葡萄汁发酵而成的，但白葡萄酒并非就是白色的，只是相对于红葡萄酒而言。色泽浅到浅黄，深到泛金黄，通常为柠檬色；取料是白葡萄或红(黑）葡萄或两者的混合。

3.葡萄酒的制作

按照国际葡萄酒组织的规定，葡萄酒只能是破碎或未破碎的新鲜葡萄果实或汁完全或部分酒精发酵后获得的饮料，其酒精度一般在8.5°到16.2°之间；按照我国最新的葡萄酒标准GB15037-2006规定，葡萄酒是以鲜葡萄或葡萄汁为原料，经全部或部分发酵酿制而成的，酒精度不低于7.0%的酒精饮品。因此不同质量的酿酒葡萄酿出的葡萄酒的质量不同，葡萄的品种、成产地区、所含化合物的比重都会在一定程度上使葡萄酒的质量受到影响。但同时，制作葡萄酒的工艺流程对葡萄酒质量的影响也是不可忽视的。发酵的时间、温度、所使用器皿等的不同制出的葡萄酒的品质差异也会很大。葡萄酒制作工艺流程如下图2。

图2 葡萄酒工艺流程图

二、原始数据

1.附件1：两组评酒员对葡萄酒的品尝评分表（含4个表格）；

2.附件2：葡萄样品和葡萄酒样品的理化指标（含2个表格）；

3.附件3：葡萄样品和葡萄酒样品的芳香物质（含4个表格）。

三、要解决的问题

现根据附件中提供的数据，要求建立数学模型以解决以下问题：

⑴问题一：建立相关模型分析附件1中两组评酒员的评价结果有无显著性差异，确定评价结果更可信的一组；

⑵问题二：根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级；

⑶问题三：定量分析酿酒葡萄与葡萄酒的理化指标之间的联系；

⑷问题四：分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

§2 问题的分析

一、相关知识的介绍

世界上最有影响力的葡萄酒评论家罗伯特·帕克。他创造的葡萄酒评分体系——100分制，葡萄酒的打分范围是50-100，基于以下四个主要因素：外观，香气，风味，总体质量或潜力。每瓶葡萄酒最低都能得到50分。具体级别划分为：分数范围96-100为极佳；分数范围90-95为优秀；分数范围80-89 为优良；分数范围70-79为一般；分数范围60-69为低于一般；分数范围50-59为次品。如今这种葡萄酒质量的评分标准是国际公认的最权威评分标准，对全世界优质葡萄酒的价格和需求有非常大的影响。

二、对问题的总分析

在2012年5月25日～27日举行的2012中国国际名酒展览会上，展会最大亮点就是中国引入了世界葡萄酒行业公认的鉴酒专家罗伯特?帕克的评分标准。国内引入帕克评分标准，将对消费者起到一个权威的指导作用，将有助拨开以往红酒消费迷雾。真正走上理性消费的道路，形成新的葡萄酒消费文化。

葡萄酒的质量即葡萄酒优秀的程度，它是产品的一种特性，且决定购买者的可接受性。从消费的角度来看，葡萄酒的质量更多地是通过品尝评分的高低来体现。同时，另一层面上，葡萄酒作为葡萄的发酵产品，它的质量又取决于原料的质量、所采用的加工

工艺及相应的陈酿技术等因素。

为分析酿酒葡萄和葡萄酒之间的相互影响关系，本文将通过建立典型相关分析模型检验葡萄中理化指标、葡萄酒中理化指标之间的关联度，进而利用多元线性回归方法，分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，最后，利用帕克的评分体系检测葡萄酒质量理化指标评定方法的可行性。

三、对问题的具体分析

1.对问题一的分析

问题一要求我们分析本题附件1中两组评酒员的评价结果有无显著性差异，判断两组葡萄酒品尝打分更可信、真实。对于分析显著性差异，我们需要进行显著性检验，利用数理统计的方法来评价一个分析方法的可靠性达到了什么样的水平。而实验这种水平精密度准确度，则是通过t、F检验——它们同时以小概率事件原理为出发点，通过其固有程序仅为达到统计检验的目的。最后对评价结果的可信度可以做出定性的判断。

2.对问题二的分析

问题二要求我们根据酿酒葡萄的理化指标、葡萄酒的质量对所给葡萄样品进行分级。而对于酿酒葡萄的分级，是依据葡萄质量的好坏程度影响葡萄酒质量的好坏程度进行品质高低的分级的。我们可以根据本文所给葡萄各项指标数据先对酿酒葡萄进行分类，进而根据质量综合评分对酿酒葡萄进行分级。在对酿酒葡萄分类时，我们可以建立K 聚类算法模型，对酿酒葡萄建立合理的分类体系，在此过程中利用主成分分means

析法对酿酒葡萄指标数据进行处理；然后，利用文中将葡萄样品的品尝综合得分作为葡萄酒质量评价标准的依据，根据得分的高低顺序对各类酿酒葡萄进行分级划分。

3.对问题三的分析

问题三要求我们分析酿酒葡萄与葡萄酒的理化指标之间的联系。鉴于红葡萄与红葡萄酒的制作与白葡萄与白葡萄酒制作的不同，我们将红葡萄与白葡萄与其所酿的葡萄酒分别分析其理化指标的关系。首先，选取酿酒葡萄与葡萄酒合理的理化指标，然后构建典型方差分析模型，以酿酒葡萄的理化指标与葡萄酒的理化指标作为两组变量，从整体上分析酿酒葡萄与葡萄酒的理化指标之间的关系

4.对问题四的分析

要论证能否用葡萄和葡萄酒的的理化指标来评价葡萄酒的质量，必须分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。我们可以根据问题三的结论，分析葡萄酒与葡萄样品中的理化指标的相关性。其次，我们通过建立多元线性回归模型，判定葡萄酒的理化指标对葡萄酒质量的影响。根据回归系数的大小确定葡萄酒中的理化指标对于葡萄酒质量的影响

§3 模型的假设

1.所有葡萄样品的生长环境相同；

2.葡萄酒制作工艺环境一样；

3.20位品酒员随机分到两组，且每位品酒员的评分公平公正；

4.品酒员可信度不受客观因素影响；

5.每位品酒员经验丰富，判别能力准确；

6.所给样品红葡萄酒或白葡萄酒的制作工艺一致。

§4 名词解释与符号说明

一、名词解释

1.理化指标：指物质或产品的物理性质、物理性能、化学成分、化学性质、化学性能等技术指标,也是产品的质量指标。它是对照国家标准要求,按照标准检测方法检测的。

2.葡萄酒的理化指标：总酸、挥发酸、酒精度、干浸出物、总浸出物、残糖、单宁、色度、色调、总酚、总

SO、明胶、盐酸、PH、固形物等等。

3.花色苷：是花色素与糖以糖苷键结合而成的一类化合物，广泛存在于植物的花、果实、茎、叶和根器官的细胞液中，使其呈现由红、紫红到兰等不同颜色。

4.单宁：是英文（Tannins）的译名，是葡萄酒中所含有的二种酚化合物其中的一种物质，尤其在红葡萄酒中含量较多，有益于心脏血管疾病的预防。

二、符号说明

§5 模型的建立与求解

一、问题一的分析与求解

模型Ⅰ显著性检验模型

1．问题的分析

在问题一中，我们需要对本题附件1中两组评酒员的评价结果进行数据分析，根据分析结果判断有无显著性差异。而分析显著性差异，则需要显著性检验，利用数理统计的方法来评价一个分析方法的可靠性达到了什么样的水平。作为一种成熟的分析方法，人们对它的精密度、准确度好坏的期望值总是越来越高，而衡量这精密度，准确度好坏的标准则是通过t 、F 检验[1]——它们同时以小概率事件的原理为出发点，通过其固有的程序达到统计检验的目的。我们可以利用F 检验来求解两组评酒员之间是否存在显著性差异，然后利用配对t 检验对检验样本做再次检验，以提高研究效率。

对于两组品酒员评分的可信度， 2．模型的准备

t 、F

两种检验法从各自不同的角度对两组或两组以上的数据间有无显著性差异进

行检验推断，t 检验常用于比较两组数据的分布情况，这种比较可以在两种方法之间展开；F 检验则是通过计算两组数据的方差之比检验它们在精密度上的差异是否显著，亦即检验它们的分析条件是否处在稳定的状态。然而，在实际工作中，常常出现t ，F 检验在同一问题，同一置信水平下，两种检验的检验判断不一致，故针对此种情况，本文在进行显著性检验时，同时进行t ，F 的联合检验，只有当联合检验一同被接受之后，所作出的结论才是完整的和可以信赖的。 3．模型的建立与求解 1）数据的处理

首先利用附件1的数据，求出两组中各品酒员分别对每一酒样的综合得分，再求每一组对某一酒样的平均分。详见附录表1 酒样评价总分表。经SPSS 软件对数据进行正态分布检验，基本所有数据通过正态分布检验。 2）F 检验

（1）先建立无效假设，两组品酒员对酒样评分的标准差无差异性，即210:S S H =，备择假设，211:S S H ≠。同时确定显著性水平05.0=α。

（2）先求出两组数据的s （标准偏差），再求得方差2S ，把方差大的记为2

大S ，方差小的记为2

小S

（3）按下列数学公式求出统计量：

2小

大计算S S F =

利用EXCEL 软件，得到F 检验的结果，见表1：

对于05.0=α置信水平，查F 检验的临界值表知9.1=临界F ，则根据F 检验结果

临界

红临界白F F F F >>,，说明第一组，第二组对白葡萄酒，红葡萄酒的品尝评分具有显著

性差异。 3）配对t 检验

配对t 检验又称成对t 检验。是将对子差数d 看作变量，先假设两种处理的效应相同，

,021=-μμ即对子差值的总体均值0=d μ，

再检验样本差数的均值d 与0之间差别有无显著性，推断两种处理因素的效应有无差别或某种处理因素有无作用。由于此设计使影响结果的非被试因素相似或相同，因而提高了研究效率。

（1）先建立无效假设，两组品酒员对酒样评分的标准差无差异性，即210:S S H =，备择假设，211:S S H ≠。同时确定显著性水平05.0=α，

（2）先求出两组数据的s （标准偏差），再求得方差2S ，把方差大的记为2

大S ，方差小的记为2

小S

（3）按下列数学公式求出统计量：

s d s d t =

)(2

--=

∑∑n n d d s d

d ∑=

n s s d

d =

式中d 为各个对子值的差数，d 为差数的平均数，d s 为差数的标准差，d s 为差数的标准误，n 为对子数。

利用EXCEL 软件，求出t 检验的结果，见表2：

对于05.0=α置信水平，05.004.0<=白p ，05.002.0<=红p ,故接受原假设，认为第一组、第二组对白葡萄酒、红葡萄酒的品尝评分具有显著性差异。

综上，由F 检验与t 检验结果可知，均认为第一组，第二组对白葡萄酒，红葡萄酒的品尝评分具有显著性差异，因此，我们最后认为附件1中两组评酒员的评价结果有显著性差异。模型Ⅱ 可信度模型

⑴模型的建立与求解

我们通过对品酒员水平的评价来确定两组品酒员的可信度。

一般来说，由于品酒员对葡萄酒的评价常常根据其自身喜好有所不同，但是不同的品酒员对某一种葡萄酒的评价又有一定联系。对同一种葡萄酒，不同品酒员的打分可能不完全相同，但分数应在一个范围内波动，所有分数有一定离散性，又有联系。而对品酒员打分的评价没有任何固定公式来计算，所以评价的方式是比较离散的。但是离散的评价方式又得有联系，并能综合评价品酒员水平的好坏。评价某品酒员水平的方法多种多样，有离散性的分析统计、波动性的分析、统一性的分析等。

1、对于数据离散性的分析，由分数偏差来表达)(ij ij n n -，而偏差正负的个数可以反映该品酒员给分偏高还是偏低。然后通过最大分数和最小分数的统计可以辅助评价某品酒员给分的偏差。

2、对波动性的分析，由方差∑-=

ij ij

i n n n

s 来达某品酒员给分的稳定性。

3、统一性（联系）：在上述两个分析结果后，如果出现不能比较的情况，就对某几位大致相当的选手进行继续分析。因为各个品酒员的分数不应该相差太大。所以用平均偏差和的大小来衡量某品酒员与整体的统一性。

偏差率：%

100?-=

n n p ij ij

平均偏差率：∑

j ij ij p n

p 1

⑵模型的建立与求解

1.分析波动性（稳定性）：对于品酒员打分的稳定性来说，方差是一个可以评定的方式。使用Excel 来统计品酒员打分的方差如表3。

为更直观地观看两组评酒员对红葡萄酒的品尝总评分方差大小关系，我们利用Excel做出对应评分方差的折线图，见图3。

图3 红葡萄总评分方差图

为更直观地观看两组评酒员对白葡萄酒的品尝总评分方差大小关系，我们利用Excel做出对应评分方差的折线图，见图4。

图4 白葡萄总评分方差图

稳定性分析：如方差图所示，第二组对白葡萄酒品尝总评分方差<第一组对白葡萄酒品尝总评分方差，第二组对红葡萄酒品尝总评分方差<第一组对红葡萄酒品尝总评分方差，显然第二组评分的稳定性明显高于第一组，即第二组品酒员给葡萄酒打分的波动

性较小，具有一定的可靠性。

2.偏差性分析，即一致性分析：使用Excel来统计品酒员打分的平均偏差率如表4。

白葡萄酒样品号第一组第二组红葡萄酒样品号第一组第二组

1 178.2244 -7.4E-17 1 -5E-17 8.26E-17

2 -3.9E-17 3.89E-17 2 3.61E-17 0

3 3.4E-17 7.63E-17 3 -7.1E-17 7.6E-17

4 -7.5E-17 -7.4E-17 4 8.47E-17 -3.6E-17

5 4.16E-18 -1.4E-18 5 3.82E-17 7.7E-17

6 -8.3E-1

7 -1.4E-1

8 6 -3.6E-17 4.34E-17

7 2.08E-18 -3.7E-17 7 -5.6E-18 4.54E-17

8 -8.3E-17 3.89E-17 8 3.96E-17 0

9 -8E-17 -7.4E-17 9 6.94E-19 -3.6E-17

10 4.23E-17 3.89E-17 10 -4E-17 4.16E-17

11 4.41E-17 -8.3E-17 11 8.6E-17 -2.3E-17

12 3.47E-17 -7.8E-17 12 2.78E-17 4.02E-17

13 -8.4E-17 -7.6E-17 13 7.49E-17 4.23E-17

14 -6.9E-19 7.36E-17 14 0 7.96E-17

15 -7.5E-17 -7.2E-17 15 -3.9E-17 -4.6E-17

16 8.33E-18 4.23E-17 16 -7.7E-17 -8.3E-17

17 2.78E-17 3.47E-17 17 3.68E-17 0

18 7.77E-17 -3.6E-17 18 1.94E-17 -8.5E-17

19 -3.9E-17 -7.4E-17 19 7.25E-17 8.22E-17

20 3.54E-17 7.88E-17 20 7.32E-17 3.75E-17

21 -7.1E-17 -3.6E-17 21 7.63E-17 -3.9E-17

22 -2.8E-18 -7.4E-17 22 -3.7E-17 7.91E-17

23 -7.3E-17 -7.4E-17 23 6.8E-17 7.42E-17

24 4.16E-17 7.63E-17 24 2.78E-18 -3.5E-19

25 7.49E-17 2.78E-18 25 -4.2E-17 -4.2E-17

26 3.61E-17 3.89E-17 26 3.61E-17 2.08E-18

27 5E-17 -1E-18 27 0 -1.4E-18

28 3.89E-17 7.22E-17

由表4显而易见，第二组的平均偏差率<第一组的平均偏差率，说明第二组品酒员的打分更具有统一性。

综上，第二组品酒员的评分可信度更高。

二、问题二的分析与求解

模型Ⅲmeans

K 聚类模型

1.对问题的分析

问题二要求我们根据酿酒葡萄的理化指标、葡萄酒的质量对所给葡萄样品进行分级。而对于酿酒葡萄的分级，则需要根据本文所给葡萄各项理化指标数据对酿酒葡萄进行分类。然而酿酒葡萄各项理化指标多达30项，会影响酿酒葡萄分类的精度。我们采用主成分分析的方法，将我们手中许多相关性很高的葡萄的理化指标转化成彼此相互独立或不相关的变量。选出比原始变量个数少，能解释大部分资料中的变异的几个新变量，即所谓主成分。并计算各品种葡萄在各个主成分上的得分。建立means

K-聚类算法模型，对每种葡萄样品在各个主成分上的得分进行聚类，从而实现对酿酒葡萄的分类。然后，利用文中将葡萄样品的品尝评分作为葡萄酒质量评价标准的依据，根据每一类葡萄对应葡萄酒的品尝评分，计算出这一类葡萄的平均质量得分，从而根据得分的高低顺序实现对葡萄种类的分级。

2.模型的准备

⑴影响葡萄品质的主要成分的确定

主成分分析[4]能将许多相关的随机变量压缩成少量的综合指标，同时又能反映原来较多因素的信息。按照主成分分析的理论，若前R个主成分的累积贡献率达到了85%的原则，则这R个主成分能反映足够的信息。研究对27个红葡萄样品和28个白葡萄样品的30个指标进行主成分分析，从累积贡献率分析并简化评价葡萄品质的主要指标。

利用MATLAB软件编程（求解程序见附录。。。）分别对27个红葡萄样品和28个白葡萄样品的30个指标数据进行主成分的特征根、贡献率计算，结果见表5、表6：

析中主成分的累积贡献率达到了85%的原则，即利用前8个样品足以反映我们想要得到的信息，故选前8个特征值。

中的累计贡献率需要达到的85%，故白葡萄样品中选前11个特征值，使得主成分能够较全面的反映出果实品质的主要信息。

通过主成分分析，分别计算出每种葡萄样品在各个主成分的得分（见附录），再根据下面的means K -聚类，通过对每种葡萄样品在各主成分的得分进行聚类，实现对酿酒葡萄的分类。 ⑵模型的理论准备

K -均值聚类(K-means clustering)是Mac Queen 提出的一种非监督实时聚类算法，

在最小化误差函数的基础上将数据划分为预定的类数k 。该算法原理简单并便于处理大量数据。

在means K -算法运行前必须先指定聚类数目k 和迭代次数或收敛条件，并指定k 个初始聚类中心，根据一定的相似性度量准则，将每一条基因分配到最近或“相似”的聚类中心，形成类，然后以每一类的平均矢量作为这一类的聚类中心，重新分配，反复迭代直到类收敛或达到最大的迭代次数。

首先定量计算两个可比较元素间的相异度，对象间的相似度和相异度是基于两个对象间的距离来计算的。

标量也就是无方向意义的数字，也叫标度变量。现在先考虑元素的所有特征属性都是标量的情况。例如，计算{}102,1,2=X 和{}2,3,1=Y 的相异度。一种很自然的想法是用两者的欧几里得距离来作为相异度，欧几里得距离的定义如下：

222211)

()()(),(n n y x y x y x Y X d -++-+-=

其意义就是两个元素在欧氏空间中的集合距离，因为其直观易懂且可解释性强，被广泛用于标识两个标量元素的相异度。将上面两个示例数据代入公式，可得两者的欧氏距离为：

025

.100)2102()31()12(),(2

=-+-+-=

Y X d

除欧氏距离外，常用作度量标量相异度的还有曼哈顿距离和闵可夫斯基距离，两者定义如下：

曼哈顿距离：

n y x y x y x Y X d -++-+-= 2211),(

闵可夫斯基距离：

n p

y x y x y x Y X d -++-+-=

1),(

上面这样计算相异度的方式有一点问题，就是取值范围大的属性对距离的影响高于取值范围小的属性。这样不利于真实反映真实的相异度，为了解决这个问题，一般要对属性值进行规格化。所谓规格化就是将各个属性值按比例映射到相同的取值区间，这样是为了平衡各个属性对距离的影响。通常将各个属性均映射到[0,1]区间，映射公式为：

)

min()max()min(i i i i i a a a a a --=

其中)max(i a 和)min(i a 表示所有元素项中第i 个属性的最大值和最小值。

K 均值算法是基于质心的技术，k 均值算法以k 为输入参数，把n 个对象集合分为k

个簇，使得簇内的相似度高，簇间的相似度低。簇的相似度是关于簇中对象的均值度量，可以看作簇的质心。

K 均值算法的处理流程如下，首先，随机的选择k 个对象，每个对象代表一个簇的

初始均值，对剩余的每个对象，根据其与各个簇均值的距离。将它指派到最相似的簇。然后计算每个簇的新均值，这个过程不断的重复，直到准则函数收敛。通常采用平方误差准则：

1)(∑∑

=∈-=

j c x j

i c j

i Z

X m J

这里)(m J c 是数据库中所有对象的平方误差的总和，i x 是空间中的点，表示给定的数据对象，j z 是簇j c 的平均值（i x 和j z 都是多维的）。 3模型的建立及求解

⑴模型的建立

我们将27种红葡萄样品和28种白葡萄样品分别30项理化指标进行聚类。

设定元素集合D ，其中共有30个元素，每个元素有27/28个观察属性。首先对D 进行规格化处理。然后进行以下步骤：

①从D 中随机取k 个元素，作为k 个簇的各自的中心。

②分别计算剩下的元素到k 个簇中心的相异度，将这些元素分别划归到相异度最低的簇。

③根据聚类结果，重新计算k 个簇各自的中心，计算方法是取簇中所有元素各自维度的算术平均数。

④将D 中全部元素按照新的中心重新聚类。 ⑤重复第④步，直到聚类结果不再变化。 ⑥将结果输出。 ⑵模型的求解

由于葡萄种类存在较大的差异，使用means K -算法时，首先计算k 的取值。（图5）假定红葡萄样品的最佳聚类数为1k ，白葡萄样品的最佳聚类数为2k ，依据模糊数学原理，利用MATLAB 软件作出两种葡萄样品的最佳聚类数图，见图5

图5 1k 、2k 值确定图

根据图5，得出红葡萄样品的最佳聚类数31=k 、白葡萄样品的最佳聚类数42=k 。即将27种红葡萄样品划分为3类、将28种白葡萄样品划分为4类为最佳。

依据已确定的最佳聚类数，利用MATLAB 软件编程求解（求解程序见附录四），得出红、白葡萄的具体分类，分类结果见表7、表8：

文中提到将葡萄样品的品尝评分作为葡萄酒质量的评价标准。我们以此依据，根据已分类葡萄样本对应葡萄酒的品尝评分，计算出每一类葡萄的平均质量得分，进而根据得分的高低顺序对葡萄种类做出分级，红葡萄分为三级,白葡萄可分为四级，具体等级划分见表9。

由表9，我们可看出红葡萄被划分为三个等级。第一等级红葡萄质量最好，共11个葡萄样品，包括样品1、2、3、8、9、12、17、18、24、25、26，所酿出的葡萄酒品尝等分为70.982；第二等级红葡萄质量次之，共有15各个葡萄样本，分别为样品4、5、6、7、10、11、13、14、15、19、20、21、22、23、27，所酿出的葡萄酒品尝等分为70.213；葡萄样品16为第三等级，所酿出的葡萄酒品尝得分最低为69.9。白葡萄被划分为四个等级。第一等级包括样品1、23两种白葡萄；第二等级为包括样品5、9、11、19、27等5种白葡萄；划为第三等级的白葡萄有样品2、3、4、6、10、12、13、18、20、25、26、28；第四等级的白葡萄共9种，即样品7、8、14、15、16、17、21、22、24。

4．结论

70±的分值范围内，白根据表9内容得出，对应的红葡萄酒品尝评分基本上落在1

70±的分值范围内。根据国际通用分级标准，本题的红、葡萄酒品尝评分基本上落在0.5

白葡萄酒样本均处于70-79的分值范围内，属于一般葡萄酒，故制作该级葡萄酒所使用的葡萄样本也属于一般种类的葡萄品种。

同时，我们可以看出红、白葡萄对应葡萄酒的等级划分评分相近，葡萄酒得分并未有拉开明显的分值差距，也正体现在了近阶段中国葡萄酒行业的发展现状。近几年，葡萄酒业在中国逐渐发展起来，但对于中国的绝大多数消费者而言，一般等级的葡萄酒是现行消费的主流。

三、问题三的分析与求解

模型Ⅳ 典型相关分析模型 1．问题的分析

问题三要求我们分析酿酒葡萄与葡萄酒的理化指标之间的联系。我们知道葡萄酒是酿酒葡萄经过酒精发酵，冷冻过滤等一系列过程酿成，因此，酿酒葡萄与葡萄酒之间有一定的相关关系，好的酿酒葡萄能够酿造更好的葡萄酒。虽然利用相关分析法，可以对酿酒葡萄与葡萄酒的理化指标之间的关系进行分析，但相关分析是点对点的分析，只能给出具体的葡萄某一指标和葡萄酒某一指标之间线性关系的大小，不能从总体上说明酿酒葡萄与葡萄酒的理化指标之间的关系。典型相关分析由Hotelling 1936年提出，是研究两组变量之间相关关系的一种统计分析方法，它能够真正反映两组变量之间的相互线性依赖关系。本文尝试应用典型相关分析法对酿酒葡萄与葡萄酒的理化指标之间的关系进行分析。 2．模型的准备

典型相关分析是研究两组变量之间相关关系的一种多元统计方法。典型相关将各组变量作为整体对待，描述的是两个变量组之间整体的相关，而不是两个变量组个别变量之间的相关。受主成分分析的启发，对每组变量分别构造线性组合，将两组变量之间的相关性转化为两个变量之间的相关性进行研究.典型相关分析示意图如图6 所示。

图6 典型相关分析示意图

典型相关分析首先在每组变量中找出变量的线性组合，使其具有最大相关性；然后再在每组变量中找出第二对线性组合，使其与第一对线性组合不相关，而第二对本身具有最大相关性；如此继续下去，直到两组变量之间的相关性被提取完毕为止；这些综合变量被称为典型变量（canonical variates ）；第I 对典型变量间的相关系数则被称为第I 典型相关系数（一般来说，只需提取1～2对典型变量即可较为充分的概括样本信息）。 3．模型的建立与求解

1.总体典型变量的定义

设两组分别为q 与p 维）

（q p ≤的变量Y X ,： T

Y Y Y Y X X X X )

,,(),,(q 21p 21，， ==

设q p +维随机向量???? ??=Y X Z 协方差阵???

=∑

∑

∑∑22

1211，其中∑

是X 的协方差

阵，∑

是Y 的协方差阵,21

∑

T 是Y X ,的协方差阵。

典型相关分析用X 和Y 的线性组合Y b V X a U T T ==,之间的相关来研究X 和Y 之间的相关性。其目的就是希望找到向量a 和b ，使),(V U ρ最大，从而找到替代原始变量的典型变量U 和V 。

典型相关系数的数学定义为：

∑

b a

V Var U Var V U Cov V U T

)

()(),(),(ρ

由于随机变量乘以常数不改变其相关系数，为防止不必要的结果重复出现，最好在其中附加如下的约束条件：

)(1

)(22

====∑∑b b V Var a a

U Var T

记,,1

12111121122121122112111∑∑∑∑∑∑∑∑--------==B A 则有,,2

b Bb a Aa

λλ==

其中2λ既是A 又是B 的特征根，a 和b 就是对应于A 和B 的特征向量。 2.数据的收集与处理

由于红葡萄与红葡萄酒，白葡萄与白葡萄酒之间的理化指标有很大区别，我们分别分析红葡萄与红葡萄酒，白葡萄与白葡萄酒之间的理化指标之间的关系。

选取葡萄样本为纵向量，以葡萄与葡萄酒作为两组变量，其中葡萄的理化指标为：花色苷, 单宁, 总酚, 葡萄总黄酮, 白藜芦醇, DPPH 自由基以及反映色泽的L* , a*(+红；-绿), b*（+黄;-蓝），而葡萄酒的理化指标为：花色苷，单宁, 总酚, 酒总黄酮, 白藜芦醇, DPPH 半抑制体积以及反映色泽的 L*(D65), a*(D65), b*(D65)。（注：白葡萄酒中不含有花色苷）。

将所有数据以Excel 表格形式录入，再以0.13SPSS 软件进行统计计算和分析，结果和解释如下：

表12输出的是红葡萄与红葡萄酒的理化指标之间的相关系数，从二者直接相关系数看，花色苷, 单宁, 总酚, 葡萄总黄酮, DPPH自由基，酒总黄酮, DPPH半抑制体积之间关联程度较大，而白藜芦醇以及反映色泽的L* , a*(+红；-绿), b*（+黄;-蓝）在红葡萄与红葡萄酒理化指标中的直接关联度不大，更多的可能是综合影响。

由于变量间的交互作用，因此，这个简单相关系数矩阵只能作为参考，不能真正反映两组变量间的实质联系。

表13 典型相关系数

1 2 3 4 5 6 7 8 9

0.994 0.926 0.869 0.791 0.628 0.599 0.331 0.295 0.021

由表13知第一典型相关系数为0.994，第二典型相关系数为0.926，它们均比酿酒葡萄的指标和葡萄酒的指标两组间的任一个相关系数大，即综合的典型相关分析效果要好于简单相关分析。由表14知：在α＝0.05的情况下，第一与第二典型相关系数是显著的。

采用典型相关变量标准化的系数来建立典型相关模型：

红葡萄理化指标的第一典型变量模型为：

0.368

0.325t

0.577t

0.029t

0.383t -

0.318t

0.084t

0.825t

-1.069t

花色苷)1

(t和单宁)2

(t两个变量的典型权重最重大，说明花色苷和单宁最能够反映红葡萄的理化指标。

红葡萄酒理化指标的第一典型变量模型为：

110.014y

0.024y 0.032y 4.675y

0.11y

-0.127y

-0.198y

0.024y

--0.003y

+++++=V

DPPH 半抑制体积)6(y 的典型权重最大，说明DPPH 半抑制体积最能够反映红葡萄的理化指标。

红葡萄理化指标的第二典型变量模型为：

0.07x9

0.04x8-0.325x70.577x6- 0.029x50.383x4-0.318x3-0.084x2-0.825x12+++=U

红葡萄酒理化指标的第二典型变量模型为：

0.344y9

0.193y8-0.613y70.375y6- 0.272y50.059y41.285y3-0.014y2-1.603y12++++=V

在对二对典型变量中，在红葡萄理化指标中葡萄的花色苷)1(x 和葡萄的DPPH 自由基)6(x 的典型权重较大，在红葡萄酒理化指标中葡萄酒的花色苷)1(y ，总酚)3(y ，L*(D65))7(y 的典型权重较大，说明红葡萄与红葡萄酒的理化指标有显著地相关性。

利用相同的原理，我们对白葡萄和白葡萄酒的理化指标进行典型相关分析，由

0.13SPSS 软件[2]

求解结果如下所示：

由表15 知，在显著性水平05.0=α的情况下，sig 值均大于显著性水平α，则无法

原假设，故白葡萄与白葡萄酒的理化指标的所有典型相关系数均不显著。

白葡萄与白葡萄酒的理化指标之间并无显著的相关关系，同样的理化指标，红葡萄与白葡萄酿成的葡萄酒，他们之间的关系出现不一样的结果，原因归结于红葡萄酒与白葡萄酒的制作过程不同，红葡萄酒在除梗破碎后，直接带着果肉发酵，而白葡萄酒则是除梗破碎后，果肉分离发酵。酿成的白葡萄酒与红葡萄酒已有了很大的不同。而这也从侧面反映出花色苷, 单宁, 总酚, 葡萄总黄酮, DPPH 自由基，酒总黄酮, DPPH 半抑制体在红葡萄中的含量对所酿的葡萄酒有着显著的相关关系。四、问题三的分析与求解模型Ⅴ 多元线性回归模型 1.问题的分析

问题四要求我们分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的的理化指标来评价葡萄酒的质量。首先，我们根据问题三的结论可以得出，红葡萄酒与红葡萄样品中的相关成分具有较强的相关性，白葡萄酒由于酿造工艺的不同，其主要成分含量与对应的葡萄样品中成分相关性较弱。其次，我们通过建立多元线性回归模型，判定葡萄酒的理化指标对葡萄酒质量的影响。根据回归系数的大小

确定葡萄酒中的理化指标对于葡萄酒质量的影响。 2.模型的准备

⑴影响葡萄酒质量成分的确定

在问题三中，我们得出红葡萄酒理化指标与红葡萄样品的理化指标具有较强的相关性，葡萄样品的主要理化指标都在葡萄酒中得以体现。因此，我们仅以研究红葡萄酒的理化指标与红葡萄酒质量的关系。

在此之前，我们利用附件3中的数据，将葡萄样品与葡萄酒样品中所含的芳香物累积求和，得到芳香物总含量。利用Excle 作图比较葡萄酒样品中芳香物含量与葡萄样品中芳香物含量。

图7 红葡萄样品与红葡萄酒芳香物质含量对比

根据图可以看出红葡萄样品中第12、13、21号样品在芳香物的含量上有较大差异，从其余样本可以看出，红葡萄样品与红葡萄酒样品芳香物含量较为一致，从而红葡萄样品中的芳香物得以在葡萄酒样品中得以体现。

图8 红葡萄样品与红葡萄酒芳香物质含量对比

根据图可以看出白葡萄样品中在芳香物的含量上与白葡萄酒有较大差异，这也进一步说明了由于白葡萄酒酿酒工艺的问题，导致芳香物含量的巨大差异，由此，白葡萄样品中的芳香物无法与白葡萄酒样品中的芳香物建立联系。

⑵模型的理论准备

在许多实际问题中，我们经常从定量的角度去研究某些变量间的关系。通常，变量间的关系有两大类：一类变量间有完全确定的关系，可以用函数形式来表示；另一类变量间有一定的关系，但无法用精确的函数形式表示出来，变量间的这种关系在统计上称为相关关系。回归分析便是研究变量间相关关系的一种统计方法。在回归分析中，把变量分成应变量(y )和自变量（n x x x 21,）两类，通过对统计数据的分析，确定y 与

n x x x 21,之间的关系表达式。当影响因变量y

的自变量有多个时，我们的分析便是多

元线性回归分析。我们一般建立多元的线性回归模型对问题进行讨论。

回归模型建立之后，我们的任务是利用统计数据，去计算y 与x 相关关系表达式中未知参数（称为回归系数）的估值。估算回归系数的方法有很多种，我们通常用的是最小二乘法()LSE 。在本题中，我们利用了MATLAB 软件对回归参数进行计算。

对于问题四，因为影响葡萄酒质量的因子有很多，但主要分为四大方面：(1)外观分析：a.澄清度；b.色调。(2)香气分析：a.纯正度；b.浓度；c.质量。(3)口感分析：a.纯正度；b.浓度；c.持久性；d.质量。(4)平衡/整体评价。 3.模型的建立与求解

建立红葡萄酒质量与红葡萄酒理化指标的多元线性回归方程。

构建回归模型：利用Matlab 软件对数据进行回归分析，多元回归模型构造为： 0`998877665544332211ββββββββββ+++++++++=x x x x x x x x x y （1）式中变量y 为红葡萄酒质量数，变量1x 为花色苷，变量2x 为单宁，变量3x 为总酚，变量4x 为酒总黄酮，变量5x 为白藜芦醇，变量6x 为DPPH 半抑制体积，变量7x 为L*(D65)，变量8x 为a*(D65)，变量9x 为b*(D65)。具体数值见表。

公式（1）中921,βββ 为回归系数，反映某一自变量在其他自变量控制下对于因变量的影响程度；0β为残差，即难以用解释的部分。

R =0.7970,F = 6.9781,P <0.0004,2

S = 4.8529

最后得到回归模型为：

543212445.64587.0488.06687.07167.00181.06897.82x x x x x x y -++-+-=

9870959.00033.02326.0x x x -+-

模型的检验（残差的正态检验）在Matlab 中输入命令：)1(r jbtest h = 输出结果：0=h 表明残差服从正态分布

另外在对白葡萄酒质量与白葡萄酒理化指标建立回归方程时，由于没有形成有效的回归方程，即无法得出白葡萄酒质量与白葡萄酒理化指标之间的关系。 4.结论

根据第三题的结论与芳香物的比较，我们初步得出红葡萄酒的质量能够与红葡萄酒

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验计算机科学与技术成员：xxx 学号：xxxxxxxxxx 葡萄酒的评价摘要本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理，我们得出了一个较为合理地评价葡萄酒质量优劣的模型。在问题一中，我们采用T检验法，首先进行正态分布拟合检验，判断出它们服从正态分布。之后，我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信，由于评酒员评分的客观性，我们通过计算评酒员评分均值的置信区间，利用置信区间的长短来判断评分的可信程度。置信区间越窄，说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄，所以第二组评酒员的评价结果更可信。在问题二中，我们采用主成分分析法，把给定的一组相关变量通过线性变换转成另一组不相关的变量，这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变，使第一变量具有最大的方差。第二变量的方差次大，并且和第一变量不相关。由于变量较多，虽然每个变量都提供了一定的信息，但其重要性有所不同。依次类推，最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中，我们通过多项式曲线拟合的方法，构造一个以葡萄酒的理化指标为自变量，酿酒葡萄的理化指标为因变量的函数，并利用Matlab软件进行曲线拟合，最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。在问题四中，我们用无交互作用的双因素试验的方差分析方法，通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后，我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量，且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。关键词：T检验法，Matlab，正态分布，主成分分析法，多项式曲线拟合，方差分析一．问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分，然后求和得到其总分，从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系，葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果，附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题： 1. 分析附件1中两组评酒员的评价结果有无显着性差异，哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4．分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

葡萄酒理化指标的测定

葡萄酒主要理化指标的测定 1 实验目的通过测定葡萄酒中糖（总糖或还原糖）、酸、花色苷、酒精度、SO2(游离SO2和总SO2)的含量以及酒的色度和色调，掌握葡萄酒主要理化指标的测定方法。 2 方法总糖和还原糖（直接滴定法）原理利用费林溶液与还原糖共沸，生成砖红色氧化亚铜溶液的反应，以次甲基蓝为指示液，以样品或经水解后的样品滴定煮沸的费林溶液，达到终点时，稍微过量的还原糖将蓝色的次甲基蓝还原为无色，以示终点。根据样品消耗量求得总糖或还原糖含量。注：反滴法——即先向反应体系中加入一定量的葡萄酒，再用标准葡萄糖溶液滴定反应体系至终点，此时所用糖的体积与标定费林试剂时所用糖体积的差值即为酒中的糖。（一般地，滴定时用待测液进行滴定，但由于干葡萄酒中糖含量较低，滴定至终点所需样液量极大，因此采用反滴法）试剂和材料盐酸溶液（1:1）氢氧化钠溶液（200g/L）葡萄糖标准液（L）次甲基蓝指示液费林溶液（I，II）测总糖用葡萄酒（25mL葡萄酒，酸水解，调pH至中性，蒸馏水定容至500mL）测还原糖用葡萄酒（50mL葡萄酒，蒸馏水定容至500mL）

分析步骤（见黑板）结果计算 X=*1000 X:葡萄酒中总糖或还原糖的含量，单位g/L F：费林溶液I、II各5mL相当于葡萄糖的克数，单位g C：葡萄糖标准溶液的浓度，单位g/mL V：消耗标准葡萄糖溶液的体积单位mL V1吸取酒样的体积；V2稀释后的体积；V3吸取V2的体积 =(测总糖用葡萄酒) 总酸（指示剂法）原理利用酸碱中和原理，以酚酞做指示剂，用氢氧化钠标准溶液滴定样品中的有机酸，根据氢氧化钠溶液的体积计算葡萄酒中的有机酸含量（以酒石酸计）试剂和材料氢氧化钠标准滴定溶液L 酚酞指示液分析步骤（见黑板）结果计算 X= X:样品中总酸的含量（以酒石酸计），单位g/L c：氢氧化钠标准滴定溶液的浓度，单位mol/L V0：空白试验消耗氢氧化钠体积，单位mL V1:滴定样品时消耗氢氧化钠体积，单位mL V2：吸取酒样的体积，单位mL 75：酒石酸摩尔质量数，单位g/mol

数学建模葡萄酒评价模型

A题葡萄酒的评价摘要随着我国葡萄酒业的逐步发展，葡萄酒生产企业的规模和数量不断扩大，葡萄酒的质量成为大家越来越关心的话题，本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。针对问题一，在对两组评酒员的评价是否存在显著性差异的问题中，首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布，并对两组评酒员的评价结果进行了F检验和t检验，发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异，通过方差分析法处理，发现第二组评酒员的评分方差更小，故评价结果均衡度更好,其结果可信度更大。针对问题二，我们利用置信区间法计算出可信区间，再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级，用Q型聚类分析的方法将红，白葡萄酒和酿酒葡萄各分成了5类，然后对分好的葡萄类所酿造的葡萄酒进行统计，得到各类葡萄所对应的级别。针对问题三，我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系，运用主成分分析的方法，从酿酒葡萄的30个指标中提取出了12个主要成分，进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据，我们有用最小二乘法进行。针对问题四，利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响，利用spss软件求出自变量与因变量间的相关系数为0.138，拟合线性回归的确定性系数为0.019，经方差分析及对回归系数进行显著性检验发现方程不显著，即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键字：正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分，然后求和得到其总分，从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系，葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题： 1、分析附件1中两组评酒员的评价结果有无显著性差异，哪一组结果更可信； 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级； 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系； 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。二、问题分析近年来，我国的葡萄酒业得到了快速的发展，同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题，如今人们也越来越关注葡萄酒的质量问题，因此，研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价，通常情况下，评价结果一般服从正态分布，所以一方面，我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布；然后利用SPSS软件对两组评酒员的评价结果进行方差分析，计算出各组评酒员评价结果的方差，方差越大表明组内成员的评价差异越大，可信度就越低。；最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价，其评价结果通常较为均匀，因此，另一方面，我们应记录和讨论表中出现的异常数据，客观评价其出现的原因。综合以上，得出结论。 2.2 对问题二的分析首先，我们利用第一题的结果，用置信区间法对可信组的原始数据进行处理，降低评酒员之间的差异，提高酒样品之间的差异【1】；利用处理后的数据（总分）对葡萄酒进行分级；然后，对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析，将葡萄分成

2012数学建模优秀论文葡萄酒

江苏师范大学第五届（2011）数学建模竞赛我们选择的题号是： B 我们的参赛队号为：

2012江苏师范大学数学建模竞赛题目 B题研究生录取问题摘要：根据问题的背景和题目要求，研究在不同条件的研究生录取问题，在对笔试，面试以及导师信息量化，加权平均求解的基础来解决研究生录取的问题。通过构造选择矩阵和满意度矩阵建立导师和学生之间的双向选择矩阵的0-1规划模型。利用测发编程计算求出最优解，从而求得问题的最优方案，同时采用降阶技巧和创建定理，快速的求解出实用的最优解，得到对应的最优方案！一问题重述某学校Ｍ系计划招收10名计划内研究生，依照有关规定由初试上线的前15名学生参加复试，专家组由8位专家组成。在复试过程中，要求每位专家对每个参加复试学生的以上5个方面都给出一个等级评分，从高到低共分为A,B,C,D四个等级，并将其填入面试表内。所有参加复试学生的初试成绩、各位专家对学生的5个方面专长的评分。该系现有10名导师拟招收研究生，分为四个研究方向。导师的研究方向、专业学术水平（发表论文数、论文检索数、编（译）著作数、科研项目数），以及对学生的期望要求。在这里导师和学生的基本情况都是公开的。要解决的问题是： (1) 首先，请你综合考虑学生的初试成绩、复试成绩等因素，帮助主管部门确定10名研究生的录取名单。然后，要求被录取的10名研究生与10名导师之间做双向选择，即学生可根据自己的专业发展意愿（依次申报2个专业志愿）、导师的基本情况和导师对学生的期望要求来选择导师；导师根据学生所报专业志愿、专家组对学生专长的评价和自己对学生的期望要求等来选择学生。请你给出一种10名研究生和导师之间的最佳双向选择方案（并不要求一名导师只带一名研究生），使师生双方的满意度最大。 (2) 根据上面已录取的10名研究生的专业志愿，如果每一位导师只能带一名研究生，请你给出一种10名导师与10名研究生双向选择的最佳方案，使得师生双方尽量都满意。 (3) 如果由十位导师根据初试的成绩及专家组的面试评价和他们自己对学生的要求条件录取研究生，那么，10名研究生的新录取方案是什么？为简化问题，假设没有申报专业志愿，请你给出这10名研究生各申报一名导师的策略和导师各选择一名研究生的策略。相互选中的即为确定；对于剩下的导师和学生，再按上述办法进行双向选择，直至确定出每一名导师带一名研究生的方案，使师生都尽量满意。 (4) 学校在确定研究生导师的过程中，要充分考虑学生的申报志愿情况。为此，学校要求根据10名导师和15名学生的综合情况选择5名导师招收研究生，再让这5名导师在

葡萄酒理化指标检测

美国新橡木桶贮存赤霞珠干红葡萄酒W2B5理化指标分析班级：生工081 学号：080302101 姓名：杨冲摘要：本实验以美国新橡木桶贮存赤霞珠干红葡萄酒为原料,根据GBT 15038-2006 葡萄酒、果酒通用分析方法测定样品的总酸、挥发酸、酒精度、干浸出物、总浸出量、残糖、单宁、色度、色调、总酚、总SO2、明胶指数、盐酸指数、pH、可溶性固形物。结果显示, 葡萄酒的各项理化指标符合国家新标准中的规定。本文讨论分析了橡木桶对赤霞珠干红葡萄酒储存过程中理化指标的影响。关键词：赤霞珠；橡木桶；干红葡萄酒；理化指标；分析检测 1 引言葡萄酒是以新鲜葡萄或葡萄汁为原料，经发酵而成的含有多种营养成分的饮料酒, 是世界公认的对人体有益的健康酒精饮品。葡萄酒具有很高的营养价值和保健作用, 内含一种称为白藜芦醇的物质, 以红葡萄酒中含量最多, 可用于癌症的化学预防。葡萄酒能调节人体新陈代谢, 促进血液循环, 防止胆固醇增加, 同时还有利尿、激发肝功能和防止衰老的作用, 长期适当适量( 每天控制在50mL) 饮用, 可以起到滋补、强身、美容的作用, 可防止坏血病、贫血、眼角膜炎, 降低血脂, 促进消化, 对预防癌症和医治心脏病大有禆益。干红葡萄酒中含有人体维持生命活动所需的三大营养素：维他命、糖及蛋白质。葡萄糖是人类维持生命、强身健体不可缺少的营养成分，是人体能量的主要来源。近年来也越来越受广大顾客的青睐。本研究的目的就是通过对赤霞珠干红葡萄酒理化指标的检测，保障酒的质量，并通过检测分析在制作、品种、贮存工具、贮存条件相同的情况下，只有贮存时间不同对酒理化性质的比较分析。由于橡木桶贮存过的葡萄酒日益得到消费者的认可，橡木桶便越来越受到世界各地的酿酒师的青睐。橡木香气是木桶贮藏的葡萄酒中最常见的香气。经过木桶贮藏，葡萄酒逐渐氧化成熟。新、旧橡木桶也会对葡萄酒产生一定影响，随着贮酒次数的增加，木桶的贮藏效果逐渐减弱。几乎有葡萄酒出产的地方都可以见到赤霞珠的身影，但是它在世界各地区的表现是有所差异的，不同的地区由于气候不同导致葡萄的质量不同。本文研究的是美国新橡木桶贮存赤霞珠干红葡萄酒的理化指标差异。 2 材料与方法 2.1 原料美国6#新橡木桶贮存2#赤霞珠干红葡萄酒（W2B6）2010年10月—2011年6月的九个样品。 2.2 试剂与仪器试剂： NaOH 标准液，费林溶液Ⅰ、Ⅱ液，葡萄糖标液，福林-肖卡、福林-丹尼斯(试剂等。仪器：分析天平，分光光度计， pH计等。

数学建模--葡萄酒的分级(正式版)

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。我们知道，抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。如有违反竞赛规则的行为，我们将受到严肃处理。我们参赛选择的题号是（从A/B/C/D中选择一项填写）： A 我们的参赛报名号为（如果赛区设置报名号的话）：所属学校（请填写完整的全名）：西安理工大学参赛队员 (打印并签名) ：1. 郑晓东 2. 罗璐 3. 宫维静指导教师或指导教师组负责人 (打印并签名)：日期： 2013 年 05月 10 日

葡萄酒质量的综合评价分析摘要近年来，随着人们生活水平的提高，葡萄酒也随之受到人们的喜爱，加之食品科学技术的提高，人们对葡萄酒的品质也有了更高的要求，本文就针对葡萄酒品质的相关问题进行建模，求解和有关分析。对问题一，首先基于两组评酒员对同一批葡萄酒的评价分数数据，采用假设检验中的t检验法建立评估两组数据差异的模型，运用Spss软件求解，得到两组数据存在显著性差异的结论，其次，通过计算两组数据的方差，用以比较稳定性，得到第二组更可信的结论。对问题二，首先对酿酒葡萄理化指标数据进行标准化处理，经过主成分分析法将葡萄分为四个等级，其次，按可信度高的一组（第二组）得分将葡萄酒分为五级，综合两种分级，将酿酒葡萄分为了——级。对问题三，首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析，用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系，再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。

葡萄酒各种物化参数测定

葡萄酒理化指标的测定 1酒精度的测定密度计法依据不同的酒精溶液所对应的比重不同的原理，将葡萄酒中的酒精蒸馏出来，通过用比重计测量其比重，计算出酒精溶液的浓度。 1步骤用100ml容量瓶准确量取20℃酒样倒入1000ml圆底烧瓶中，再用约100ml 水冲洗容量瓶，洗液一齐倒入圆底烧瓶中，置600W电炉上加热蒸馏（采用蛇形冷凝器）开启冷却水，用原容量瓶接收蒸馏液（以冷却水大小调节蒸馏温度，使蒸馏液的温度不超过25℃）。将蒸馏液摇匀倒入100ml量筒，选用合适的精密酒精计，眼睛平视，读数读弯月面下缘，同时记录下温度，查酒精温度、浓度换算表，得到被测酒样的酒精度。所得结果保留至1位小数。 2结果的允许误差平行实验测定结果绝对值之差不得超过0.1%（v/v）。 3检验时注意事项 3.1被测样品酒精度在15%（v/v）以上时采用此方法。 3.2酒精计的分度值为0.1或0.2％（v/v），所用酒精计必须经国家认可的计量部门检定。 3.3测定含气葡萄酒时需排气后再取样。排气方法：用低真空连续抽气2分钟。 3.4蒸馏液的温度应控制在20℃±5。 3.5为避免蒸馏过程中乙醇蒸汽的逃逸而影响测定结果的准确性，蒸馏前必须检查蒸馏仪器的接口处是否严密。若出现漏气，必须重新测定。 3.6对于挥发酸含量过高（以醋酸计超过1g/l）或二氧化硫含量过高的样品应根据总酸测定的结果，用1N的氢氧化钠对样品进行中和后再进行蒸馏。 2.还原糖的测定 2.1斐林法 2.1.1步骤 2.1.1.1预备试验取斐林氏A、B液各5ml，置于250ml三角瓶中，加水50ml，加入酒样5ml，加热至沸腾。在沸腾状态下，用0.25%的葡萄糖溶液滴定至淡蓝色，加2滴1%的次甲基兰指示剂，继续滴定至蓝色完全消失，记录所消耗的葡萄糖溶液的毫升数。 2.1.1.2正式试验取斐林氏A、B液各5ml，置于250ml三角瓶中，加水50ml，加入酒样5ml。然后加入比预备试验少1ml的0.25%的葡萄糖溶液，加热至沸腾并保持2分钟。加2滴次甲基兰指示剂，在沸腾状态下，在1分钟内用葡萄糖溶液滴定至终点，记录消耗的毫升数，读数至小数点后两位。 2.1.2计算还原糖（以葡萄糖计，g/L）＝［（S－G×V）/5］×F×1000式中：S－斐林氏A、B液各5ml，相当于葡萄糖的克数； G－葡萄糖溶液的准确浓度，g/mL； V－（两次滴定）耗用葡萄糖溶液的平均体积，mL； 5－取样体积，mL；

葡萄酒的评价完整版

2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。我们知道，抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。如有违反竞赛规则的行为，我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。我们参赛选择的题号是（从A/B/C/D中选择一项填写）：我们的参赛报名号为（如果赛区设置报名号的话）：所属学校（请填写完整的全名）：参赛队员(打印并签名) ：1. 2. 3. 指导教师或指导教师组负责人(打印并签名)：日期： 2012 年 9 月 10 日赛区评阅编号（由赛区组委会评阅前进行编号）：

2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：全国评阅编号（由全国组委会评阅前进行编号）：

葡萄酒的评价方法研究摘要在本文中，我们分析葡萄酒和酿酒葡萄的理化指标与所酿的葡萄酒的质量之间的关系，研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。针对问题一，本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果，运用方差分析法来分析两组评价结果差异的显着性。在显着性水平取为0.05的情况下，发现两组评价结果的均值和方差均满足齐性，即两组评酒员的评价结果没有显着性差异。因无显着差异，本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值，计算两组评酒员对于各酒样品评分的方差并求和，结果显示第二组的总方差明显小于第一组，即其评分稳定性更高，得出第二组的评价结果更可信。针对问题二，本文借助问题一中第二组的评价结果，将葡萄酒的质量数量化。运用主成分分析方法，得出酿酒葡萄的主要理化指标，在此基础上运用相关性分析法，分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度，将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准，其中权重取为理化指标的相关系数。把各葡萄样品的主要理化指标代入表达式，得到最终加权平均值，对其划分级别，并作为葡萄的级别。结果显示红葡萄样品集中在第2,3,4级，而白葡萄大多数集中在第2级（级别数值越小代表葡萄质量越好）。针对问题三，本文依据问题二中所得的酿酒葡萄的主要理化指标，运用相关性分析法，分析了葡萄酒的理化指标与酿酒葡萄的主要理化指标之间的相关程度，我们得到的主要结论为：红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关，与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关，与酿酒葡萄的其他主要理化指标微弱相关；白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关，与酿酒葡萄的其他主要理化指标微弱相关。针对问题四，考虑到除葡萄与葡萄酒的理化指标外，葡萄与葡萄酒的芳香物质可能对葡萄质量也会造成影响。首先，运用主成分分析法，得出芳香物质中的主要成分，并借助问题二中所得的酿酒葡萄的主要理化指标，运用相关性分析法，综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。根据所得结果，取与葡萄酒质量关联程度较大的因素作为自变量，以葡萄酒质量作为因变量，运用多元线性回归模型建立相应的函数关系。通过上述定性与定量分析，说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响，因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。以上结果具有较高的可靠性和可行性，对于葡萄酒的评价具有一定的指导意义。关键词：葡萄酒质量理化指标方差分析主成分分析多元线性回归相关性分析一：问题重述

葡萄等级分划数学建模.

葡萄酒的评价模型摘要问题背景：现在国际上对葡萄酒的质量评价一般是通过聘请一批有资质的评酒员进行品评。评酒员通过对葡萄酒的外观分析、香气分析、口感分析和整体评价进行打分。然而评酒员拼酒时还受个人的感官因数，比如年龄、口味风格等因素的影响。本模型在忽略一些影响因素的基础上对题目给出的问题进行分析。问题一：分析两组评酒员评价两种葡萄酒哪一组更合理的问题，我们把附表中两组评酒员评酒时的打分提炼为四组数据，分别为两组评酒员对27种红葡萄酒的评价结果和28种白葡萄酒的评价结果。然后做评酒员对葡萄酒的评价做配对样本T检验分析，运用spss软件将的到的四组数据求得方差分析方差所得结果，我们得到第二组评酒员评酒的结果更具有合理性。问题二：对于问题2酿酒葡萄的分级问题，我们可以根第一问分析得出的葡萄酒的品分质量和葡萄的理化指标进行分析，运用排序中求秩和比的进行秩排序，并对葡萄酒的品分排序，利用模糊数学等级划分的方法对酿酒葡萄进行分级。、问题三：首先，我们利用SPSS计算出酿酒葡萄与葡萄酒的理化指标的相关系数。由于葡萄的理化指标较多，通过整理数据，在Excel中得到某个葡萄酒的理化指标与若干个酿酒葡萄的理化指标的相关系数,并且规定相关系数大于等于0.6表示两者相关性显著；最后，在SPSS中分别求出回归方程。问题四，首先利用SPSS分别计算出葡萄酒的理化指标与葡萄酒质量的相关系数、葡萄的理化指标与葡萄酒质量的相关系数。然后通过分析其相关系数，分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响。关键词：模糊数据分析原理、偏相关系数、排序问题重秩和比法、主成分分析、配对样本T检验、回归分析原理、相关分析原理问题重述

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价摘要本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理，我们得出了一个较为合理地评价葡萄酒质量优劣的模型。在问题一中，我们采用T检验法，首先进行正态分布拟合检验，判断出它们服从正态分布。之后，我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信，由于评酒员评分的客观性，我们通过计算评酒员评分均值的置信区间，利用置信区间的长短来判断评分的可信程度。置信区间越窄，说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄，所以第二组评酒员的评价结果更可信。在问题二中，我们采用主成分分析法，把给定的一组相关变量通过线性变换转成另一组不相关的变量，这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变，使第一变量具有最大的方差。第二变量的方差次大，并且和第一变量不相关。由于变量较多，虽然每个变量都提供了一定的信息，但其重要性有所不同。依次类推，最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。在问题三中，我们通过多项式曲线拟合的方法，构造一个以葡萄酒的理化指标为自变量，酿酒葡萄的理化指标为因变量的函数，并利用Matlab软件进行曲线拟合，最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。在问题四中，我们用无交互作用的双因素试验的方差分析方法，通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后，我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量，

葡萄酒的理化检验

一、理化指标的检验（无特殊说明水为蒸馏水） 1、酒精度的检验（密度瓶法）原理：通过蒸馏除去样品中的不挥发物质，用密度瓶测定出馏出液的密度。根据馏出液的密度，查表1，求得20℃时酒精度。用％（体积分数）表示。仪器：分析天平（感量0.0001g ），全玻璃蒸馏器（500ml ），附温度及密度瓶（50ml ）操作步骤：用100ml 容量瓶准确量取100ml 样品于500ml 蒸馏瓶中，用50ml 水分三次冲洗容量瓶，洗液全部并入蒸馏瓶中。连接冷凝器，以取样用容量瓶做接收器。开启冷凝水，缓慢加热蒸馏。收集馏出液接近刻度，取下容量瓶，补加水至刻度。将密度瓶洗净、干燥，带温度计和侧孔罩称量，至恒重。将密度瓶中加入蒸馏水，于20℃时用滤纸吸去侧管中流出的液体，盖上侧孔罩，擦干瓶壁上的水，称量出水与密度瓶的重量。将密度瓶中的水倒出，用试样冲洗密度瓶3~5次，装满，于20℃称量。计算： 0.9972.12.99811220 20m m A A m m A m m -?=?+-+-=ρ 2020 ρ——样品在20摄氏度时的密度，g/ml ； m ——密度瓶的质量，g ； m 1——20℃时密度瓶与水的质量，g ； m 2——20℃时密度瓶与试样的质量，g ；所得结果应保留至一位小数。 2、总糖和还原糖的测定（菲林试剂法）原理：利用菲林溶液与还原糖共沸，生成氧化亚铜沉淀的反应，以次甲基蓝为指示剂，以样品或经水解后的样品滴定煮沸的菲林溶液，达到终点时，稍微过量的还原糖将蓝色的次甲基蓝还原为无色，根据样品消耗量求得总糖或还原糖的含量。试剂和材料：盐酸（1+1），NaOH 溶液（200g/L ），葡萄糖标准溶液（2.5g/L,称取在105℃~110℃烘箱内烘干3h 并在干燥器中冷却的无水葡萄糖2.5g ，用水溶

有关葡萄酒评价的数学建模论文

葡萄酒的评价摘要本文主要采用数学统计与分析方法，利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。关于问题一，分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法，根据T值判断差异的显著性，代入数据后求得 P T t 双尾=0.00065<0.01，即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较，得出第一组的方差较大，所以认为第一组评酒员打分较为严格，即更可信。关于问题二，在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下，运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级，将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级，结果详见表5.2.1至表5.2.4。关于问题三，采用回归分析法，计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数，结果详见表5.3.1和表5.3.2，其相关系数的绝对值越大表示联系程度越紧密。关于问题四，首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系，将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1，总结出口感和外观为葡萄酒质量的决定因素，而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3，发现芳香物质对葡萄酒质量也有影响，否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。关键词：葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分，然后求和得到其总分，从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系，葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果，附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题： 1. 分析附件1中两组评酒员的评价结果有无显著性差异，哪一组结果更可信？ 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4．分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量？ 2.问题分析问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据，我们采用曲线拟合处理这一问题。因为所给数据是小样本，总体标准差未知的正态分布资料，因此采用T检验，根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较，方差大的一组则说明其打分较为严格，即说明他们对待评酒较为认真，从而认为其较为可信。问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系，所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序，根据综合评分的排序结果对酿酒葡萄样品分级；然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级，此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系，即要求得出它们各项理化指标之间联系的紧密程度，所以采用回归分析的方法计算它们的各理化指标的相关系数，然后以相关系数的绝对值大小表示它们之间联系的紧密程度。问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系，且葡萄酒的理化指标相对较少，因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果，得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素，再依据这几个因素结合葡萄酒质量排序，便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来，判断其对葡萄酒质量是否有影响，从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

数学建模葡萄酒的评价

葡萄酒的评价摘要葡萄拥有很高的营养价值，本文通过对葡萄酒的评价，以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析，对不同的酿酒葡萄进行了分类，并更深入讨论两者的理化指标是否影响葡萄酒质量。针对问题一，我们首先分别计算每类葡萄酒样品在两组组评酒师评价下的综合得分，以此作为每组评酒师的最终评价结果。再运用统计学中的T 检验进行假设与检验，得出两组评价结果具有显著性差异。最后通过计算各组评价员的评价结果的标准差，以此推算稳定性指标值P ，P 值较大的可信度较高，得出2p p <红1红与2P P <白1白，进而得出第二组的评价结果更加可信。针对问题二，我们分别对两组葡萄进行分类。在这里我们采用聚类分析法和主成分分析法，在matlab 中实现对酿酒葡萄的分类。针对问题三，根据σ μ -= x Z 对附件2中的数据进行标准化处理，排除单位不同的影响。以酿酒葡萄的30个一级理化指标作为自变量X ，葡萄酒9个一级的理化指标作为因变量y,建立多元线性回归模型εβ+=X y ,得出酿酒葡萄的理化指标与葡萄酒的理化指标之间的联系即回归系数矩阵 β。针对问题四，用灰色关联度分析对两者的关系进行度量，求得理化指标对样品酒的的关联系数。然后根据葡萄酒综合得分及指标的相关系数得出样品酒的综合指标，通过MATLAB 软件对综合指标与第二问中葡萄酒的分数进行指数拟合，拟合效果不佳，因此不能定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量，只能根据图像大致猜测综合指标与葡萄酒的质量负相关。关键词：T 检验聚类分析法主成分分析法 Z 分数多元线性回归一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分，然后求和得到其总分，从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系，葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果，附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题： 1.分析附件1中两组评酒员的评价结果有无显著性差异，哪一组结果更可信？ 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理

分析酿酒葡萄与葡萄酒的理化指标之间的联系

论酿酒葡萄与葡萄酒之间的关系郭其昌 2001年8月于天津蓟县《第八届全国葡萄、葡萄酒学术研讨会》各位代表：我试图用很短的时间把我用50多年时间研究的这个题目向大家说清楚。我讲3个方面：葡萄酿酒和葡萄栽培技术协作的2次全国会议、酿酒葡萄品种和葡萄酒的关系、葡萄质量和葡萄酒的关系。一、葡萄酿酒和葡萄栽培技术协作的2次全国会议关于这2次会议，《新中国葡萄酒业五十年》这本书的第16~68页有着详细的记载，大家抽时间可以看一看，相信能够从中取得一些教益。 74年的会议在烟台举行，会议根据当年上半年由轻工、外贸、栽培等单位组织的调查，总结了从解放至当时的葡萄和葡萄酒行业的情况，提出了原料基地化、基地良种化和良种区域化的理论以及执行办法，制定了发展规划。具体包括：确定发展葡萄不与粮棉争地、厂社挂钩、利用野生资源、加速发展栽培与酿酒之间的协作和研究、根据产地区域划分协作区、各地区的建议发展品种、区域性酿酒试验、出台葡萄酒暂行管理办法（葡萄酒标准的基础）。为了使行业了解国外情况，还公布了5期内容丰富的国外葡萄酒现状和法规。 80年的会议在通化举行，会议内容非常集中。主要解决了以下问题：讨论葡萄酒质量管理办法等4个试行草案、随着葡萄酒改型（出现干酒）的发展品尝新产品并提出结论、确定研究推广葡萄酿酒新工艺和新设备以及酿酒葡萄品种区域化的研究方向。为什么从70年代初我们就把酿酒和栽培结合在一起共议大事？因为通过前20年的研究和实践，使我们清楚地认识到二者之间休戚与共的相互关系。其实，葡萄栽培和葡萄酿酒本来就是栓在一根绳子上面的两只蚂蚱，要各行其是，只有两败俱伤，谁也没法进步。酿酒葡萄多次的种种拔拔，其主要原因是两方面结合出的问题。我们可以清醒地看到：市场经济是栽培和酿酒双方要尊重的市场。种植酿酒葡萄是为了提供给葡萄酒厂酿造葡萄酒。葡萄酒厂的市场是面向消费者，而酿酒葡萄的市场是葡萄酒厂，二者相互依存、不可分割。通过多年的工作，使我们知道要及时地总结经验和汲取教训，再不要热衷于随流。因此，随着行业的发展，两三年开一次这样的会议，有益于行业的健康和正常发展。希望酿酒工业协会和农学会紧密结合，把这次会议作为74年和80年会议的继续，继往开来，开创出酿酒葡萄和葡萄酿酒紧密结合的一片大好局面。

葡萄酒理化指标参考文献

葡萄酒理化指标参考文献 [1] GBT 15038-2006 葡萄酒、果酒通用分析方法. [2] 蔺红苹,邱翠婵,刘嘉玲.自酿葡萄酒的卫生指标和理化指标的检测湛江师范学院学报2010 年6 月第31 卷第3 期 [3]宋润刚，路文鹏，沈育杰.山葡萄新品种“左优红”果实色素及干红酒理化指标检测分析中外葡萄与葡萄酒2005,6:7～8 [4]赵建萍，张军翔，刘谱. 不同发酵温度和浸渍时间对红葡萄酒理化指标的影响中外葡萄与葡萄酒 2006,6:13～14 [5]王志东，张军翔，王琨，李梅. 不同酵母及果胶酶对红葡萄酒综合理化指标的影响中外葡萄与葡萄酒2007, 2 [6]孙建平, 潘秋红, 于庆泉, 段长青. 葡萄酒酉石稳定评判指标及其影响因素初探中外丽萄与蔺萄酒 2008 1:7-10 [7] 陆其科. 高纯度酒精蒸馏[M] . 北京:中国轻工业出版社,19921 [8] 周薇,羊语梅,张军岷. 品红—亚硫酸比色法测定酒中甲醇的方法改进[J] . 中国卫生检验杂志,2004 (5) :6471 [9] 田强. 酒类产品质量检验[M] . 北京:中国计量出版社,20061 [10] 周建新. 食品中菌落总数和大肠菌群检验的质量控制[J] . 粮食与食品工业, 2007 (3) :42 - 451 [11] 李华,王华,袁春龙,等. 葡萄酒化学[M] . 北京:科学出版社,20051 [12] 刘达雄. 海珠区出售葡萄酒中甲醇的含量调查分析[J] . 中国科技信息,2005(12) :93 - 941 [13] 黄亚东. 杨梅酒中甲醇形成及其毒性分析[J] . 酿酒科技,1999 (2) :60 - 611 [14] 马丽辉,陈卫民. 啤酒中大肠菌群检测法的探讨[J] . 酿酒科技,2004 (4) :89 – 901 [15] 彭德华.影响葡萄酒质量的主要因素分析[J] . 中外葡萄与葡萄酒，2004，5：40-44 [16] 李艳，崔彦志，随子华葡萄酒过程中聚合单宁的变化，酿酒科技，2009年03期 [17] Zaman M, Cameron KC, Di HJ,Inubushi K. Changes in mineral N,microbial biomass and enzyme activitiesindifferentsoildepthsafterapplicationsof dairy shed effluent and chemical fertilizer [J]. Nutrient Cyclingin Agroecosystems, 2002 (63):275-290 [18] H. Y. Chu, Y. Hosen, K. Yagi, K. Okada, O. Ito. Soil microbial biomass and activities in a Japanese Andisol asaffected by controlled release and applicationdepthofurea[J]. BiologyandFertilityofSoils(2005) 42: 89-96Biology and

数学建模葡萄酒评价.docx

A题：葡萄酒的评价摘要本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型，解决了葡萄酒的评价问题。问题一：利用方差分析法对评酒员评价数据进行分析，并用Excel 画出图表（见正文），直观地观察出两组评价数据范围接近，第二组评价数据波动不大，评价数据更可信。问题二：要求根据酿酒葡萄的理化指标和葡萄酒的质量，对这些酿酒葡萄进行分级，我们认为影响酿酒葡萄品质的因素较多，酿酒葡萄各理化指标之间的关系又是极其复杂的，对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各因素的权重，应用综合评判法，对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表：等级优良中合格葡萄种类红葡萄54108 白葡萄8892 问题三：利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系，并用BP 神经网络进行比较验证。问题四：通过聚类分析与神经网络相结合，分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量间的联系。通过理化指标得到葡萄酒质量评价分数，并与第二组评酒员评价出的葡萄酒质量评价分数对比分析，可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。本文的建模过程中，对于每个问题都充分考虑了影响因素，一定程度上体现了模型的可靠性，具有较强的适用性和普遍性。关键词：方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述通过聘请一些有资质的评酒员品尝葡萄酒，根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系，葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果，及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题： 1.分析两组评酒员的评价结果有无显着性差异，哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4．分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。二、问题分析问题一：观察附表 1 中评酒员的评价结果数据，分析得出它们之间的差异。根据评酒员对各组葡萄酒的评价结果数据，寻求结果数据更加稳定的一组，作为目标，利用求方差的数学模型，对各个数量指标进行分析比较，得出更有可信度组。问题二：根据不同理化指标对于酿酒葡萄影响各不相同，用层次分析法构造比较矩阵。计算得到各个因素所对应的权重，定一个分数指标，根据分数对葡萄进行分级。问题三：题中葡萄与葡萄酒指标数分别为 60、17，考虑因变量太多，用逐步回归分析法建立求解模型，结合神经网络模型进行对比验证。将多次测试值取平均数，获得可信数据。问题四：考虑参数过多，为剔除微小影响因素，通过聚类分析法对影响指标进行归类，寻找主要因素，用神经网络建立模型，获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数，与第二组评酒员评价数据比较分析，作为论证依据。三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响，二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i：表示第 i 个处理观测值总体平均数。 ij ：表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss ：表示误差平方和。 e ss t表示处理间平方。