葡萄酒评价的优秀论文.doc

上传人:风**** 文档编号:1009014 上传时间:2024-03-20 格式:DOC 页数:20 大小:5.62MB
下载 相关 举报
葡萄酒评价的优秀论文.doc_第1页
第1页 / 共20页
葡萄酒评价的优秀论文.doc_第2页
第2页 / 共20页
葡萄酒评价的优秀论文.doc_第3页
第3页 / 共20页
葡萄酒评价的优秀论文.doc_第4页
第4页 / 共20页
葡萄酒评价的优秀论文.doc_第5页
第5页 / 共20页
点击查看更多>>
资源描述

1、葡萄酒的评价模型摘要:本文主要针对葡萄酒的评价问题建立了相关数学模型。在对两组评酒员的评价是否存在显著性差异的问题中,首先验证了两组评酒员的评价结果服从正态分布,并通过方差分析法对两组评酒员的评价结果进行了分析,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,由于第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。在对酿酒葡萄进行分级的问题中,首先以相关系数衡量葡萄理化指标与葡萄酒质量的相似性程度,然后筛选出与葡萄酒质量相关性较大的理化指标与葡萄酒质量一起作为评估葡萄质量的评价指标,利用筛选出的评价指标对酿酒葡萄进行聚类分析,将红葡萄和白葡萄均分成了四类。最后以

2、每类中对应葡萄酒质量评分的均值作为该类葡萄的分数,从而定出四类的级别,以对应国家葡萄酒的四级分类标准。在分析酿酒葡萄与葡萄酒的理化指标间的联系问题中,本文采用偏最小二乘回归分析法对指标间的联系进行了分析计算,发现葡萄酒中的某些理化指标与葡萄的某些理化指标存在较强的相关性,比如白葡萄中的总糖和还原糖对白葡萄酒中顺式白藜芦醇苷和顺式白藜芦醇以及反式白藜芦醇的影响较大。在判断葡萄与葡萄酒的理化指标与葡萄酒的质量间关系的问题中,首先对葡萄和葡萄酒的理化指标与葡萄酒的质量进行了相关性分析,发现某些理化指标与葡萄酒的质量相关性很大。然后筛选出这些相关性较大的指标,用偏最小二乘回归分析法进一步定量分析了这些

3、指标与葡萄酒质量的关系,建立了葡萄酒质量的评价模型,经过检验,利用建立的评价模型对葡萄酒评价结果与专家组的评价结果误差普遍小于5%,这同时论证了用葡萄和葡萄酒的理化指标对葡萄酒进行评价是基本可行的。关键字:显著性检验;聚类分析 ;偏最小二乘回归分析法1 问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题:(1)分析两组评酒员的评价结果有无显著性差异,哪

4、一组结果更可信?(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2 问题的分析对于问题(1),两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以首先应当对评价数据进行拟合检验法1,然后利用方差分析对两组评酒员的评价结果进行显著性分析。一个较好的评价组应是本着客观的原则进行评价,因此评价结果通常较为均匀,据此,可以分别计算出各组评酒员评价结果的方差,方差越大表明组内成员的评

5、价差异越大,可信度就越低。对于问题(2),题目要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,首先就必须从这些指标中找到与酿酒葡萄分级有关的指标。考虑到酿酒葡萄的用途是酿制葡萄酒,因此葡萄酒的质量可以作为衡量酿酒葡萄质量的重要指标。而那些与葡萄酒质量相似性程度较大的酿酒葡萄理化指标也应作为酿酒葡萄的评估价指标。采用计算相关系数的方法计算两者间相似性程度,选定合适的相关系数为界线即得出酿酒葡萄质量评价指标。在酿酒葡萄质量指标确认后,采取聚类分析的方法对酿酒葡萄进行分类。分类后,各类中葡萄酿制葡萄酒的质量得分即作为各类分数,从而分出酿酒葡萄的级别。对于问题(3),要求对葡萄与葡萄酒的理

6、化指标的联系进行分析,葡萄的二级理化指标有50多种,葡萄酒的理化指标有15种左右,并且各个指标间可能存在较大的关联度,研究两组多重相关变量间的关系问题,可以考虑用偏最小二乘回归分析法。对于问题(4),首先利用问题(2)中相关性分析法和聚类分析法,筛选出与葡萄酒质量关联度较大的一些关键指标。经过去除掉对葡萄酒质量影响较小的指标,不仅可以简化计算,而且在实际研究中,工作人员只需测量这些关键指标即可,减少了工作量。然后利用偏最小二乘回归分析法,分析筛选后的指标与葡萄酒质量的函数关系,进而得到对葡萄酒质量的评价模型。为检验所建评价模型的准确性,可以考虑将样本数据分成两部分,一部分数据用于分析计算评价模

7、型,然后利用另一部分数据对模型进行检验。如果说误差较小,则说明所建评价模型较为满意,同时也论证了用理化指标对葡萄酒的质量进行评价的可行性。3 模型的假设(1) 酿酒葡萄的酿造水平与酿造环境相同;(2) 酿制同一种酒使用的葡萄是相同的;4 符号说明:第一组评酒员中第个评酒员对第种红葡萄酒的第个理化指标的评分;:第一组评酒员中第个评酒员对第种红葡萄酒的总评分;:第一组评酒员对第种红葡萄酒评价结果的方差;:第个指标与第个指标间的相关系数。5 模型的建立与求解5.1 两组评酒员评价结果的差异分析5.1.1 数据的处理与准备根据题意,共有两组评酒员,每组有十个成员,每个评酒员在评价任意一种酒时,均考虑了

8、四项一级指标和十项二级指标,每种酒的评价满分为100分,其中各个指标所占分值如表1所示。为方便计,将各个二级指标按照表1中从左至右的顺序依次编为110号。表1 各指标所占分值一级指标外观分析香气分析口感分析整体二级指标澄清度色调纯正度浓度质量纯正度浓度持久性质量整体分 值51068166882211记,分别表示第一组评酒员中第个评酒员,对第种红葡萄酒第个二级指标的评分和对第种红葡萄酒的总评分, ,分别表示第二组评酒员中第个评酒员,对第种红葡萄酒第个二级指标的评分和对第种红葡萄酒的总评分,则有假设把每一组所有评酒员对第种红葡萄酒的平均评分,作为该组对该种红葡萄酒的最终评分,分别用,表示第一组和第

9、二组对第种红葡萄酒的最终评分, 则 同样,记,分别表示第一组评酒员中第个评酒员,对第种白葡萄酒第个二级项指标的评分和第种白葡萄酒的总评分,分别表示第二组评酒员中第个评酒员,对第种白葡萄酒第个二级指标的评分和第种白葡萄酒的总评分,。则分别用,表示第一组和第二组对第种白葡萄酒的最终评分,。则 现以第1号红葡萄酒为例,分析两组评酒员评价结果的分布情况。20个评酒员对第1号酒的评分依次为70,79,91,68,97,82,69,80,81,76,68,71,80 ,52 ,53 ,76,71,73,70,67。以10分为间距,统计落入各个区间数据的个数,结果见表2.表2 评分结果分布统计区间50596

10、0697079808990100个数24842可以看出,20个评酒员对1号红葡萄酒的评分结果呈现出两头少中间多的分布。下面利用拟合检验法1检验评价结果是否服从正态分布(取显著性水平)。原假设:样本服从正态分布。计算参数及的极大似然估计值分别是,.计算出落入5个区间的频率依次为0.1,0.2,0.4,0.2,0.1.经过查卡方分布表,而,所以接受原假设,即20个评酒员对1号红葡萄酒样品的评分可视为服从正态分布。类似地,其他54种酒的评价结果经检验均服从正态分布。5.1.2 两组评价结果分析计算出两组评酒员对各种酒的评分情况,见图1.图1 两组最终评分均值通过图1总结出,两组评酒员对于55种酒的评

11、分走势大致相同,但对于红葡萄酒的评价,第一组的评分普遍高于第二组;对于白葡萄酒的评价,第一组的评分普遍低于第二组。针对第种酒,两组评酒员的评分标准可能不同,主观性较大。为检验两组评酒员的评价结果是否存在显著性差异,可进一步对两组评价结果进行检验1。以红葡萄酒为例,第一组的十个评酒员对第种红葡萄酒的评分构成样本,第二组的十个评酒员对第种酒的评分作为构成,。两个样本的容量为10,自由度为9。两样本的均值分别记作,标准差分别记作,则 两样本总自由度为18,合并的标准差, 进一步计算相应的,提出假设:两个样本差异不显著。备择假设:两个样本差异显著。通常显著水平,即置信概率为95%。经过查分布表知,自由

12、度为18时,。故当时,接受原假设,表明两组评酒员对第种红葡萄酒的评价结果差异不显著;故当时,拒绝原假设,表明两组评酒员对第种红葡萄酒的评价结果差异显著。经过上述计算,两组评酒员对27中红葡酒和28种白葡萄酒的评价差异结果如表3所示(其中,1表示两组评价结果不显著差异,0表示显著差异)。表3 各种酒的评价差异性红葡萄酒白葡萄酒酒类显著性酒类显著性酒类显著性酒类评分1015011150211602016031171311704018040180511905019160200602007021170210802208022091231902311002411002401102511112511212

13、60121260130270130271140140280两组评酒员对于55种酒的评价,总计有37种存在显著性差异,占总数的67.3%。其中红葡萄酒17种,占红葡萄酒总数的63.0%,白葡萄酒20种,占白葡萄酒总数的71.4%,差异性略高于红葡萄酒。因此,两组评酒员对于这些酒的评价普遍存在显著性差异,为了得到更为准确客观的评价结果,必须分别对各组评酒员的评价结果进一步分析,比较两组评价的可靠性。一个好的评价组在评价某种酒时,每一个成员应当本着客观性的评价原则对酒的各项指标进行评分,尽量避免主观影响。因此好的评价组对于同一种酒的评价结果通常更为均衡,不会出现高分和低分居多,而中等分数偏少的现象。

14、所以,组员评价结果的均衡度在很大程度上表征了该评价组评价结果的可信度,而表现均衡度大小的数据就是评价样本的方差,方差越大,均衡度越小,评价组的可信度越低,反之亦然。对于第种红葡萄酒,第一组的十个评酒员对第种红葡萄酒的评分构成样本,第二组的十个评酒员对第种酒的评分作为构成,。记两样本的方差为,则根据上式依次分别计算出,两组评酒员对27种红葡萄酒和28种白葡萄酒评价结果的方差,结果见图2.图2 两组组评酒员评价结果方差通过图2,可以看出,第一组评酒员对于各种酒评价结果的方差绝大部分大于第二组,这说明第一组评酒员在评价同一种酒时,组内成员的标准或认识差异较大,评价结果过于离散,均衡度较差,可信度也就

15、较低,因此可以断定,第二组评酒员的评价结果更可信。5.2酿酒葡萄分级模型欲对酿酒葡萄进行分级,首先应当确定适当的分级指标。然而对于题目要求的酿酒葡萄的理化指标和葡萄酒的质量这些指标中既可能存在指标间存在较强的相关性的情况,又可能存在一些指标与酿酒葡萄的分级关系微小。因此,有必要对所给指标进行分析。题目提供的酿酒葡萄的理化指标中的部分指标具有二级指标,为了更为细致准确的分析各指标与葡萄酒质量的关系,对于有二级指标的一级指标,只考虑其二级指标,将该一级指标去除。然后按照剩下指标的原始顺序进行顺序编号,共有55个葡萄理化指标,记作。将葡萄酒质量编号为56,即对于个指标,第种葡萄样品的值为5.2.1

16、由相关系数确定评估葡萄质量指标因为酿酒葡萄是用来酿葡萄酒的,因此,酿成葡萄酒的质量也就成为了判别酿酒葡萄的最重要指标。题目提供了酿酒葡萄的50多种指标,然而对于这些指标未必每项都对酿制的酒有影响,或者说产生的影响是可以忽略的。所以有必要对酿酒葡萄的理化指标与酿酒质量进行相似性度量,从而找出与酿酒质量相关程度较大的指标。下面通过计算相关系数衡量这些指标间的相似程度。指标与的样本相关系数为其中为酿酒葡萄的样品数目。计算得红葡萄理化指标与红葡萄酒质量相关系数见图3。图3 相关系数散点图从图中可以看出,只有部分指标与葡萄酒的质量的相关系数超过0.5,与葡萄酒质量具有较大的相似性。其中,还有些指标是与葡

17、萄酒的质量具有较大的负相关系数,也就是会抑制葡萄酒质量的提高,因此这样的指标也必须被作为评估酿酒葡萄的指标。下面对红葡萄以正负0.5、正负0.4为界,对白葡萄以正负0.4、正负0.3为界筛选指标,筛选情况见表4.表4 指标选取情况红葡萄白葡萄界线选取指标界线选取指标正指标:18,26,27,29,42负指标:55正指标:2,38,41,53负指标:46正指标:18,26,27,29,33,42负指标:55正指标:2,3,10,21,38,41,43,45,51,53,55负指标:46 经过筛选后的指标不仅与葡萄酒的质量有了较大的相关性,同时也大幅度降低了指标的数量,因而无需再对筛选后的指标间的

18、相似程度进行计算以去掉相似程度过高指标。如果指标数量较多,可以采用R型聚类分析对指标进行聚类从而去掉可归为一类的指标。5.2.2基于聚类分析法的酿酒葡萄分级模型聚类分析主要包括样本相似性度量,类与类间相似性度量两个步骤。(1)样本的相似性度量在对样本进行聚类分析时,首先要确定样本的相似性度量,常用的样本相似性度量有马氏距离、车比雪夫距离、欧式距离等,下面介绍最常用的欧式距离法。记是样本点集,距离是的一个函数,满足条件:这一距离的定义满足正定性、对称性和三角不等式。在聚类分析中,对于定量变量,最常用的是闵氏距离,即 当时则得到欧式距离。(2)类与类间的相似性度量如果有两个样本类和,则可以用最短距

19、离法、最长距离法、重心法、类平均法等方法度量它们之间的距离。下面介绍本文应用的类平均法。它等于中两样本点距离的平均,分别为中的样本点个数。下面根据由5.2.1节中筛选出的指标对酿酒葡萄样品进行聚类分析。首先对每个指标的数据进行标准化处理得到 其中,分别表示样品的数量和指标的数量。样本间相似性采用欧式距离度量,类间距离的计算选用类平均法。此外国际上和国内都是将葡萄酒按质量分为四个等级,其中,我国葡萄酒质量划分为优质特级葡萄酒、产区优质葡萄酒、产区优良葡萄酒以及佐餐酒四个级别8。故将酿酒葡萄分为对应的四个等级能够便于对酿酒葡萄的收购以及应用。得到葡萄样品分类结果为表5 分类结果图红葡萄白葡萄界线界

20、线界线界线第一类2,3,99第一类1528第二类2323第二类7,8,11,12,13,18,191,7,8,11,12,13,15,18第三类1,4,5,6,7,8,10,12,13,14,15,16,17,18,19,20,21,22,24,25,26, 271,2,3,4,5,6,7,8,10,12,13,14,15,16,17,18,19,20,21,22,24,25,26, 27第三类1,2,3,4,5,6,9,10,14,17,20,21,22,23,24, 25,26,27,282,4,5,6,9,10,14,17,20,21,23,24,25,26, 27, 28第四类1111

21、第四类1616界线降低并没有对分类结果产生较大的影响,但为了保证分类结果与酿酒质量的相关性,这里采用界线取得较高的两组分类结果。上面根据酿酒葡萄的理化指标和葡萄酒的质量对葡萄样品进行了划分,考虑到酿酒葡萄的用途是酿酒,因此葡萄酒的质量应作为衡量葡萄样品好坏的最重要指标。故以每类样品中各样品的评酒员得分平均值作为该类葡萄样品的分级指标。白葡萄分级方法同酿红葡萄酒分级方法,分级结果见表6。表6 酿酒葡萄分级结果红葡萄白葡萄级别样品评分级别样品评分第一级别2377.1第一级别1578.4第二级别2,3,975.6第二级别1,2,3,4,5,6,9,10,14,17,20,21,22,23,24, 2

22、5,26,27,2877.9第三级别1,4,5,6,7,8,10,12,13,14,15,16,17,18,19,20,21,22,24,25, 26, 2769.9第三级别7,8,11,12,13,18,1973.9第四级别1161.6第四级别1667.3对红葡萄分级后,显然第一级别对应了可以酿成优质葡萄酒的优质葡萄,第四级别对应了容易酿成质量较差的葡萄酒,而之间的两级则介于两者之间。再观察所分各级内部成员的评酒员评分,相差不大,说明分级情况比较准确。显然,以上的分级情况能够为市场上收购酿酒葡萄或者在对酿酒葡萄品种进行筛选时有所助益。5.3 对酿酒葡萄与葡萄酒的理化指标之间联系的探讨5.3.

23、1酿酒前后成分变化分析鉴于如PH值之类的指标是由葡萄中的其他化学物质决定的,故下面主要分析葡萄与葡萄酒中的化学物质变化。分析葡萄和葡萄酒的理化指标,可以发现葡萄被酿造成为葡萄酒后物质成分组成发生了变化,以红葡萄酒为例,其大概变化情况如表7所示。表7 酿酒葡萄与葡萄酒的主要理化成份葡萄成分葡萄酒有无葡萄成分葡萄酒有无花色苷有柠檬酸、黄酮醇无单宁有还原糖、总糖无总酚有固形物、百粒无酒总黄酮有果皮、干物质无反式白藜芦醇苷有各类氨基酸无顺式白藜芦醇苷有蛋白质、VC无反式白藜芦醇有酒石酸、苹果酸无顺式白藜芦醇苷有可滴定酸、果穗无表7表明,在酿造红葡萄酒前后,有些物质的含量减少了甚至完全消失了,如氨基酸和

24、糖类物质等。因此猜测,在酿酒过程中,某些物质成分经过一系列的理化反应转变成了其他物质。5.3.2 偏最小二乘回归分析法考虑到在分析酿酒葡萄理化指标与葡萄酒的理化指标之间联系时,理化指标的个数过多,并且各成分之间可能存在相互依赖的关系,比如各类氨基酸等,所以要想找出酿制前后成分的联系,可以采用偏最小二乘回归分析的方法,下面对该方法进行简要介绍。偏最小二乘回归分析法集中了主成分分析、典型相关分析和线性回归分析方法的特点,主要研究两组多重相关变量间的相互依赖关系,并可以研究用一组变量去预测另一组变量,特别是当两组变量的个数很多,且都存在多重相关性而观测数据的数量较少时,用该方法建立的具有传统的经典回

25、归分析等方法所没有的优点。对于个因变量与个自变量的建模问题,最小偏二乘回归的基本做法是首先在自变量集中提出第一成分(是的线性组合,且尽可能多地提取原自变量集中的变异信息);同时在因变量集中也提取第一成分,并要求与相关程度达到最大。然后建立因变量与的回归,如果回归方程已达到满意的精度,则算法终止。否则继续第二对成分的提取,直至能达到满意的精度为止。若最终对自变量集提取个成分,偏最小二乘回归将通过建立与的回归式,然后再将表示为原自变量的回归方程式,即偏最小二乘法回归方程式。5.3.3 理化指标之间联系的定量分析与计算现以酿制红葡萄酒为例,分析酿酒葡萄与葡萄酒的理化指标之间联系。这里对于一级、二级的

26、理化指标的处理与前面相同,考虑二级指标,去掉相应的一级指标。红葡萄的总计有55个理化指标,记为自变量,并按照附录中的先后顺序依次记作,红葡萄酒的理化指标共14个,记为因变量,并按照附录中的先后顺序依次记作,。27种红葡萄酒的理化指标的含量可看作自变量的27次观测值,将其记作数据矩阵,同样地,27种红葡萄的理化指标含量可看作因变量的27次观测值,将其记作数据矩阵。(1)数据标准化。将各指标值转换成标准化指标,有其中,。对应地,称为标准化指标变量。类似地,将转换成标准化指标,有 其中,对应地,称为标准化指标变量。(2)求相关系数矩阵。的正负表征了第个变量与第个变量的相关性,其值为正表示两变量成正相

27、关,值越大正相关性也就越大;其值为负表明两变量成负相关。(3)分别提取自变量组和因变量组的成分。假设提取个自变量成分和因变量成分,因此有 其中,称为成分线性组合系数。经过计算,前15对成分解释自变量的比率达到87.56%,解释因变量的比率达到94.74%,故只需取前15对成分即可,此时。 (4)求出15对成分时标准化指标变量与成分变量之间的回归方程。求得自变量组和因变量组与之间的回归方程为 其中,称作回归线性组合系数。 (5)求因变量组与自变量组之间的回归方程。把步骤3中成分带入步骤4中的回归方程,得到标准化指标变量间的回归方程将标准化变量,(,)分别还原成原始变量,得 为方便计,令,因此上式

28、可以表示为矩阵即为最终的回归系数矩阵。现在将系数矩阵按行拆分成14个子矩阵,即.每个子矩阵的维数均为1行55列,即,。进一步有 矩阵中第个元素的大小表征了第个自变量与第个因变量关联程度,即红葡萄中第个理化指标与葡萄酒中第理化指标的关联度,为正表示正相关,为负表示负相关,绝对值越大关联度也就越强。(6)模型的解释为更直观、迅速观察红葡萄55种理化指标对红葡萄酒14个理化指标的边际作用,将回归系数绘成图4所示。图4 回归系数图如果假定当某一自变量对一个因变量的回归系数的绝对值小于0.2时,认为该自变量与该因变量的关联度较小,那么通过图4可以发现,红葡萄中各理化指标对葡萄酒中第1、2、3、4、9、1

29、0、11、14号理化指标的相关系数均在0.2以内,说明红葡萄中理化指标对红葡萄酒的第1、2、3、4、9、10、11、14号理化指标的影响较为均衡,没有哪些理化指标对葡萄酒的理化指标起决定性作用。但是,对于葡萄酒中第5、6、7、8、12、13号理化指标,即反式白藜芦醇苷、顺式白藜芦醇苷、反式白藜芦醇、顺式白藜芦醇、色泽a*(D65)、H(D65)六种成分,红葡萄中的某些理化指标的回归系数超过了0.2,说明红葡萄中一些指标与红葡萄酒的某些理化指标存在较大的关联度。下面以顺式白藜芦醇苷为例进行研究,其回归系数图如图5所示。图5 顺式白藜芦醇苷的回归系数经统计,红葡萄的4、6、14、18、38、48号

30、理化指标即谷氨酸,甘氨酸,苯丙氨酸,蛋白质、总糖、果梗比对葡萄酒中顺式白藜芦醇苷的回归系数为-0.2306,0.3152,-0.2806,-0.2310,0.2903,0.2045,绝对值大于0.2,同时说明谷氨酸、苯丙氨酸、蛋白质对葡萄酒中顺式白藜芦醇苷成负相关,而甘氨酸,总糖、果梗比对葡萄酒中顺式白藜芦醇苷成正相关,意味着红葡萄中该三种成分的含量越高,葡萄酒中生成顺式白藜芦醇苷的含量就越高。最终,将红葡萄酒中各种理化指标与红葡萄理化指标之间的关联情况列于表8中。表8 红葡萄酒与红葡萄理化指标间的关系红葡萄酒中成分红葡萄关联较大理化指标红葡萄酒中成分红葡萄关联较大理化成分1理化指标关联度均较

31、小88、14、25、422理化指标关联度均较小9理化指标关联度均较小3理化指标关联度均较小10理化指标关联度均较小4理化指标关联度均较小11理化指标关联度均较小529、33123、24、4064、6、14、18、38、481312、19、40713、24、40、44、4614理化指标关联度均较小从上表中可以发现红葡萄理化指标与红葡萄酒的理化指标联系最大的是第40号理化指标葡萄糖。 (7)模型的检验为了考察14个回归方程()的模型精度,先以(,)为坐标值,对所有的样本点绘制预测图。是第个因变量在第个样本点的预测值。在这个预测图上,如果所有点都能在图的对角线附近均匀分布,则方程的拟合与原值差异很小

32、,这个方程的拟合效果就是令人满意的。红葡萄酒十四种理化成分的预测图如图6所示。图6 十四种理化成分的预测图通过图6可以发现,红葡萄酒中的十四种理化指标的预测值均较好的分布在对角线附近,因此十四个回归方程的拟合效果较为满意。应用上述方法,对白葡萄与白葡萄酒之间理化指标的关联情况进行分析计算,白葡萄酒的理化指标共有13个,白葡萄的理化指标的种类为55个。最终得到回归系数如图7所示。图7 回归系数分析图通过图7可以发现白葡萄的理化指标与白葡萄酒的1、2、3、8、9、10、11、12、13号理化指标的关联度较为均匀,没有那些物质起到决定性作用。但与4、5、6、7号理化指标的关联度较大,很多理化指标的回

33、归系数超过了0.2,说明这些理化指标对葡萄酒的4、5、6、7号理化指标的影响较大,最终将白葡萄酒中个理化指标与白葡萄理化指标之间的关联情况列于表9中。表9 白葡萄酒与白葡萄理化指标间的关系白葡萄酒中理化指标白葡萄关联较大理化指标白葡萄酒中理化指标白葡萄关联较大理化指标115、38815、19、24、322159493各成分关联度均较小104433114958、26、31、38、39123、3162、17、23、25、26、34、36、38134974、5、13、21、36、38、39通过表9发现白葡萄中38和39号理化指标,即总糖和还原糖对白葡萄酒中顺式白藜芦醇苷和顺式白藜芦醇以及反式白藜芦醇

34、的影响较大,这也符合糖类更易转化为醇类的实际情况。白葡萄酒13中理化指标的预测图如图8所示。图8 白葡萄酒13种理化指标的预测通过图8可以发现,白葡萄酒中的十三种理化指标的预测值均较好的分布在对角线附近,因此十三个回归方程的拟合效果较为满意。5.4 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响5.4.1 关键理化指标的筛选红葡萄和白葡萄均有55种二级理化指标,红葡萄酒有14种二级理化指标,白葡萄酒有13种二级理化指标,指标的数量较大。但是,根据5.2中聚类分析知,这些指标中很多存在较强的相关性,有的可以聚为一类。因此,在研究理化指标与葡萄酒质量的关系时,可以考虑筛选出一些关键指标进行分析,

35、这样一方面减少了指标的个数,简化了计算量,另一方面,在实际评价中,工作人员只需检测一部分理化指标即可,大大减少了工作量。筛选出的关键理化指标与相应葡萄酒的质量应当存在较大的关联度,下面以筛选红葡萄的关键二级理化指标为例。计算出红葡萄55个二级理化指标与红葡萄酒质量的相关系数,如图9所示。图9 红葡萄理化指标与红葡萄酒质量相关系数为使筛选出的指标数量适中并保证较高的相似性,以相关系数0.5为分界线,即把相关系数绝对值高于0.5的指标筛选出来作为关键指标,那么总共可以筛选出7个关键指标,分别为蛋白质,DPPH自由基,总酚,葡萄总黄酮,PH值,颜色a*,颜色C。类似于红葡萄理化指标的筛选方法,最终筛

36、选出红葡萄酒,白葡萄,白葡萄酒的关键指标见表10.表10 关键理化指标筛选结果编号红葡萄红葡萄酒白葡萄白葡萄酒关键指标1蛋白质酒总黄酮苏氨酸酒总黄酮2DPPH自由基反式白藜芦醇苷果糖顺式白藜芦醇苷3总酚DPPH半抑制体积PH值反式白藜芦醇4葡萄总黄酮百粒质量DPPH半抑制体积5PH值果皮颜色H色泽L6颜色a*色泽a*7颜色C色泽H 根据筛选的原则可以判断,上表罗列的理化指标对葡萄酒的质量影响比其他指标更显著。5.4.2关键指标与葡萄酒质量关系的探讨以红葡萄酒为例,由于第二组评酒员的评分结果更为可信,因此可以用该评分结果衡量这些葡萄酒的质量。第二组评酒员对第种红葡萄酒的最终评分为,对第种白葡萄酒

37、的评分为,。(1)分析计算红葡萄理化指标对红葡萄酒质量的影响应用上一节中筛选出来的理化指标,红葡萄共筛选出的7个关键理化指标:蛋白质,DPPH自由基,总酚,葡萄总黄酮,PH值,颜色a*,颜色C。将7个指标顺次记作。 将对27种红葡萄酒最终评分看作因变量的27次观测值,将27中红葡萄酒中7个指标的含量看做自变量的27次观测值。选取前20个数据用作拟合数据,将最后7个数据用作检验数据。根据4.3中的偏最小二乘回归分析法计算葡萄酒评分与七个关键指标的回归方程按照上述方法依次求出红葡萄酒3关键指标与红葡萄酒质量的回归模型,白葡萄5个关键指标与白葡萄酒质量的回归模型,白葡萄酒7个关键指标与红葡萄酒质量的

38、回归模型,各个模型中各关键指标的回归系数见表11.表11各关键指标的回归系数红葡萄红葡萄酒白葡萄白葡萄酒编号指标系数指标系数指标系数指标系数1蛋白质0.0136酒总黄酮0.1954苏氨酸0.0343酒总黄酮0.06732DPPH自由基-2.9733反式白藜芦醇苷1.3976果糖0.0237顺式白藜芦醇苷-7.17023总酚0.02DPPH半抑制体积7.2625PH值2.4451反式白藜芦醇-24.04194葡萄总黄酮0.249百粒质量0.0028DPPH半抑制体积7.56235PH值7.0069果皮颜色H-0.1388色泽L59.45646颜色a*-0.3102色泽a*-4.94127颜色C-

39、0.3466色泽H-0.1878分析上表中各个指标的回归系数,可以发现红葡萄中的7个关键指标中,回归系数绝对值最大的为第5个关键指标PH值,回归系数为7.007,说明PH值对红葡萄酒的质量影响最大,且成正相关;在红葡萄酒中的3个关键指标中,第3个关键指标DPPH半抑制体积,回归系数最大为7.2625,说明DPPH半抑制体积对红葡萄酒的质量影响程度较大;在白葡萄5个关键指标中,回归系数最大的为第3个关键指标总酚,回归系数为2.4451,与质量成正相关;在白葡萄酒的7个关键指标中,回归系数最大的为第5个关键指标色泽L,高达59.4564。用四个回归模型对未参加拟合的七个数据进行预测,各自预测的结果

40、分别见下表。表中相对误差的计算公式为表12 红葡萄理化指标对红葡萄酒质量预测检验结果样本点真实值72.271.677.171.568.272.071.5预测值70.970.673.171.268.471.067.6相对误差0.0180.0140.0510.0050.0030.0140.054表13 红葡萄酒理化指标对红葡萄酒质量预测检验结果样本点真实值72.271.677.171.568.272.071.5预测值75.170.786.872.668.867.670.5相对误差0.0390.0130.1250.0160.0100.0610.014表14 白葡萄理化指标对白葡萄酒质量预测检验结果样

41、本点真实值79.477.476.179.574.377079.6预测值76.275.9577.1880.976.9576.876.4相对误差0.0400.0190.0140.0180.0350.0020.040表15 白葡萄酒理化指标对白葡萄酒质量预测检验结果样本点真实值79.477.476.179.574.377079.6预测值69.873.379.571.267.778.371.8相对误差0.1210.0530.0440.1040.0880.01690.097通过分析预测误差知,四个回归模型的预测误差普遍在5%左右,预测精度较高,这表明了葡萄和葡萄酒的理化指标与相应葡萄酒的质量存在较大的关

42、系,也论证了葡萄和葡萄酒的理化指标的含量对葡萄酒的质量进行评价是可行的。5.4.3 芳香物质与葡萄酒质量关系的探讨 考虑到口感和香气两项指标的分数和为82,对葡萄酒的质量起到了决定性作用,而决定口感和香气的主要因素为芳香物质7,因此有必要针对芳香物质与葡萄酒的质量关系进行单独探讨,如果存在较好的量化关系,那么在实际评价一种酒时,只需对葡萄或葡萄酒中芳香物质进行测量即可,避免了对其他繁杂的理化指标的测量,可以大幅度减少工作量。题目提供数据总共给出了大概70多种芳香物质,所以可先进行定性分析,从70多中指标筛选出与葡萄酒质量关系较大的关键指标,然后利用类似5.4.2的研究方法,对芳香物质与葡萄酒质

43、量的关系进行定量分析。最终,筛选出的关键指标如17所示。表17 芳香物质关键指标的筛选结果编号红葡萄红葡萄酒白葡萄白葡萄酒关键理化指标1-蒎烯乙酸乙酯己酸乙酯乙酸乙酯2(Z)-3,7-二甲基-2,6-辛二烯醛柠檬烯1-辛稀-3-醇乙醇3(E)-2-壬烯-1-醇2-乙基-1-己醇乙酸庚酯4(R)-3,7-二甲基-6-辛烯醇辛酸丙酯香叶基乙醚5(E)-3,7-二甲基-2,6-辛二烯-1-醇3,7-二甲-1,6-辛二烯-3-醇辛酸丙酯6辛酸3-甲基丁酯5-甲基糠醛7十二酸乙酯二甘醇单乙醚8辛酸3-甲基丁酯9丁二酸二乙酯102-苯乙基乙酸酯11苯乙醇将红葡萄中关键的五个指标依次记作,红葡萄酒中的8个关键指标,白葡萄的2个关键指标依次记作,白葡萄酒中的11个关键指标依次记作。分别把红葡萄酒的前20个评分和白葡萄酒的前21个评分用来预测,将红葡萄酒和白葡萄酒的后7个评分和作为检验数据,利用最小偏二乘回归

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 建筑施工 > 建筑节能

版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如有侵权请立即联系:2622162128@qq.com ,我们立即下架或删除。

Copyright© 2022-2024 www.wodocx.com ,All Rights Reserved |陕ICP备19002583号-1 

陕公网安备 61072602000132号     违法和不良信息举报:0916-4228922