1、葡萄酒的评价摘要本文要解决的是葡萄酒的评价问题,我们利用数理统计的知识,包括显著性差异检验、主成分分析、聚类分析、典型相关分析、逐步线性回归分析等建立数学模型,分别求解。问题一,由题意知,要分析两组评酒员的评价结果有无显著性差异,需应用概率统计中的假设检验知识以及spss软件中关于两个总体均值的假设检验。检验结果表明,对于红葡萄酒,由于的值为,故拒绝原假设,认为两个红葡萄酒样本总体的均值不相等,同理,对白葡萄酒,的值为,认为两个白葡萄酒样本总体的均值不相等。因此,两组评酒员的评价结果有显著性差异。而至于哪一组结果更可信,我们先计算出第一组10位评酒员对每一个葡萄酒样品(红、白葡萄酒样品数总共5
2、5)品尝评分的标准差,再将得到的55个标准差数值求和作为第一组的总标准差;同样我们将第二组10位评酒员对每一葡萄酒样品品尝评分的标准差,并且也将得到的55个标准差数值求和作为第二组的总标准差。我们最后计算出第一组的总标准差为385.49,第二组的总标准差为261.82,小于第一组的总标准差,所以第二组结果更可信。问题二,查阅相关资料可知,糖、酸、单宁、芳香物质和色素五大指标是葡萄的主要构成物质,我们对附件2中的指标进行了简化和处理,统一选取了地位相同且具有代表性的一级指标作为分析指标;对附件3中的芳香物质,使用matlab软件,进行主成分分析,各浓缩成一个指标,其贡献率大于85%,具有统计意义
3、。然后,对以上得到的所有指标类1,加上问题一所求的一组更可信的平均值指标,我们对这些指标进行Q型聚类分析,把酿酒葡萄分成了四个等级。问题三,在分析酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响时,我们运用了spss软件,对红白葡萄和红白葡萄酒的理化指标类1分别进行R型聚类分析,并挑选出具有代表性的8组数据进行典型相关分析,计算出典型相关系数。使用Bartlett检验统计量,对典型相关系数作显著性检验,最后选出具有密切联系的代表性因素。问题四,我们将酿酒葡萄和葡萄酒的一级理化指标作为自变量,而葡萄酒质量作为因变量,使用逐步线性回归方法来分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响 。运用SPS
4、S软件建立回归模型,根据多元回归模型:求得白葡萄酒质量的预报方程:,再对回归方程进行显著性检验,并得到显著性水平为0.0001。 同理可求得红葡萄酒质量的预报方程:,对回归方程进行显著性检验,并得到显著性水平为0.001。最后,我们进行了回代检验,得到样本的平均相对误差分别为1.99%和2.55%,从而论证了能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:显著性差异检验 主成分分析 聚类分析 典型相关分析 逐步线性回归分析一、 问题重述葡萄酒质量是其外观、香气、口感等的综合表现。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后
5、求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。题中给出了某一年份一些葡萄酒的评价结果和该年份这些葡萄酒的和酿酒葡萄的成分数据。本文要建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析附件中的数据处理说明:1) 在附
6、件1第一组红葡萄酒品尝评分中,品酒员4号对样品20的色调评分数据出现了缺失,所以剔除这一列的数据。2) 在附件2第一组白葡萄酒品尝评分中,品酒员7号对样品3号的持久性评分数据出现了异常,所以剔除这一列的数据。3) 对于附件2和3中的没有数据的单元格,我们认为其值为0,所以将其全部赋值为0。1. 第一题的问题分析要分析两组评酒员的评价结果有无显著性差异,根据概率统计中两个总体均值的假设检验知识,若的值小于0.05,即拒绝原假设,认为两样本总体的均值不相等,若的值大于0.05,则接受原假设,认为两个样本总体的均值相等,由此即可判断,两组评酒员的评价机构是否显著性差异。要判断哪一组的结果更加可信,我
7、们需要通过分析其总的标准差来断定结果。所以,我们必须先求出每一组中55个样品所对应的标准差,然后将其标准差相加,得到我们最后要的总标准差。最后结果中总标准差较小的,即是稳定性较好,更加具有可靠性。2. 第二题的问题分析水和糖是葡萄的最主要成分,是发酵成葡萄酒的物质基础;葡萄中酸的含量,对葡萄酒的影响也很大;而单宁、色素和芳香物质在整个葡萄的物质构成中尽管所占比例非常小,但它们对葡萄的特色和风味有着非常显著的贡献;可以说葡萄中的糖、酸、单宁、芳香物质和色素是判断酿酒葡萄品质的指标性物质。因此,我们选取附件2中的一级理化指标,加上芳香物质,两者一起作为相对应的葡萄的理化指标,接着运用主成分分析和Q
8、型聚类分析的方法将葡萄酒的样品分成四个等级。 3. 第三题问题分析由于影响葡萄酒的主要理化指标包括:酒精度,总糖,浸出物,挥发性酸,单宁,总酚,色度,色调,PH值,并且这些成分主要蕴藏于葡萄的梗,皮,果肉,及籽中,因此,葡萄酒的理化指标中我们将用到的指标是附件2中葡萄酒的一级指标以及附件3中经过整合的芳香物质指标。想要分析酿酒葡萄与葡萄酒的理化指标之间的关系,我们得分别求红葡萄与红葡萄酒的理化指标之间的联系和白葡萄与白葡萄酒的理化指标之间的联系;因此,我们得通过R型聚类分析处理,对红白葡萄和红白葡萄酒分别选取代表性指标,通过对这些代表性指标的典型相关分析,反映酿酒葡萄和葡萄酒的理化指标之间的联
9、系,最后使用Bartlett检验统计量,对典型相关系数作显著性检验。4. 第四题问题分析要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,我们将酿酒葡萄与葡萄酒的理化指标合在一起作为新指标来分析此新指标对葡萄酒质量的影响。我们借助逐步线性回归方法,从方程中剔除无统计学作用的自变量,从而简化了计算,得到回归方程,最后进行回代检验。三、模型假设1) 我们是通过聘请一批评酒员进行品评,每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分来确定葡萄酒的质量。2) 假设每个评酒员品酒后对其分类指标打分是相互独立的,评酒员之间并未相互讨论。3) 假设给评酒员品评的葡萄酒是生产出来不久的,葡
10、萄酒并未超过保质期,不影响评酒员的品评。4) 假设葡萄酒的质量不受酿酒技术以及其他外在因素的影响,只考虑本题中所给因素的影响。5) 假设影响葡萄和葡萄酒的性质主要是附件中提到的一级指标,二级指标的影响几乎忽略不计。6) 假设葡萄的芳香物质和葡萄酒的芳香物质分别作为一级指标,各包含在葡萄和葡萄酒的理化指标中,论文中做出这种限定。四、 符号说明 :显著性检验中的概率值; :检验中的值; :预报方程的因变量; :预报方程的第个自变量; :预报方程项的系数;五、模型的建立与求解问题一附件1中两组评酒员评价结果的求解: 第一组中10位品酒员分别对每一份红葡萄酒样品品尝,评分的平均值作为这一红葡萄酒样品的
11、得分,第二组中10位品酒员分别对每一份红葡萄酒样品品尝,评分的平均值作为这一红葡萄酒样品的得分,得到每个样品最后得分对照表(表1)如下,其中我们让样品按序号升序排列。第一组红酒样品1酒样品2酒样品3酒样品4酒样品5酒样品6酒样品7酒样品8酒样品962.780.380.468.673.372.271.572.381.5第二组红酒样品1酒样品2酒样品3酒样品4酒样品5酒样品6酒样品7酒样品8酒样品968.17474.671.272.166.365.36678.2第一组红酒样品10酒样品11酒样品12酒样品13酒样品14酒样品15酒样品16酒样品17酒样品1874.270.153.974.67358
12、.774.979.359.9第二组红酒样品10酒样品11酒样品12酒样品13酒样品14酒样品15酒样品16酒样品17酒样品1868.861.668.368.872.665.769.974.565.4第一组红酒样品19酒样品20酒样品21酒样品22酒样品23酒样品24酒样品25酒样品26酒样品2778.679.777877.177.285.67869.273.873第二组红酒样品19酒样品20酒样品21酒样品22酒样品23酒样品24酒样品25酒样品26酒样品2772.675.872.271.677.171.568.27271.5表1同上,两组品酒员对白葡萄酒27个样品评分,得到每个样品最后得分对
13、照表(表2)如下,其中我们也让样品按序号升序排列。第一组白酒样品1酒样品2酒样品3酒样品4酒样品5酒样品6酒样品7酒样品8酒样品9酒样品108274.279.666779.47168.477.571.472.974.3第二组白酒样品1酒样品2酒样品3酒样品4酒样品5酒样品6酒样品7酒样品8酒样品9酒样品1077.975.875.676.981.575.574.272.380.479.8第一组白酒样品11酒样品12酒样品13酒样品14酒样品15酒样品16酒样品17酒样品18酒样品1972.363.365.97272.47478.873.172.2第二组白酒样品11酒样品12酒样品13酒样品14酒
14、样品15酒样品16酒样品17酒样品18酒样品1971.472.473.977.178.467.380.376.776.4第一组白酒样品20酒样品21酒样品22酒样品23酒样品24酒样品25酒样品26酒样品27酒样品2877.876.47175.973.377.181.364.881.3第二组白酒样品20酒样品21酒样品22酒样品23酒样品24酒样品25酒样品26酒样品27酒样品2876.679.279.477.476.179.574.37779.6表2基于表1和表2中的相关数字可以得到:图1由图1,可知和,即拒绝原假设,接受备择假设,即两组的均值不相等,所以两组品酒员的评价结果存在显著性差异。
15、通过excel中的数据处理,我们计算出两组品酒员对红白葡萄酒评分的总标准差如下表所示:红白总标准差第一组157.39228.10385.49第二组114.46147.36261.82表3由表3可知,第二组的总标准差小于第一组的总标准差,即第二组品酒员对葡萄酒样品的评分比较集中,而第一组的评分相对分散,所以,第二组品酒员的评价结果更可信。问题二首先 ,依据附件2和附件3的数据运用主成分分析和Q型聚类分析的方法来对酿酒葡萄的理化指标分别进行处理。用到的软件: Matlab软件。1. 红葡萄的理化指标处理:1) 主成分分析:红葡萄的芳香物质经主成分分析后,得到1个主成分,贡献率为 91.05%(如图
16、a),具有统计学上的意义;即主成分指标基本可以代表所有测定指标的成分指标,成为一个一级指标,同时也表明这些指标对红葡萄的(感官)质量有着重要的影响。2) 聚类分析:红葡萄的一级理化指标加上红葡萄的芳香物质,作为指标类1。然后根据对象的指标类1,性质相近的个体归为一类,使得同一类中个体具有高度的同质性,不同类之间的个体具有高度的异质性。结果如图下:图2由图2可知,我们将红葡萄样品分成了四类,如下:i. 5,24,17,20,26,4,27,25,13,19,10ii. 6,18,15,7,12,22iii. 11iv. 1,8,14,2,23,9,3,16,212. 白葡萄的理化指标处理:1)
17、主成分分析:白葡萄的芳香物质经主成分分析后,得到1个主成分,贡献率为93.03% (如图b),具有统计学上的意义;即主成分指标基本可以代表所有测定指标的成分指标,成为一个一级指标,同时也表明这些指标对白葡萄的(感官)质量有着重要的影响。2) 聚类分析:对样品进行聚类分类,结果如图下:图3基于图3,将白葡萄的样品分成了四类,分别为:i. 6,18,7,15,1,13ii. 8,11,16,17,22iii. 2,12,19,25,3,4,14,21,5,20,9,28,23,26,10,24,iv. 27 图a 图b问题三首先,对附件3中的数据进行处理,使空格处全部赋值为0 ,接着对红白葡萄和红
18、白葡萄酒的理化指标进行R型聚类,最后运用典型相关分析分析酿酒葡萄和葡萄酒的理化指标之间的联系。1. 红葡萄与红葡萄酒理化指标之间的联系:将红葡萄与红葡萄酒的理化指标分别进行R型聚类,通过SPSS软件得到如下结果:1) 红葡萄的理化指标处理,如图4,红线将红葡萄的理化指标进行R型聚类分成8个类,并挑选每个类中具有代表性的指标的数据来进行分析。图4基于图4,将红葡萄的样品分成了8类,分别为:i. 29,32,30,14,28,ii. 3iii. 16,18,22,17,1,20iv. 19,21,31v. 5,7vi. 11,13,10,4,12,2,33,26,vii. 15,25,8,9,6v
19、iii. 24,27,23所以选取了8个代表性指标:28,3,20,21,5,26,6,24,2) 红葡萄酒的理化指标处理,如图5。通过SPSS软件将红葡萄酒的理化指标进行R型聚类并选取8个具有代表性的数据。图5基于图5,将红葡萄酒的样品分成了8类,分别为:i. 8,11ii. 10iii. 3,6,2,4iv. 1v. 5vi. 9vii. 12viii. 7所以选取了8个代表性指标:7,12,9,5,1,10,6,82. 白葡萄与白葡萄酒的理化指标之间的联系: 将白葡萄与白葡萄酒的理化指标分别进行聚类,通过SPSS软件得到如下结果:1) 白葡萄的理化指标处理,如图下,红线将白葡萄的理化指标
20、进行R型聚类分成8个类,并挑选每个类中具有代表性的指标的数据来进行分析。图6基于图6,对白葡萄分成8类i. 28,30,10,20ii. 16,18,17,22,1,6iii. 2,9,15,31,12,13,11iv. 24,27,23,26v. 14,vi. 19,21,29,5,7vii. 25,33,3viii. 4,8,32所以选取了8个代表性指标:20,2,26,14,19,7,25,322) 白葡萄酒的理化指标处理,如图6。通过SPSS软件将白葡萄酒的理化指标进行R型聚类得到8个具有代表性的数据。图7基于图7,对白葡萄酒分成8类:i. 8,10ii. 9iii. 4iv. 11v
21、. 1,2,5vi. 3,vii. 6viii. 7所以选取了8个代表性指标:8,9,4,11,2,3,6,7根据典型相关系数选取几对典型变量如下:(一) 白葡萄和白葡萄理化指标之间的相关系数i. 然后使用Bartlett检验统计量,对典型相关系数作显著性检验,得到的结果:第一典型相关系数为0.879,第二典型相关系数为0.861,它们均比酿酒葡萄的理化指标与葡萄酒的理化指标两组间的任何一个相关系数大(其中最大相关系数为0.7574),即综合的典型相关效果要好于简单相关分析。 ii. 典型相关系数及显著性检验上面的输出结果表明:在的情况下,第一典型相关系数是显著的。iii. 典型变量的系数酿酒
22、葡萄的理化指标来自酿酒葡萄的理化指标的第一典型变量的计算公式:iv. 典型变量系数葡萄酒的理化指标来自葡萄酒的理化指标的第一典型变量的计算公式:对上述分析如下:在这一对典型变量中,在酿酒葡萄的理化指标中(出汁率)和(果梗比)的系数比较大,在葡萄酒理化指标中(DPPH半抑制体积)和(酒总黄酮)的系数较大,所以第一对典型变量可以解释为:酿酒葡萄的出汁率和果梗比与DPPH半抑制体积和酒总黄酮之间的联系。(二) 红葡萄和红葡萄理化指标之间的相关系数v. 然后使用Bartlett检验统计量,对典型相关系数作显著性检验,得到的结果:第一典型相关系数为0.915,第二典型相关系数为0.893,第三典型相关系
23、数为0.731,它们均比酿酒葡萄的理化指标与葡萄酒的理化指标两组间的任何一个相关系数大(其中最大相关系数为0.6926),即综合的典型相关效果要好于简单相关分析。 vi. 典型相关系数及显著性检验上面的输出结果表明:在的情况下,第一典型相关系数是显著的。vii. 典型变量的系数酿酒葡萄的理化指标来自酿酒葡萄的理化指标的第一典型变量的计算公式:viii. 典型变量系数葡萄酒的理化指标来自葡萄酒的理化指标的第一典型变量的计算公式:对上述分析如下:在这一对典型变量中,在酿酒葡萄的理化指标中(苹果酸)的系数比较大,在葡萄酒理化指标中(花色苷)和(色泽)的系数较大,所以第一对典型变量可以解释为:酿酒葡萄
24、的苹果酸和葡萄酒的花色苷和色泽的联系。问题四为了研究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,我们先将红葡萄的一级理化指标和红葡萄酒的一级指标组合成一个具有44个理化指标的数据,作为自变量;而第二组品酒员对红葡萄酒评价的平均评分作为因变量和上述数据合并成一个数据。然后在spss中打开,使用spss中的逐步线性回归分析,得到结果如图所示1. 研究红葡萄和红葡萄酒的理化指标对红葡萄酒质量的影响,结果如下表4、表5所示:表4(方差分析表)表4是逐步回归每一步的回归模型的方差分析表,F值为19.652,显著性概率是0.0001,表明回归极为显著。表5表5是逐步回归每一步的回归方程系数表。分析:建立
25、回归模型根据多元回归模型:从表5中看出,过程一共运行了五步,最后一步就是表中的第5步的计算结果,可知33个变量中只进入了5个变量把表5中“非标准化回归系数”栏目中的“B”列数据代人多元回归模型得到预报方程:预测值的标准差可用剩余标准差估计:回归方程的显著性检验:从表4中方差分析表第5模型中得知F统计量为19.652,系统自动检验的显著性水平为0.000(非常小)。F(0.0001,5,21)值为9.11。因此回归方程相关性非常显著。2.同样可研究白葡萄和白葡萄酒的理化指标对白葡萄酒质量的影响,结果如下表6、表7所示: 表6(方差分析表)表6是逐步回归每一步的回归模型的方差分析表,F值为6.93
26、6,显著性概率是0.001,表明回归也极为显著。表7表7是逐步回归每一步的回归方程系数表。分析:建立回归模型根据多元回归模型:从表7中看出,过程一共运行了五步,最后一步就是表中的第7步的计算结果,可知33个变量中只进入了5个变量把表7中“非标准化回归系数”栏目中的“B”列数据代人多元回归模型得到预报方程:预测值的标准差可用剩余标准差估计:回归方程的显著性检验:从表6中方差分析表第5模型中得知F统计量为6.936,系统自动检验的显著性水平为0.001(非常小)。F(0.001,5,22)值为6.19。因此回归方程相关性也非常显著。综上分析可知,两种情况下得到的回归方程相关性都很显著。最后,我们进
27、行了回代检验,得到样本的平均相对误差分别为1.99%和2.55%,从而很好的论证了能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。五、 模型的检验对问题2中酿酒葡萄建立的等级与葡萄酒的质量区分等级进行一一对应检查,发现葡萄质量的分类与葡萄酒的质量具有内在的关系。属于同一级别的酿酒葡萄酿出的酒很大程度上是属于同一级别的。对问题3得到的典型相关向量,我们进行Bartlett检验。首先,我们通过R型聚类分析处理,对红白葡萄和红白葡萄酒分别选取代表性指标;然后,通过对这些代表性指标的典型相关分析,反映酿酒葡萄和葡萄酒的理化指标之间的联系;最后使用Bartlett检验统计量,对典型相关系数作显著性检验。关
28、于问题4建立的模型,我们借助逐步线性回归方法,从方程中剔除无统计学作用的自变量,从而简化了计算,得到回归方程;最后进行回代检验,得到红白葡萄酒的质量平均相对误差各为2.55%和1.99%。六、 模型优缺点分析及讨论优点:该模型对求解葡萄酒以及其他酒的评价模型具有通用性,在分析葡萄和葡萄酒的理化指标以及葡萄酒的质量之间的关系时,能够充分利用理化指标进行客观分析,既定性又定量的概括了影响这些关系的主要指标因素,同时能充分利用指标因素并解释他们之间的内在规律联系。缺点:模型的假设条件不能完全满足,从而使得模型具有一定的局限性;由于检验的统计量很多,只能选择其一,无法进行统计量优良的比较;对于第四题当
29、中建立的逐步回归分析模型,由于使用了所有的样品数,只能进行回代检验,无法进行外延预测,存在一定的局限性;在主成分分析中,由于舍弃了一些贡献率小的变量因素,迫使模型的准确性下降。七、 结论经过对葡萄酒的评价问题的一系列分析,我们知道不同的品酒员对相同葡萄酒样品的评价结果存在着一定的差异,评价结果的可信度也不一定相同,我们要加以判断。在根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级时,我们发现酿酒葡萄的理化指标主要由,糖、酸、单宁、芳香物质和色素五大指标决定的,同时,酿酒葡萄的理化指标和葡萄酒的质量存在着密切的对应关系。白葡萄:酿酒葡萄的出汁率和果梗比与DPPH半抑制体积和酒总黄酮之间的联
30、系。红葡萄:酿酒葡萄的苹果酸和葡萄酒的花色苷和色泽的联系同时,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量具有重要影响,两者一定程度上呈多元线性回归关系。参考文献参考文献:1茆诗松,程依明,濮晓龙,概率统计与数理统计教程(第二版),出版地:高等教育出版社,20112东方人华,周皓,统计基础和SPSS11.0 (第一版),出版地:清华大学出版社,20053汪晓银,邹庭荣,数学软件与数学实验(第一版),出版地:科学教育出版社,20084汪晓银,周保平,数学建模与数学实验 (第一版),出版地:科学出版社5王宏建,全国大学生数学建模竞赛优秀论文汇编(第一版),20126李运,李记明,姜忠君,统计分析在葡萄酒
31、质量评价中的应用, 2012-9-77于贞,姜爱莉,主成分分析法研究酚类物质对葡萄酒品质的影响, 2012-9-78焦裕朋,多元统计分析课程设计能源消耗与经济增长之间的典型相关分析, 2012-9-89中华统计学习网,逐步回归分析, 2012-9-9 10百度知道,葡萄的营养成分, 2012-9-9附录典型相关分析的spss宏程序:INCLUDE file C:Program FilesSPSSEVALcanonical correlation.sps/. CANCORR SET1=X1 X2 X3 X4 X5 X6 X7 X8/SET2=X9 X10 X11 X12 X13 X14 X15
32、X16.Q型聚类分析的matlab程序:newX=zscore(X) %标准化数据D=pdist(newX) %计算距离矩阵squareform(D) %以矩阵形式显示Z=linkage(D,ward) %按类平均法进行系统聚类dendrogram(Z) %画谱系图T=cluster(Z,4);主成分分析的matlab程序:Cwstd.m用总和标准化法标准化矩阵Cwfac.m计算相关系数矩阵;计算特征值和特征向量;对主成分进行排序;计算各特征值贡献率;挑选主成分(累计贡献率大于85%),输出主成分个数;计算主成分载荷Cwscore.m计算各主成分得分、综合得分并排序Cwprint.m读入数据文
33、件;调用以上三个函数并输出结果3.源程序3.1 cwstd.m%cwstd.m,用总和标准化法标准化矩阵function std=cwstd(vector)cwsum=sum(vector,1); %对列求和a,b=size(vector); %矩阵大小,a为行数,b为列数for i=1:a for j=1:b std(i,j)= vector(i,j)/cwsum(j); endend3.2 cwfac.m%cwfac.mfunction result=cwfac(vector);fprintf(相关系数矩阵:n)std=CORRCOEF(vector) %计算相关系数矩阵fprintf(特
34、征向量(vec)及特征值(val):n)vec,val=eig(std) %求特征值(val)及特征向量(vec)newval=diag(val) ;y,i=sort(newval) ; %对特征根进行排序,y为排序结果,i为索引fprintf(特征根排序:n)for z=1:length(y) newy(z)=y(length(y)+1-z);endfprintf(%gn,newy)rate=y/sum(y);fprintf(n贡献率:n)newrate=newy/sum(newy)sumrate=0;newi=;for k=length(y):-1:1 sumrate=sumrate+ra
35、te(k); newi(length(y)+1-k)=i(k); if sumrate0.85 break; end end %记下累积贡献率大85%的特征值的序号放入newi中fprintf(主成分数:%gnn,length(newi);fprintf(主成分载荷:n)for p=1:length(newi) for q=1:length(y) result(q,p)=sqrt(newval(newi(p)*vec(q,newi(p); endend %计算载荷disp(result)3.3 cwscore.m%cwscore.m,计算得分function score=cwscore(vec
36、tor1,vector2);sco=vector1*vector2;csum=sum(sco,2);newcsum,i=sort(-1*csum);newi,j=sort(i);fprintf(计算得分:n)score=sco,csum,j %得分矩阵:sco为各主成分得分;csum为综合得分;j为排序结果 3.4 cwprint.m%cwprint.mfunction print=cwprint(filename,a,b); %filename为文本文件文件名,a为矩阵行数(样本数),b为矩阵列数(变量指标数)fid=fopen(filename,r)vector=fscanf(fid,%g,a b);fprintf(标准化结果如下:n)v1=cwstd(vector)result=cwfac(v1);cwscore(v1,result);- 22 -