您的当前位置:首页正文

葡萄酒问题

2021-09-15 来源:客趣旅游网
葡萄酒的评价

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

二、问题分析

1、 对于问题一,首先对附件一中的数据进行检查,剔除异常值;然后分别

将各个评酒员对每个样品酒各项指标的打分求和。然后对两组评酒员对酒的评价进行方差分析,便可得出两组评价结果有无显著性差异。然后对哪一组结果更可信的问题,我们对各组内的打分进行方差求解,并且认为打分方差较小的那组,结果比较稳定,所以更可信。

2、对于问题二,对酿酒葡萄进行分级。酿酒葡萄的好坏直接影响葡萄酒的好坏,也就是葡萄酒的好坏可以反应酿酒葡萄的好坏。根据观察,对附件二中酿酒葡萄的的部分成分求平均。利用回归分析找出酿酒葡萄的哪些指标对葡萄酒的质量有显著影响,然后根据这些筛选出来的指标,利用聚类分析,对这些酿酒葡萄进行聚类分级。

三、模型假设

1、假设制作葡萄酒的工艺是一样且稳定的;

2、假设酿造葡萄酒的环境是相同的,外界影响可以忽略;

3、假设评酒员的评酒造诣是在存在个体不同的情况下总体一致的,且所分配两组是随机的;

4、假设评酒员对每种葡萄酒的评价结果是大致符合正态分布的; 5、假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒;

6、假设只考虑红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,忽略去皮红葡萄可酿制白葡萄酒;

7、假设酿酒葡萄的成分与葡萄酒的质量间存在较高相关性,且此相关性可以一定程度上用来评判酿酒葡萄的质量;

8、假设影响酿酒葡萄质量的主要成分只是所有成分的几种,其他成分的影响可以忽略;

9、假设本文所引用的数据、资料均真实可靠。

四、问题求解

问题一

1、 对所给数据进行筛选整理后得出各个组对酒的评价,利用sas对两组评酒员的打分进行方差分析,可以得出有无显著性差异。

其中部分sas程序如下:

data jiu; input zu $ @;

do i=1 to 280 by 1; input defen @; output; end; cards; a 75

66 82 75 93 91 81 76 90 84

84 47 77 60 79 62 74 74 79 74 75 77 80 65 77 83 88 78 85 86 71 66 80 69 80 82 78 71 87 75 80 68 82 71 83 81 84 62 87 80 75 66 83 68 73 64 80 63 73 77 66 75 89 69 88 87 85 76 88 90 79 46 85 60 74 71 86 62 88 72 74 48 87 71 81 61 79 67 74 82 78 48 84 67 79 64 78 68 81 73 64 42 75 52 67 62 77 56 68 70 86 44 83 71 72 71 85 64 74 81 82 42 83 49 66 65 76 62 65 69 84 49 85 59 76 86 83 70 88 84 75 42 86 60 87 75 83 73 91 71 84 81 83 66 74 80 80 68 77 82 85 80 88 61 76 93 83 80 95 79 85 67 89 75 78 75 66 79 90 79 69 49 86 65 70 91 87 62 84 77 78 47 86 54 79 91 85 68 73 81 61 45 83 65 78 56 80 67 65 84 65 48 90 58 72 77 76 70 80 74 75 46 81 54 81 59 73 77 85 83 81 54 90 70 78 71 87 74 92 91 79 69 81 60 70 55 73 81 76 85 86 80 82 69 74 67 77 78 77 81 82 56 79 73 67 59 68 78 86 85 58 40 79 67 59 55 66 74 73 77 b 80

72 75 83 71 83 83 53 62 81

68 63 75 60 67 86 67 71 52 64 85 74 71 87 79 79 80 45 83 73 73 81 73 79 67 79 80 44 64 84 79 83 78 63 60 73 81 61 60 76 81 80 79 85 83 76 80 58 85 85 77 78 89 88 84 89 85 54 79 81 86 74 75 78 85 81 78 61 73 75 79 76 79 86 83 88 83 52 85 84

84 78 74 83 69 82 84 66 77 72 86 77 77 82 81 87 84 61 73 90 79 76 77 85 77 79 80 59 76 70 75 77 76 76 78 82 79 68 78 82 83 75 74 69 75 77 80 67 77 78 72 79 84 79 76 83 77 63 79 78 75 83 82 79 74 84 78 71 74 67 83 77 88 80 84 83 80 63 76 70 84 78 82 75 79 84 81 69 75 72 68 78 79 81 78 72 75 62 65 81 77 69 79 83 79 87 88 75 78 88 75 82 81 81 78 84 79 71 76 89 80 76 82 88 75 89 80 66 72 86 67 80 77 77 79 78 83 65 72 83 74 78 74 67 73 77 79 66 73 62 76 75 78 70 81 80 83 66 78 77 83 79 79 80 77 87 82 73 84 91 78 79 74 69 69 82 80 61 72 78 74 80 80 80 74 79 75 73 83 76 ;

proc print data=jiu; run; proc anova data=jiu; class zu; model defen=zu;

means zu / alpha=0.05 t bon duncan hovtest=bartlett; run;

运行上述程序即可得出结果: 其中部分输出结果如下表:

表1、红酒方差分析结果表: Sum of Mean F Source DF Squares Square Value Pr > F

Model 1 871.4741 871.4741 11.55 0.0007

Error 538 40587.61 75.44165 Corrected Total 539 41459.08 以红葡萄酒为例,得到P(Pr>F)=0.007,且小于0.05,所以两组评酒员对红葡萄酒的打分有显著性差异。

对于白葡萄酒的分析同上,得到P(Pr>F)=0.0023。故两组对白酒的分析也存在显著的差异。

2、第一问中要分析出哪个组的评判结果更可靠,我们的依据是两组评酒员对相同酒评价差异是否大,如果差异很大,说明此组评酒员对酒的评价不可靠,反之则可靠,因此此问题及转换成计算评酒员对酒评价的均方差,均方差越大越不可考,均方差越小越可靠。在此我们运用excel表格求出各组内的均方差,然后比较其大小。

以白酒为例,得到第一组打均分方差为 118.5,第二组打分均方差为56.0 所以第二组打分结果更可信。

表2 第一组对白酒的方差计算结果如下: 酒品种 每组方差 均方差 1 92.22222 2 201.0667 3 66.45556 4 44.71111 5 126.4444 6 162.7111 7 39.16667 8 183.6 9 92.76667 10 212.6778 11 177.1222 12 115.7889 13 170.7667 14 114.2222 15 131.6 16 178 17 144.1778 18 156.5444 19 46.4 20 64.4 21 172.7111 22 138.6667 23 43.65556 24 111.1222 25 33.87778 26 72.9 27 144.4 28 80.45556 118.5

表3 第二组对白酒的方差计算结果如下: 酒品种 每组方差 均方差 1 25.87778 2 49.06667 3 142.4889 4 42.1 5 26.27778 6 22.72222 7 42.17778 8 31.12222 9 106.2667 10 70.4 11 87.82222 12 140.0444 13 46.76667 14 15.87778 15 54.04444 16 82.23333 17 38.45556 18 30.23333 19 26.04444 20 50.04444 21 64.4 22 53.6 23 11.6 24 38.54444 25 106.5 26 102.9 27 35.55556 28 25.37778 56.01944

问题二

解决问题二时我们先利用回归分析找出葡萄的哪些指标影响到了酒的质量(即第二组人员对酒的评分),然后依据这些影响葡萄酒的葡萄的理化指标,利用sas软件的聚类分析过程对葡萄进行分类分级。在此我们以红葡萄酒为例,作如下的求解

1、 利用回归分析,找出酿酒葡萄的哪些指标对葡萄酒质量有显著性影

响,运行程序如下:

data zhibiao;

input x1-x37@@; cards;

77.9 1279.30 496.457 0.787 0.819 6.040 3.340 0.450

8.23

24.3

20.519 275.06

0.72

-1.88

51.344 179.703 175.04 186.849 892.2 4.14 . . . . . ;

proc print;run;

0.3267 5.336 2.947 2.557 0.155 0.3977 199.9 3.34

0.241 36.2

2.37

9.69

72.7

0.838 9.976 11.41 14.054

proc reg data=zhibiao;

model x1=x2-x37/ collin vif selection=stepwise slentry=0.10 slstay=0.10; run; quit;

得到结果如下:

表4 回归分析结果表

Parameter StandardError t Pr > Estimate Value |t| 49.81185 10.86851 4.58 0.001 6.24816 2.67113 2.34 0.0001 1.28288 0.32911 3.9 0.028 -0.01751 0.00479 -3.65 0.0007 Variance Inflation 0 1.33702 1.36356 1.05049 Variable DF Intercept 1 x20 1 x21 1 x24 1 得出的结果表明,酒的评分的高低与只与输入数据中的x20、x21及x24因素有关,因此我们将葡萄对应的这些因素提取出来,以这些因素为聚类的依据对葡萄进行聚类分级,并将其结果以图片的形式输出。

其运行程序如下:

data julei; input x1-x4; cards;

data julei; input x1-x4; cards; 1 3.34 2 3.72 3 3.82 4 3.67 5 3.67 6 3.64 7 3.19

8.23 4.67 3.82

275.06 95.94 213.22

6 110.99 7.2 112.78 7.81 7.42

296.71 234.9

8 3.8 4.25 9 3.7 4.07

285.06 138.23

10 3.59 11 3.93 12 3.83 13 3.58 14 3.39 15 3.67 16 3.23 17 3.67 19 3.88 20 3.48 22 3.99 23 3.71 24 3.72 26 3.83 27 3.66 28 3.59 ;

6.68 3.31 4.46 6.31 5.91 7.84 3.74 4.97 3.41 8.48 5.42 4.86

125.62 316.51 285.82 286.1 145.27 498.78 259.11 111.53 165.06 205.54 73.36 186.74

18 3.5 8.17 286.24

21 3.6 6.88 92.88

6.6 200.52

141.94

104.91 166.08

5.29 4.05

25 3.8 4.98

6 108.76

proc cluster data=julei method=ward std nonorm rsquare pseudo outtree=ocons; var x2-x4; id x1; run;

proc tree data=ocons horizontal ; run;

此程序的输出聚类过程图如下:

图1 红葡萄聚类过程图

由此聚类过程我们可以将红葡萄分为四类,分类结果如下: 表5 红葡萄分类结果表 一级 1、8、14、16、2、23、9 二级 3、17、22、6、18、15、21、24、12 4、7、5、13、19、20、27、10、25、三级 26 四级 11

同样对白葡萄做如上过程也会得到其聚类过程如下图所示:

图2 白葡萄聚类过程 由此聚类结果可以将白葡萄分为四类,其分类结果如下:

表6 白葡萄分类结果 一级 1、7、6、18、20、13、24、15 二级 16 三级 2、17、25、26、9、27、23、22、4、28、5、10、21、14 四级 3、19、8、12、11

上面过程中的其余程序文件夹(程序和结果)中

因篇幅问题不能全部显示,请点此查看更多更全内容