葡萄酒的评价
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1. 1. 分析附件分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?哪一组结果更可信?
2. 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
二、问题分析
1 1、
、 对于问题一,首先对附件一中的数据进行检查,剔除异常值;然后分别将各个评酒员对每个样品酒各项指标的打分求和。然后对两组评酒员对酒的评价进行方差分析,便可得出两组评价结果有无显著性差异。便可得出两组评价结果有无显著性差异。然后对哪一组结果更可然后对哪一组结果更可信的问题,我们对各组内的打分进行方差求解,并且认为打分方差较小的那组,结果比较稳定,所以更可信。结果比较稳定,所以更可信。
2 2、、对于问题二,对于问题二,对酿酒葡萄进行分级。对酿酒葡萄进行分级。对酿酒葡萄进行分级。酿酒葡萄的好坏直接影响葡萄酒的好酿酒葡萄的好坏直接影响葡萄酒的好坏,坏,也就是葡萄酒的好坏可以反应酿酒葡萄的好坏。也就是葡萄酒的好坏可以反应酿酒葡萄的好坏。也就是葡萄酒的好坏可以反应酿酒葡萄的好坏。根据观察,根据观察,根据观察,对附件二中酿酒对附件二中酿酒葡萄的的部分成分求平均。利用回归分析出酿酒葡萄的哪些指标对葡萄酒的质量有显著影响,量有显著影响,然后根据这些筛选出来的指标,然后根据这些筛选出来的指标,然后根据这些筛选出来的指标,利用聚类分析,利用聚类分析,利用聚类分析,对这些酿酒葡萄对这些酿酒葡萄进行聚类分级。进行聚类分级。
三、模型假设
1、假设制作葡萄酒的工艺是一样且稳定的;
2、假设酿造葡萄酒的环境是相同的,外界影响可以忽略;
3、假设评酒员的评酒造诣是在存在个体不同的情况下总体一致的,且所分配两组是随机的;组是随机的;
4、假设评酒员对每种葡萄酒的评价结果是大致符合正态分布的;
5、假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒;
6、假设只考虑红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,忽略去皮红葡萄可酿制白葡萄酒;酿制白葡萄酒;
7、假设酿酒葡萄的成分与葡萄酒的质量间存在较高相关性,且此相关性可以一定程度上用来评判酿酒葡萄的质量;定程度上用来评判酿酒葡萄的质量;
8、假设影响酿酒葡萄质量的主要成分只是所有成分的几种,其他成分的影响可以忽略;以忽略;
9、假设本文所引用的数据、资料均真实可靠。
四、问题求解
问题一问题一
1、 对所给数据进行筛选整理后得出各个组对酒的评价,利用sas 对两组评酒员的打分进行方差分析,可以得出有无显著性差异。
程序如下:
其中部分sas程序如下:
data jiu;
input zu $ @;
; end
end;
; input
input defen @; output;
do i=1to280by1;
cards;
a 75 66 82 75 93 91 81 76 90 84
84 47 77 60 79 62 74 74 79 74
75 77 80 65 77 83 88 78 85 86
71 66 80 69 80 82 78 71 87 75
80 68 82 71 83 81 84 62 87 80
75 66 83 68 73 64 80 63 73 77
66 75 89 69 88 87 85 76 88 90
79 46 85 60 74 71 86 62 88 72
74 48 87 71 81 61 79 67 74 82
78 48 84 67 79 64 78 68 81 73
64 42 75 52 67 62 77 56 68 70
86 44 83 71 72 71 85 64 74 81
82 42 83 49 66 65 76 62 65 69
84 49 85 59 76 86 83 70 88 84
75 42 86 60 87 75 83 73 91 71
84 81 83 66 74 80 80 68 77 82
85 80 88 61 76 93 83 80 95 79
85 67 89 75 78 75 66 79 90 79
69 49 86 65 70 91 87 62 84 77
78 47 86 54 79 91 85 68 73 81
61 45 83 65 78 56 80 67 65 84
酿酒葡萄
65 48 90 58 72 77 76 70 80 74
75 46 81 54 81 59 73 77 85 83
81 54 90 70 78 71 87 74 92 91
79 69 81 60 70 55 73 81 76 85
86 80 82 69 74 67 77 78 77 81
82 56 79 73 67 59 68 78 86 85
58 40 79 67 59 55 66 74 73 77
b 80 72 75 83 71 83 83 53 62 81
68 63 75 60 67 86 67 71 52 64
85 74 71 87 79 79 80 45 83 73
73 81 73 79 67 79 80 44 64 84
79 83 78 63 60 73 81 61 60 76
81 80 79 85 83 76 80 58 85 85
77 78 89 88 84 89 85 54 79 81
86 74 75 78 85 81 78 61 73 75
79 76 79 86 83 88 83 52 85 84
84 78 74 83 69 82 84 66 77 72
86 77 77 82 81 87 84 61 73 90
79 76 77 85 77 79 80 59 76 70 75 77 76 76 78 82 79 68 78 82
83 75 74 69 75 77 80 67 77 78
72 79 84 79 76 83 77 63 79 78
75 83 82 79 74 84 78 71 74 67
83 77 88 80 84 83 80 63 76 70
84 78 82 75 79 84 81 69 75 72
68 78 79 81 78 72 75 62 65 81
77 69 79 83 79 87 88 75 78 88
75 82 81 81 78 84 79 71 76 89
80 76 82 88 75 89 80 66 72 86
67 80 77 77 79 78 83 65 72 83
74 78 74 67 73 77 79 66 73 62
76 75 78 70 81 80 83 66 78 77
83 79 79 80 77 87 82 73 84 91
78 79 74 69 69 82 80 61 72 78
74 80 80 80 74 79 75 73 83 76
;
proc print data =jiu; run ;
proc anova data =jiu;
class zu;
model defen=zu;
means zu / alpha =0.05 t bon duncan hovtest =bartlett;
run ;
运行上述程序即可得出结果:运行上述程序即可得出结果:
其中部分输出结果如下表:其中部分输出结果如下表:
表1、红酒方差分析结果表:、红酒方差分析结果表:
以红葡萄酒为例,得到P(Pr>F)=0.007,且小于0.05,所以两组评酒员对红葡萄酒的打分有显著性差异。酒的打分有显著性差异。
Source DF Sum of
Squares Mean Square F Value Pr > F Model 1 871.4741 871.4741 11.55 0.0007 Error 538 40587.61 75.44165 Corrected Total 539 41459.08
对于白葡萄酒的分析同上,得到P (Pr>F Pr>F))=0.0023=0.0023。故两组对白酒的分析。故两组对白酒的分析也存在显著的差异。也存在显著的差异。
2、第一问中要分析出哪个组的评判结果更可靠,第一问中要分析出哪个组的评判结果更可靠,我们的依据是两组评酒员我们的依据是两组评酒员对相同酒评价差异是否大,如果差异很大,说明此组评酒员对酒的评价不可靠,反之则可靠,因此此问题及转换成计算评酒员对酒评价的均方差,因此此问题及转换成计算评酒员对酒评价的均方差,均方差越大越均方差越大越不可考,不可考,均方差越小越可靠。均方差越小越可靠。均方差越小越可靠。在此我们运用在此我们运用excel 表格求出各组内的均方差,表格求出各组内的均方差,然然后比较其大小。后比较其大小。
以白酒为例,得到第一组打均分方差为以白酒为例,得到第一组打均分方差为 118.5 118.5 118.5,第
二组打分均方差为,第二组打分均方差为56.0 所以第二组打分结果更可信。所以第二组打分结果更可信。
表2 2 第一组对白酒的方差计算结果如下:第一组对白酒的方差计算结果如下:第一组对白酒的方差计算结果如下:
酒品种酒品种 每组方差每组方差 均方差均方差
1 92.22222
118.5 2 201.0667
3 66.45556
4 44.71111
5
126.4444 6
162.7111 7
39.16667 8
183.6 9
92.76667 10
212.6778 11
177.1222 12 115.7889 13
170.7667 14
114.2222 15
131.6 16
178 17
144.1778 18
156.5444 19
46.4 20
64.4 21
172.7111 22
138.6667 23
43.65556 24
111.1222 25
33.87778 26
72.9 27
144.4 28
80.45556
表3 3 第二组对白酒的方差计算结果如下:第二组对白酒的方差计算结果如下:第二组对白酒的方差计算结果如下:
酒品种酒品种 每组方差每组方差 均方差均方差
1 25.87778 56.01944 2
49.06667 3
142.4889 4
42.1 5
26.27778 6
22.72222 7
42.17778 8
31.12222 9
106.2667 10
70.4 11
87.82222 12
140.0444 13
46.76667 14
15.87778 15
54.04444 16
82.23333 17
38.45556 18
30.23333 19
26.04444 20
50.04444 21
64.4 22
53.6 23
11.6 24
38.54444 25
106.5 26
102.9 27
35.55556 28
25.37778
问题二问题二
解决问题二时我们先利用回归分析出葡萄的哪些指标影响到了酒的质量(即第二组人员对酒的评分即第二组人员对酒的评分)),然后依据这些影响葡萄酒的葡萄的理化指标,利用sas 软件的聚类分析过程对葡萄进行分类分级。在此我们以红葡萄酒为例,作如下的求解下的求解
1、 利用回归分析,出酿酒葡萄的哪些指标对葡萄酒质量有显著性影
响,运行程序如下:响,运行程序如下:
data zhibiao;
input x1-x37@@;
cards ;
发布评论