葡萄酒的评价模型
摘要
近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增。特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平。如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。本文通过对感官评价分析,结合葡萄酒和酿酒葡萄的理化指标和芳香物质的大量数据,建立了客观可靠的葡萄酒质量综合评价模型。
针对问题一:本题需要检验两组品酒员的评价结果是否存在显著差异,并选出更可靠的一组。我们将各种葡萄酒的10个二级指标得分,相加得到每种酒的总分。在判断知每组品酒员的评价总分均服从正态分布后,用t检验分析两组品酒员对各葡萄酒评价的差异性,由此计算得到两组评价的显著性差异率为13.36%,即总体上两组品酒员的评价不存在显著差异。但由于两组品酒员的评价仍存在部分差异,我们比较两组品酒员对55种葡萄酒评价的方差,发现第二组评分的方差普遍小于第一组,所以第二组的评价结果更可信。
针对问题二:为了对酿酒葡萄进行分级,我们将葡萄的理化指标作为媒介。先根据国际指标制定适用于本题评分的分级标准,将葡萄酒进行分级,再根据理化指标经标准化之后的数值,利用欧氏距离对酿酒的55种酿酒葡萄进行Q型聚类分析。聚类得到红白葡萄各六个分类后,再把各类酿酒葡萄对应至
相应葡萄酒的等级,将酿酒红葡萄和酿酒白葡萄各分为五级。
针对问题三:由于各种酿酒葡萄的理化指标种类复杂,我们用主成分分析的方法,从酿酒红葡萄和酿酒白葡萄的27个有效指标中各提取出了8个和9个主要成分。考虑到酿酒葡萄经化学反应酿造成葡萄酒的过程中各项理化指标一般存在线性关系,我们建立多元线性回归模型,得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系。娇组词是
关键词:显著性检验;聚类分析;主成分分析;多元回归。
一、问题的重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄
酒的理化指标来评价葡萄酒的质量?
二、问题分析
1.问题一的分析:已知两组品酒员分别对27个红葡萄酒样品和28个白葡萄酒样品在10个
二级指标的评分,利用二级指标的评分之和得到每个品酒员对每种酒的总分,判断不同品酒员对同一葡萄酒的总分是否符合正态分布,若符合,则用t检验的双侧检验对两组品酒员各葡萄酒的评价是否存在显著性差异。由于两组品酒员对相同葡萄酒的评价可能存在显著差异,我们认为对同种酒的评价总分方差普遍小的一组更可信。
2.问题二的分析:酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,而葡萄酒和酿酒
葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知55种葡萄酒的质量评分和酿酒葡萄的理化指标,需要对酿酒葡萄进行分级。我们将葡萄的理化指标作为媒介,先根据国际指标将葡萄酒进行分级,再根据理化指标对酿酒的55种葡萄进行聚类,最后将各类酿酒葡萄对应至相应的等级。
对酿酒葡萄进行聚类前需要先进性各理化指标数据的标准化处理,再利用欧氏距离定义类与类之间和样品与样品之间的距离,最后逐步聚类。
3.问题三的分析:由于各种酿酒葡萄的理化指标种类复杂,我们先用主成分分析的方
法提取出能清晰反映所有有效指标的几个新指标。首先对酿酒红葡萄和酿酒白葡萄的27个有效指标中进行标准化处理,将标准化得到的矩阵导入SP SS,分别提取出累计贡献率恰好大于80%的前几个主成分。考虑到酿酒葡萄经化学反应酿造成葡萄酒的过程中各项理化指标一般存在线性关系,随后我们建立葡萄酒新指标关于酿酒葡萄的多元线性回归模型,得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系。
三、模型的假设
1.同种葡萄的各理化指标和质量均相同;
2.所有葡萄酒的酿造工艺和酿造环境相同;
3.酿造葡萄和葡萄酒中未测到的芳香物质含量为零。
四、符号说明符号
意义G (k )
ij 第j 个品酒员对第i 种酒的第k 个二级指标的评分G ij
第j 个品酒员对第i 种酒的总分G i
品酒员对第i 种葡萄酒评价总分的均数S 2i
品酒员对第i 种葡萄酒评价总分的方差X i
如何打方向盘
第i 个酿酒葡萄d ij
第i 个酿酒葡萄与第j 个酿酒葡萄之间的距离Y ij
第i 种葡
萄的第j 项指标y i 葡萄酒的第i 项理化指标
五、模型的建立与求解
5.1问题一:两组品酒员评价的差异分析模型
5.1.1数据的预处理1.
短下巴发型数据的观察:在附件一葡萄酒品尝评分表中有两组品酒员分别对每种葡萄酒的评分,每组均有10个品酒员,评分标准分为4个一级指标,一级指标下又分为10个二级指标,每个二级指标的分值如下表,各指标总分为100:图1:葡萄酒指标及分值
观察数据发现:
①第一组7号品酒员对白葡萄酒样品3的浓度评分77存在记录错误;
②第一组4号品酒员对红酒样品20的调评分缺失。
故用对应组其他品酒员的对应指标评分均值代替其评分。
2.总分的计算:G (k )ij 为第j 个品酒员对第i 种酒的第k 个二级指标的评分,将各个指标的得分相加得到第j 个品酒员对第i 种酒的总分
G ij =sum 10k =1G (k )ij (1)
得到红葡萄酒27×10的矩阵,
G =⎛⎜⎜⎝G 11···G 1j ...
......G i 1
···G ij ⎞⎟⎟⎠i =27,j =10
5.1.2差异分析模型的建立
1.Q −Q 图检验是否符合正态分布
正态分布是利用t检验两个独立样本是否有显著性差异的前提,我们利用Q−Q图检验总体是否服从正态分布,具体方法如下:
①将两组20个品酒员对同一样品的评价总分按开序排列使G1≤G2≤...≤G i≤...≤G20;
②再计算样本均数:
G=1
20
20
∑︁
i=1
G i(2)
标准差:
σ=√︃∑︀
(G i−G)2
20−1
(3)
分位数:
Q i=G i−G
σ
(4)
和正态分布表t i对应分位置Q′
i
,其中
t i=i−0.5
20
(5)
③由G i、Q i、Q′
i
画出Q−Q′图,与y=x比较,若Q−Q′图与之吻合,则总体服从正态分布,否则不服从。
2.两个独立样本的t检验
①假设H0:u1=u2;H1:u1=u2
②选用双侧检验,置信区间为95%;
③计算统计量:
t=
X1−X2
√︁
(n1−1)S2
1
+(n2−1)S2李维嘉吴昕>室内设计师排名
2
n1+n2−1
(1
n1
+1
n2
)
(6)
④查表得tα
2,若t≤tα
2
则p≥0.05,接受H0,拒绝H1两个独立样本不具有显著差异;若t>
2
,则p<0.05,拒绝H0,接受H1两个独立样本具有显著差异。
根据t检验结果是否小于0.05来判断两组品酒员对葡萄酒的评价是否存在差异。
5.1.2差异分析模型的求解
1.Q−Q图检验是否符合正态分布
我们分别画出27种红葡萄酒和28种白葡萄酒的Q−Q图。以20个品酒员对红葡萄酒样品1的评价总分的Q−Q图为例:
图2:红葡萄酒样品的正态Q−Q图
其Q−Q图各点均分布在直线附近,则认为红葡萄酒样品质量评分服从正态分布。
同理得到27种红葡萄酒和28种白葡萄酒的评分均服从正态分布。
2.两个独立样本的t检验
陈百强个人简介资料首先以两组品酒员对红葡萄酒样品1的评价为例:其F值检验结果为0.213,小于显著水平0.05,即两组品酒员对红葡萄酒样品1的评价总分方差相等,可知p=0.213>0.05,则两组品酒员对红葡萄酒样品1的评价不存在显著性差异。
同理对27种红葡萄酒和28种白葡萄酒进行t检验的分析。记两组品酒员对第i种葡萄酒的评价是否存在显著性差异为a i(i=1,2,...,55),其中27种红葡萄酒对应i=1,2,...,27,28种白葡萄酒对应i=28,29,...,55。当a i=1时,存在显著性差异;当a i=0时,不存在显著
性差异。则55种葡萄酒t检验的结果如下表: