葡萄酒质量评价模型的探究.docx_第1页
葡萄酒质量评价模型的探究.docx_第2页
葡萄酒质量评价模型的探究.docx_第3页
葡萄酒质量评价模型的探究.docx_第4页
葡萄酒质量评价模型的探究.docx_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

_葡萄酒质量评价模型的探究赵田阳(安徽师范大学数学计算机科学学院,安徽省芜湖市,241003)关键词:单因素方差分析;F检验;多元回归分析法;典型相关性分析;灰色相关度分析摘 要:葡萄酒的质量一般通过评酒员品尝后对其分类指标打分求得,不同组评酒员评价结果有所区别。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标也会在一定程度上反映葡萄酒和葡萄的质量。本文首先采用单因素方差分析法进行显著性差异检验和F检验,分析多组评价结果的可信度,获取最佳可信度的数据,在此基础上通过建立多元回归分析模型,对酿酒葡萄的等级进行划分;然后采用典型相关分析方法建立酿酒葡萄和葡萄酒理化指标间的数学模型,并分析二者间的联系;最后通过灰色系统关系分析法,分析酿酒葡萄及葡萄酒的理化指标对葡萄酒质量的影响。中图分类号:O29 文献标识码:A 文章编号:1001-2435 (2007) xx-xxxx-xxThe Exploration of Wine Quality Evaluation ModelZHAO Tian-yang(School of Mathematics and Computer Science Anhui Normal University , Wuhu Anhui, 241003, China)Key words: One-way ANOVA, F Test, multiple regression analysis, canonical correlation analysis, grey related degree analysisAbstract:Wine quality is generally measured by the scores of classifying index after judges tasted the wine. Different judges have different evaluation results. Wine quality has a direct relation with the wine grapes. Physical-chemical indexes of the wine and the wine grapes can reflect their quality to some extends. The paper firstly uses one-way ANOVA to detect its significant difference and analyze the reliability of different groups to obtain a group of data that is more reliable. On these basis, establishing the multiple regression analysis model to divide the wine grapes into different level. Then, using canonical correlation analysis to build a mathematical model that indicates the relation between wine grapes and wine. Finally, studying the affection of the physical-chemical indexes to the wine quality by grey related degree analysis.111 引言收稿日期:基金项目:项目(编号)作者简介: 赵田阳(1993年生),女,计算机科学与技术1.1 问题背景近年来,葡萄酒逐渐为广大老百姓所喜爱,喝葡萄酒、品葡萄酒也渐渐被认为是有品位的、高雅的象征。然而,真正懂得辨别葡萄酒的质量却不是件容易的事。一般来说,鉴定葡萄酒的质量是通过聘请一批资深的评酒员进行品评,每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。另外,葡萄酒的质量与原料即酿酒葡萄有直接的关系。再者,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。本文数据来源于2012年全国大学生数学建模竞赛A题。1.2 现有研究现状及本文贡献2006年的修订版葡萄酒国家标准中,主要提及了葡萄酒的分类方法以及检测标准,对于葡萄酒的品级也做了大致区分,但从实际的执行效果来看依然存在较多问题,对于葡萄酒级别的划分也偏主观,难以形成有效的实际指导作用。国外对葡萄酒质量评价的研究成果比较丰富,其中Cortez用支持向量机制建立了葡萄酒质量分类模型,分级效果较好;Moreno基于红酒的矿物质元素含量,用概率神经网络成功将54个样本分为两类1。国内对葡萄酒质量评价的研究多集中在统计学方法分析和专家的感官评价,文献5采用SPSS分析软件对40个样本进行了聚类分析,文献4采用置信区间法分析酒样间的客观差异。本文运用了单因素方差分析和F检验分析了评酒员评价结果的可信程度,运用多元回归分析建立了葡萄酒质量评价模型,划分葡萄酒的分类等级,最后还运用典型相关分析和灰色系统关系分析法,研究酿酒葡萄和葡萄酒理化指标间的联系,验证了葡萄酒评价模型的合理性,能够起到好的分类效果。1.3 符号说明表1 符号说明表Table1 Symbol Explanations符号解释符号解释H0原假设VBH1备择假设组间均方差2总体方差VW组内方差均值aij因子载荷S2样本方差FjX的公因子F检验统计量h2Xi的共同度显著性水平典型相关系数F(m,n)F分布矩阵特征根权重系数2 评价结果差异性及可行性分析2.1问题分析采用单因素方差分析法,对两组评酒员的评价结果进行显著性差异分析。利用F检验法求出第一、二小组对红、白葡萄酒评价结果的拒绝域和接受域,根据接受域的长度确定可信度较大的小组。2.2模型建立及求解结果2.2.1 显著性检验 (1)单因素方差分析的模型首先在单因素试验结果的基础上,求出总方差V、组内方差、组间方差。V= 其中,总方差衡量的是所有观测值对总均值的偏离程度,反映了抽样随机误差的大小,组内方差衡量的是所有观测值对组均值的偏离程度,而组间方差则衡量的是组均值对总均值的偏离程度,反映系统的误差。在此基础上,还可以得到组间均方差和组内均方差:在方差相等的假定下,要检验n个总体的均值是否相等,须首先给定原假设和备择假设。: =:均值不完全不相等则可以应用F统计量进行方差检验:F=该统计量服从分子自由度a-1,分母自由度为ab-a的F分布。给定显著性水平a,如果根据样本计算出的F统计量的值小于等于临界值,则说明原假设不成立,总体均值不完全相等,差异并非仅由随机因素引起3。对单因素方差分析的显著性检验可以通过分析Prob值(即P值)来判断。通过MATLAB方差分析函数分析数据得出两小组对27种红葡萄酒和白葡萄酒的方差分析表(如表2、表3所示)及箱型图(如图1、图2所示)。表2 第一组评酒员对红葡萄酒的评价结果方差分析表Table2 The Anova Table of Red Wine Evaluation Result of the First Team差异来源 SS df MS F ProbF3组间: 87.15 1 87.1474 2.5 0.12误差: 1813.2 52 34.8692 总和: 1900.35 53图1 第一组分析结果箱形图Fig1 Box-plot of the First Group表3 第二组评酒员对白葡萄酒的评价结果方差分析表Table3 The Anova Table of Red Wine Evaluation Result of the Second Team差异来源 SS df MS F ProbF3组间: 80.42 1 80.4224 4.49 0.039误差: 932.35 52 17.9298 总和: 17.9298 图2 第二组分析结果箱形图Fig2 Box-plot of the Second Group其中表5.3的P值为P(1)= 0.12,表5.3的P值为P(2)= 0.039,因为P(1)0.05,所以两小组评酒员对红葡萄酒的评价结果没有显著性差异;P(2) 22。构造检验统计量 F = S12S22 。 其中S12,S22分别为第一组和第二组评酒员对红葡萄酒评价结果的样本方差,。则FF(26,26) 取 = 0.05由附录1所示表格得出: S12 = 53.9141 ,S22 = 15.8244 F = 3.0470而 F0.05(26,26) = 1.94 ,则所得的拒绝域FF0.05(26,26) 即 F 1.94 ,故F 在拒绝域中,拒绝 HO。即得出结论1:第一组评和第二组评酒师对红葡萄酒的评价结果中第二组的结果可信度较高。同理对第二小组评酒员对红葡萄酒的评价结果进行F检验,得出结论2:第一组评和第二组评酒师对白葡萄酒的评价结果中第二组的结果可信度较高。综上所述:两组评酒师对葡萄酒的评价结果中第二组的结果可信度较高。3 酿酒葡萄分级研究3.1问题分析研究第二小组评酒师的评分,采用因子分析法将酿酒葡萄的理化指标归为较少类,并以此作为自变量,酿酒葡萄的综合评价为因变量,建立多元线性回归模型,借助Matlab软件求得多元回归方程,从而计算出评酒师对27种酿酒葡萄的综合评分,最后,设计分段标准来进行酿酒葡萄的最终等级划分。3.2模型建立及求解结果3.2.1 因子分析法的基本原理采用因子分析法从研究变量内部相关的依赖关系出发,将酿酒葡萄所有的理化指标进行分类,将相关性较高归在同一类,进而将众多的理化指标归为少数的几类。 1.模型原理(1)对变量作因子分析X1=X2=Xn=其矩阵表示为:X1X2Xn=F1F2Fn+12n即: X =AF+其中 X= A =() =称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,称为X的特殊因子。A =(),为因子载荷。数学上可以证明,因子载荷就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性3。2.相关概念解释(1)因子载荷称为因子载荷(实际上是权数)。因子载荷的统计意义:就是第i个变量与第j个公共因子的相关系数,即变量 Xi依赖于 Fj的份量(比重)。(2)变量共同度变量Xi的共同度因子载荷阵A中第i行元素的平方和,即:h2=j=1k2, 为了说明它的统计学意义,对下式两边同时求方差,即Xi=Var(Xi) =2Var(F1)+ +2Var(Fk)+ Var(i) =2+2+ +2+i2 =hi2+i2由于Xi 已经标准化了,所以有:hi2+i2=13.因子旋转 建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义。求出主因子解后,如果各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。 4.因子得分因子得分简单地说就是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。这时需要将公共因子用变量的线性组合来表示,也即由酿酒葡萄的各项理化指标值来估计它的因子得分。 5.求解过程根据上述原理和SPSS软件中的因子分析法得出理化指标旋转成分矩阵及红葡萄酒因子碎石图(如图3所示)分析,重新归类的结果如表4所示。图3 红葡萄因子碎石图Fig3 Factor Analysis Image of Red Grapes表4 酿酒红葡萄的理化指标归类Table4 The Classification of the Red Grapes Physical-chemical Indexes 种类理化指标第1类葡萄总黄酮、总酚、DPPH自由基、单宁、花色苷、出汁率、蛋白质第2类总糖、干物质含量、可溶性固形物、还原糖第3类苹果酸、多酚氧化酶活力、褐变度第4类果皮颜色a*、果皮颜色b*、白藜芦醇第5类果皮质量、果穗质量、百粒质量第6类可滴定酸、固酸比、PH值第7类酒石酸、柠檬酸第8类VC含量、黄酮醇5.2.2 多元线性回归分析以因子分析得到的8类理化指标 为自变量第二组评酒师对27种葡萄酒的评价结果为因变量。 Yi = j=18 jXij+ ,(i=1,2, 27) (1.1)其中,,为比重系数,是不可测的随机误差,且假定。根据上述8类酿酒葡萄理化指标数据和27种葡萄酒的质量的数据有如下方程组: (1.2)其中相互独立且都服从.式(1.2)又可表示成矩阵形式: (1.3)这里, ,为阶单位矩阵.为279阶矩阵称为资料矩阵或设计矩阵,并假设它是列满秩的,即由模型(1.2)以及多元正态分布的性质可知,仍服从27维正态分布,它的期望向量为,方差和协方差阵为,即然后再利用MATLAB软件和已知数据来进行多组试验,将的值尽量控制到最小,并得出相对稳定的权重系数: =令,其中,=, ,(i=1,2, 27,j=1,2, 8)得到了第二组评酒员对红葡萄酒质量的总评分,即:做如表5的等级划分:表5 红葡萄等级划分表Table5 The Table of the Grading of Red Grapes 百分制得分质量等级80以上17580270-75365-70460-65555-60655以下7于是对红葡萄酒而言这27种酿酒葡萄的等级如表6所示。表6 红葡萄等级归类表Table6 The Table of the Rank Classification of Red Grapes等级酿酒葡萄号1321、5、9、17、24、2632、12、23、2047、4、11、13、22、14、8、19、18、6、21527、15、16610、257无用同样的方法对第二组评酒师白葡萄酒的评价结果进行重新归类,碎石图如图4所示。 图4 白葡萄因子碎石图Fig4 Factor Analysis Image of White Grapes相应的得到相对稳定的权重系数: =得到第二组评酒员对红葡萄酒质量的总评分:根据的数值制定出相应的等级标准如表7所示。表7 白葡萄等级划分表Table7 The Table of the Grading of White Grapes百分制得分质量等级200以上1180-2002160-1803140-1604120-14050-1206100以下7于是对红葡萄酒而言这27种酿酒葡萄的等级如表8所示。表8 白葡萄等级归类表Table8 The Table of the Rank Classification of White Grapes等级酿酒葡萄号132无328424、556、15、20、25、26、2762、4、7、9、10、11、12、14、17、18、21、2371、8、13、16、19、4 酿酒葡萄与葡萄酒理化指标分析4.1问题分析先对酿酒葡萄的理化指标进行因子分析,得到精简的8类理化指标,将其和葡萄酒的9类理化指标进行典型相关分析,通过 SPSS软件得出它们的相关关系,进而可以推出酿酒葡萄和葡萄酒的理化指标之间的相关关系。4.2模型建立及求解结果4.2.1 典型相关分析的基本原理和模型首先,我们要在这两组变量即理化指标中找出一个线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取线性相关系数仅次于第一对线性相关系数且与之不相关的第二对线性组合,这样一被提取直进行下去,直到两组的变量的相关性完毕为止。所选的这些 线性组合对称为典型变量,其相关系数被称为典型相关系数(用于度量两组线性变量之间联系的强度)6。 设, ,分别表示题目中两组随机变量即酿酒葡萄和葡萄酒的理化指标,设有综合变量、,使得存在线性组合: 令 为确保变量的唯一性,假设,满足D=D=1,在此条件下若存在,使得和的相关系数达到最大,则称、是、的典型相关系数。同样的方法我们可以求出第二对、第三对典型相关变量,这些典型相关变量反映了、的典型相关情况。4.2.2典型相关分析的求解1.令X(1)X(2)T=X1(1)X2(1)X8(1)X1(2)X2(2)X8(2)TCov =8811891298219922= Cov ,= Cov ,= Cov , = 2.计算两个矩阵A和B 其中 为88矩阵,为99矩阵。可以证明3.计算矩阵、的非零特征根,为对应的的特征向量,为对应的的特征向量。则最大特征向量特征根对应的特征向量,即第一对典型相关系数,故有:令 以此类推可以得到其他对典型性相关系数。经过以上的分析,仅对红葡萄和红葡萄酒的理化指标用SPSS软件中典型相关性分析的得到典型性相关方程:V1=0.455x1-0.615x2+0.117x30.1151x4U1=0.059y1-0.481y2+0.648y3-0.787y4-0.171y5+0.756y6+1.025y7+0.5458y8+0.038y9 U2=-0.613y1-1.571y2+1.517y3+0.371y4-0.212y5-0.289y6-0.570y7+0.081-0.928y9 其中表示酿酒葡萄的理化指标,表示葡萄酒的理化指标。经过分析和数据输入可知对白葡萄及白葡萄酒进行相似的分析后,所得结论不变。5 理化指标对葡萄酒质量影响的分析5.1问题分析采用灰色系统关联度分析法,以葡萄酒的质量为母序列,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,再以所得结果为标准,论证用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的合理性。5.2模型建立及求解结果5.2.1 原理和方法灰色关联度分析一般包括下列计算和步骤:(1) 原始数据变换;(2) 计算关联系数;(3) 求关联度;(3) 排关联序;(4) 列关联矩阵。8设有m 个原始数据序列:n为各序列数据的个数,另有母序列:X01X02X0m计算关联系数公式:0i=min+(max)0ik+(max)其中0ik表示k时刻两比较序列的绝对差,即D0i (k)=x0 (k)-xi (k) (1 im);Dmax和Dmin分别表示所有比较序列各个时刻绝对差中的最大值与最小值。因比较序列相交,故一般取Dmin0;r为分辨系数,r(0, 1),一般情况下可取0.10.5。求关联度公式:riNk01=LkiN10=()不难理解,关联度与下列因素有关:1)母序列X0不同,则关联度不同;2)子序列Xi 不同,则关联度不同;3)参考点0 (或数据变换)不同,关联度不同;4)数据序列长度N不同,关联度不同;5)分辨系数r不同,关联度不同。95.2.2 模型求解以27组葡萄质量向量为母序列,将 27组红葡萄和红葡萄酒的理化指标以及28种白葡萄和白葡萄酒的理化指标数据,通过Matlab软件计算分别得到这四组数据与母序列的关联度向量,将各组所得关联度分量值按升序排列并以时间为横坐标绘制图形,通过观察曲线的同步变化程度来衡量红葡萄与红葡萄酒、白葡萄与白葡萄酒之间关联度。比较红葡萄与红葡萄酒的理化指标关联系数图像的走势发现,二者的发展趋势大致相同,成正相关;比较白葡萄与白葡萄酒的理化指标关联系数图像的走势发现,二者相走势相反,成负相关,因此对于红葡萄而言,葡萄和酒的理化指标对酒质量的影响相同,而白葡萄与之相反。图5 红葡萄关联系数Fig5 Correlative Coefficients of Red Grapes图6 红葡萄酒关联系数Fig6 Correlative Coefficients of Red Wine图7 白葡萄关联系数Fig7 Correlative Coefficients of White Grapes图8 白葡萄酒关联系数Fig8 Correlative Coefficients of White Wine再论证用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的合理性:由上述结论知,葡萄与酒的理化指标都能够与酒的质量建立关系,红葡萄及红葡萄酒的理化指标与酒的质量成正相关;由文献5分析知,白葡萄及白葡萄酒的理化指标与酒的质量成负相关,因此能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。6 模型评价6.1 单因素方差分析模型评价采用单因素方差分析方法分析两组评酒员评分之间的差异,避免了只比较平均值的误区,与Z检验、T检验相比又提高了效率。这种方法适合于所有的主观评价项目。然而,单因素方差分析法也存在局限性,这种局限性不是方法本身造成的,而是平均值这个概念造成的。当样本数据误差较大且数据不对称时,用平均值来衡量样本数据时不准确的,此时,可以用中位数、众数等代替。6.2多元回归分析模型评价回归分析法在分析多因素模型时简单而又方便,它能够解释变量之间出现多重共线性关系,通过标准的统计方法计算出每个因素的权重,清晰的计量各个因素之间的相关程度与拟合程度的高低,提高预测记过的准确性。然而,对于某些不确定的问题,因子存在多样性和不可测性,无法正确衡量各因素之间是否存在线性关系,此时运用多元回归分析模拟就会带来一定的误差。6.3 典型相关分析模型评价典型相关分析在实际中的应用很广,有助于综合地描述两组变量之间典型的相关关系,要求每一组数据都是连续变量并且服从正态

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论