国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

葡萄酒的質量評價及影響因素分析

2014-09-02 09:44袁少州闞黎
科技視界 2014年12期
關鍵詞:主成分分析法

袁少州+闞黎

【摘 要】本文首先計算各評酒員在所有葡萄酒樣品打分與均值差的平方和來確定該評酒員的準確度,從而確定葡萄酒的分級。再利用主成分分析法、系統(tǒng)聚類分析法完成對釀酒葡萄的分級。最后用逐步回歸法建立模型,說明了可以用葡萄和葡萄酒的理化指標來評價葡萄酒的質量。

【關鍵詞】主成分分析法;系統(tǒng)聚類分析法;逐步回歸法

【Abstract】In order to evaluate the accuracy of the wine tasters, we first calculate the quadratic sum of difference between the mean score and the score given by that wine taster, then classify the grape wine. Using principal components analysis and systematical clustering method, we classify the grape. At last, we apply the stepwise regression method to build a model, indicating that the quality of the grape wine can be evaluated by the physical and chemical indexes of the grape and the wine.

【Key words】Principal components analysis;Systematical clustering method;Stepwise regression method

0 引言

葡萄酒的質量一般利用對評酒員對其各項指標的打分求和進行評價,而釀酒葡萄的好壞與葡萄酒的質量有很大的關系[1]。本文利用所給數據,采用多元統(tǒng)計分析的方法,完成了對釀酒葡萄的分級,并建立了釀酒葡萄與葡萄酒的理化指標的聯系模型和葡萄和葡萄酒的理化指標對葡萄酒質量的影響模型。

1 數據來源與模型假設

本文數據來源于2012年全國大學生數學建模競賽A題[2],根據所給數據,做出以下假設:(1)假設葡萄酒的生產加工流程相同且固定,即葡萄酒的質量只與葡萄有關;(2)假設評酒員均有一定資歷,打分情況可以反映葡萄酒質量的真實水平;(3)假設評酒員打分相互獨立,且各組評酒員的打分服從正態(tài)分布。

2 符號系統(tǒng)

N1——紅葡萄酒的樣品總數;N2——白葡萄酒的樣品總數;N——各組評酒員的人數;x1ij——第m組評酒員號i對紅葡萄酒樣品j的評分;ti——葡萄樣本n個一級理化指標中的第i個指標。

3 釀酒葡萄分級模型

3.1 數據處理

為了對葡萄進行分級,首先對各理化指標進行歸一化處理,再確定其所對應的葡萄酒的質量,而質量是由評酒員對其分類指標打分求和而確定的,故評酒員的打分直接關系到對葡萄酒的分級,由于存在個人喜好導致的偏差,通過計算各評酒員在所有葡萄酒樣品打分與均值差的平方和來確定該評酒員的準確度,結果見表1。本文選取平方和最小的前十位評酒員的評分作為分級的依據,分別為:第一組的評酒員1、5、10,以及第二組的評酒員1、2、3、4、5、7、9。

表1 評酒員的準確度測評表

3.2 釀酒葡萄理化指標的主成分分析模型

釀酒葡萄的理化指標在不同程度上反映了研究對象的某些信息,但不同理化指標之間會有一些相關性,而且由于變量過多,在某種程度上使問題的研究變得復雜,因此,本文用主成分分析法對所研究問題進行簡化處理[4]。

對于27個紅葡萄樣本的30個一級理化指標組成的向量依次設為t1,t2,…,tn,取它們的線性組合指標為F1,F2,…,Fs(s≤m),即

F1=z11t1+z12t2+…+z1ntn,F2=z21t1+z22t2+…+z2ntn, ……Fs=zs1t1+zs2t2+…+zsntn.(1)

式(1)中的Fi,Fj(i≠j,j=1,2,…,s)相互無關,且Fs是與F1,F2,…,Fs-1都不相關的t1,t2,…,tn的所有線性組合中方差最大者。Fs稱為t1,t2,…,tn的第s主成分。設t1,t2,…,tn各向量的數據為tij(i,j=1,2,…,n),計算出相關系數矩陣:R=(rij)n×n,求其特征值λi(i=1,2,…,n),并由大到小排序,并分別求出對應的單位特征向量ei=(ei1,ei2,…,ein)(i=1,2,…,n),繼而求出主成分Fi的貢獻率hi和累計貢獻率Hi,取累計貢獻率為85%~95%的s(s≤n)所對應的前s個主成分。計算主成分載荷zij=ρ(Fi,tj)=■(i=1,2,…,s;j=1,2,…,n),繼而的相互各主成分的得分矩陣Z=(zij)n×n,部分結果見表2。白葡萄樣品的理化指標的處理方法同上。通過累計貢獻率表知,紅葡萄樣品和白葡萄樣品的前三個主成分累計貢獻率已經超過95%,因此均取s=3;將得分矩陣中的各數據值帶入式(1),即可得到紅葡萄樣品和白葡萄樣品的主成分。

表2 紅葡萄樣品協方差矩陣特征值,特征貢獻率和累計貢獻率表(部分)

3.3 釀酒葡萄理化指標的聚類分析模型

對于上一節(jié)得到的兩種葡萄樣品的主成分,本文采用系統(tǒng)聚類法對其進行分類[3]。

假定類G中有m個元素,用列向量vi(i=1,2,…,m)表示,dij表示vi與vj的距離,定義類GK與類GL的距離DKL=min{dij∶vi∈GK;vj∈GL},如果類GK與類GL聚成一個新類GM,其與已有類GJ的距離DMJ=min{DKJ,DLJ},J≠K,L,重復進行兩個最近類的合并,直至所有的樣品合并為一類,最后形成一個親疏關系圖譜,從中得出分類數量及每一類包含的樣品。兩種葡萄酒的聚類圖如圖1和圖2所示。

猜你喜歡
主成分分析法
中國裝備制造業(yè)階段競爭力研究
陜西省各地區(qū)人力資本水平綜合評價與分析