柯正友
(河南師范大學(xué),河南 新鄉(xiāng) 453007)
基于逐步回歸方法的釀酒葡萄對葡萄酒理化指標(biāo)的影響研究
柯正友
(河南師范大學(xué),河南 新鄉(xiāng) 453007)
釀酒葡萄的質(zhì)量在一定程度上可以影響葡萄酒的品質(zhì)。為了分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系,文章首先對兩者理化指標(biāo)數(shù)據(jù)進行標(biāo)準(zhǔn)化預(yù)處理,消除量綱的差異,運用相關(guān)系數(shù)的方法,針對每個指標(biāo)進行相關(guān)系數(shù)分析,得出其對于紅葡萄、花色苷、單寧、總酚、酒總黃酮、DPPH的線性相關(guān)性比較強,對于白葡萄、單寧、總酚、酒總黃酮的線性相關(guān)性比較強的結(jié)論。文章運用逐步回歸的方法進行分析,找出了釀酒葡萄的所有指標(biāo)對葡萄酒指標(biāo)的影響,從而確定兩者之間的聯(lián)系,可得出葡萄酒的理化指標(biāo)是受釀酒葡萄中的一個或多個理化指標(biāo)影響的。
相關(guān)系數(shù);線性相關(guān)性;逐步回歸
為了分析出釀酒葡萄和葡萄酒的理化指標(biāo)之間的聯(lián)系,分析實驗數(shù)據(jù),葡萄酒所含的理化指標(biāo)包含在釀酒葡萄的理化指標(biāo)中,所以只對它們共有的理化指標(biāo)進行分析,針對每一種釀酒葡萄和葡萄酒共有的理化指標(biāo)求出釀酒葡萄和葡萄酒的相關(guān)系數(shù)[1],然后分析兩者的相關(guān)性。最后運用逐步回歸[2]的方法,對每一種釀酒葡萄的理化指標(biāo)分析葡萄酒的理化指標(biāo)對其的影響。
相關(guān)系數(shù)時變量之間相關(guān)程度的指標(biāo),樣本相關(guān)系數(shù)用r表示,|r|值越大,變量之間的線性相關(guān)程度越高。相關(guān)系數(shù)的計算方法為:
本文只對一級指標(biāo)進行分析,對于某些指標(biāo)測試多次的情況,對多次測試的值取平均值作為此指標(biāo)的最后值,分析數(shù)據(jù)可知,葡萄酒所含的理化指標(biāo)包含在釀酒葡萄的理化指標(biāo)中,所以只對它們共有的理化指標(biāo)進行分析,總后確定紅葡萄的分析需要9項理化指標(biāo),白葡萄的分析需要8項理化指標(biāo)。
數(shù)據(jù)有不同的性質(zhì)和不同的量綱,為了處理問題的方便,需要對原始數(shù)據(jù)進行標(biāo)準(zhǔn)化處理。
分別對每一個理化指標(biāo)求出釀酒葡萄和葡萄酒的相關(guān)系數(shù),在這里使用MATLAB中的corrcoef函數(shù)求相關(guān)系數(shù),結(jié)果如表1所示。
由表中數(shù)據(jù)可知,對于紅葡萄、花色苷、單寧、總酚、酒總黃酮,DPPH的線性相關(guān)性比較強,對于白葡萄、單寧、總酚,酒總黃酮的線性相關(guān)性比較強。
逐步回歸分析,首先要建立因變量y與自變量x之間的總回歸方程,再對總的方程及每一個自變量進行假設(shè)檢驗,當(dāng)總的方程不顯著時,表明該多元回歸方程線性關(guān)系不成立;而當(dāng)某一個自變量對y影響不顯著時,應(yīng)該把它剔除,重新建立不包含該因子的多元回歸方程,篩選出有顯著影響的因子作為自變量,并建立“最優(yōu)”回歸方程。
MATLAB統(tǒng)計工具箱中提供了stepwise函數(shù),用來作交互式逐步回歸分析,尋找最優(yōu)回歸方程。下面調(diào)用stepwise函數(shù)分別對紅、白葡萄酒的每一個理化指標(biāo)與紅、白葡萄的所有理化指標(biāo)進行分析,可以得到多個逐步回歸交互式畫面(見圖1),結(jié)果如表2—3所示。
表1 各指標(biāo)相關(guān)系數(shù)
表2 紅葡萄酒指標(biāo)逐步回歸結(jié)果
表3 白葡萄酒指標(biāo)逐步回歸結(jié)果
圖1 逐步回歸交互式畫面
Stepwise Regression窗口,顯示回歸系數(shù)及其置信區(qū)間和其他一些統(tǒng)計量的信息。綠色表明在模型中的變量,紅色表明從模型中移去的變量。在這個窗口中有Export按鈕,點擊Export產(chǎn)生一個菜單,表明了要傳送給MATLAB工作區(qū)的參數(shù),它們給出了統(tǒng)計計算的一些結(jié)果。F為統(tǒng)計量,其值越大越接近真實值;intercept為所求的表達式的常數(shù)項;RMSE表示剩余標(biāo)準(zhǔn)差,表達式的系數(shù)用進入模型中的變量的coeff值表示。
如圖1所示x4,x24是在模型中的變量,其他的都從模型中移去; 在回歸過程中,RMSE的變化不大,只有x4,x24在模型中的時候F值最大。
[1]李宏彬,赫光中,果秋婷.基于皮爾遜相關(guān)系數(shù)的有機質(zhì)譜相似性檢索方法[J].化學(xué)分析計量,2015(3):33-37.
[2]王冬梅,沈頌東.逐步回歸分析法[J].工業(yè)技術(shù)經(jīng)濟,1997(3):57-60.
[3]肖華勇.大學(xué)生數(shù)學(xué)建模競賽指南[M].北京:電子工業(yè)出版社,2015.
Study on the in fl uence of wine grape on the physical and chemical indexes of wine based on stepwise regression method
Ke Zhengyou
(Henan Normal University, Xinxiang 453007, China)
The quality of wine grapes can affect the quality of wine to a certain extent. In order to analyze the relationship between wine grape and the physical and chemical indexes of wine, the article fi rst gave a standardized pretreatment to the physical and chemical index data of the two, and eliminated the dimensional differences, using the method of correlation coef fi cients, focuses on analysis of correlation coef fi cients for each index, the results showed that the linear correlation between red grape, anthocyanin, tannin, total phenolics, total fl avones and DPPH was strong, and the linear correlation between white grape, tannin, total phenolics and total fl avones of wine was relatively strong, and the linear correlation between total fl avonoids of white grape, tannin, total phenol and wine was stronger. This paper uses the method of stepwise regression to analyze, fi nding out the impact of all the indexes of wine grapes on wine indexes, so as to determine the link between the two, it can be concluded that the physical and chemical indexes of wine are in fl uenced by one or more physical and chemical indexes of wine grapes.
correlation coef fi cient; linear correlation; stepwise regression
河南師范大學(xué)2015年度國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目;項目編號:201510476058。
柯正友(1995— ),男,河南信陽,本科。