張正勇, 李曉燁, 龍 宸, 姜逸雪, 沙 敏, 王海燕, 劉 軍*
(1.南京財(cái)經(jīng)大學(xué)管理科學(xué)與工程學(xué)院,江蘇南京 210023; 2.湖南大學(xué)化學(xué)生物傳感與計(jì)量學(xué)國家重點(diǎn)實(shí)驗(yàn)室,湖南長沙 410082; 3.浙江工商大學(xué)管理工程與電子商務(wù)學(xué)院,浙江杭州 310018)
葡萄酒是以葡萄為原料并經(jīng)過特定生產(chǎn)工藝釀造而成的一種果酒,其營養(yǎng)物質(zhì)含量豐富并具有多種保健功能,深受消費(fèi)者的喜愛。但在釀造過程中,由于葡萄種類、產(chǎn)地、栽培技術(shù)、發(fā)酵工藝、保存方法、環(huán)境條件等不同,葡萄酒產(chǎn)品表現(xiàn)出品牌差異及品質(zhì)差異。隨著人民生活水平的不斷提高,葡萄酒產(chǎn)品的生產(chǎn)量和銷售量逐年上升,出于經(jīng)濟(jì)利益的誘惑,加之近年來葡萄酒產(chǎn)品產(chǎn)地、品種和年份概念的濫用和炒作,假冒行為、偽劣產(chǎn)品時(shí)有發(fā)生,對(duì)于普通消費(fèi)者而言,限于經(jīng)驗(yàn)和鑒別技術(shù)的匱乏,常常難以做出準(zhǔn)確的判別[1 - 2]。目前,關(guān)于葡萄酒品質(zhì)鑒別控制方法,主要包括基于品酒專家的感官鑒別法和基于理化分析技術(shù)的特征物質(zhì)判別法。通過對(duì)葡萄酒的色澤、澄清程度、起泡程度、香氣、滋味以及典型性的感官檢驗(yàn),品酒專家借助其豐富的經(jīng)驗(yàn)和專業(yè)知識(shí)積累可以對(duì)葡萄酒質(zhì)量安全水平予以判別,是目前葡萄酒品質(zhì)分析的重要技術(shù)手段,也是葡萄酒新產(chǎn)品研發(fā)、質(zhì)量改進(jìn)的重要技術(shù)支撐,不過面臨的風(fēng)險(xiǎn)在于品酒專家的數(shù)量有限,難以滿足龐大市場(chǎng)的品控需求[3 - 5]?;诶砘治黾夹g(shù)的特征物質(zhì)判別法,是通過色譜、原子吸收光譜、紫外-可見光譜、滴定分析等理化分析手段,定量分析葡萄酒所含有的如總糖、揮發(fā)酸、鐵、銅、甲醇等特征物質(zhì),以特征物質(zhì)含量進(jìn)行葡萄酒品質(zhì)判斷。該方法可準(zhǔn)確定量特定物質(zhì)含量,可客觀評(píng)價(jià)葡萄酒產(chǎn)品質(zhì)量等級(jí),面臨的問題在于分析過程較為復(fù)雜,需要必要的前處理過程,耗時(shí)耗力,難以滿足葡萄酒品質(zhì)快速鑒別控制的市場(chǎng)需求[6 - 9]。
本研究針對(duì)上述需求與問題,發(fā)展了一種基于拉曼光譜并結(jié)合層次聚類分析的葡萄酒品質(zhì)控制快速檢測(cè)方法。以張?jiān)8杉t葡萄酒為例,系統(tǒng)分析考察了同品牌不同系列,以及不同品牌間品質(zhì)差異情況,并進(jìn)行了實(shí)驗(yàn)參數(shù)優(yōu)化,以利于模型的推廣。
張?jiān)8杉t葡萄酒、張?jiān)a劸茙煶嘞贾楦杉t葡萄酒、張?jiān)8杉t葡萄酒(佐餐級(jí))購于煙臺(tái)張?jiān)F咸丫漆劸乒煞萦邢薰?;王朝干紅葡萄酒購于天津王朝葡萄釀酒有限公司;長城干紅葡萄酒購于中糧酒業(yè)有限公司。
Prott-ezRaman-D3激光拉曼光譜儀(美國,恩威公司(Enwave Optronics))。儀器參數(shù)設(shè)置:激光波長785 nm,激光功率450 mW,積分時(shí)間為1~5 s,間隔步長為1 s,波數(shù)范圍250~2 339 cm-1,分辨率1 cm-1。數(shù)據(jù)分析運(yùn)算平臺(tái):MATLAB R2016a。
1.3.1層次聚類分析(1)距離度量方法:通過計(jì)算對(duì)象間距離的方法評(píng)估相似度,距離越大相似度越小。本文采用歐氏距離(基于matlab的euclid函數(shù))、標(biāo)準(zhǔn)歐氏距離(seuclid函數(shù))、曼哈頓距離(cityblock函數(shù))和余弦距離法(cosine函數(shù))。(2)創(chuàng)建聚類樹的方法:本文采用層次聚類分析,基本過程是首先將每個(gè)對(duì)象分作一個(gè)單獨(dú)的類,然后逐次地合并相似度高的對(duì)象或類,直到所有的對(duì)象都被分在同一類中,或者達(dá)到了終止條件則停止合并,得到最終的分類。基于層次的聚類算法將樣品聚類分析后繪成一棵聚類樹,簡單直接地展示了數(shù)據(jù)樣本間的關(guān)系以及各類的層次結(jié)構(gòu)。創(chuàng)建系統(tǒng)聚類樹時(shí)不僅需要衡量不同對(duì)象之間差異,還需要計(jì)算不同類之間的距離。本文采用并分析了最短距離法(基于matlab的single函數(shù))、最長距離法(complete函數(shù))、平均距離法(average函數(shù))、重心距離法(centroid函數(shù))和離差平方和法(ward函數(shù))。
1.3.2同表象型相關(guān)系數(shù)根據(jù)(1)距離度量方法,計(jì)算各類之間的距離以用于構(gòu)建聚類樹。層次聚類分析的同表象型相關(guān)系數(shù)定義為聚類樹中獲得的相似值的同型距離之間的線性相關(guān)系數(shù)。其計(jì)算公式為:
(1)
該系數(shù)是層次聚類對(duì)數(shù)據(jù)擬合程度的標(biāo)準(zhǔn)度量,可以用來評(píng)價(jià)聚類樹結(jié)果的準(zhǔn)確程度。采用不同的距離度量和聚類策略,將會(huì)產(chǎn)生不同的同表象型相關(guān)系數(shù),該值越接近1,則聚類分析效果越理想,據(jù)此來選擇最佳距離計(jì)算方式和聚類方法[10 - 11]。
1.3.3數(shù)據(jù)歸一化由于拉曼光譜數(shù)據(jù)各樣品間在不同波數(shù)上的信號(hào)強(qiáng)度差別較大,為統(tǒng)一量綱,也為方便樣本間距離的計(jì)算,在進(jìn)行層次聚類分析前對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理。本文采用的是Matlab的mapminmax歸一化函數(shù)。其基本原理如下:假定minA和maxA分別為觀測(cè)信號(hào)的最小值和最大值,則最小—最大歸一化通過計(jì)算:
(2)
將x的值映射到區(qū)間[new_minA,new_maxA]中的x′。
在本文中,將數(shù)據(jù)歸一化到[0,1]區(qū)間內(nèi),即new_minA=0,new_maxA=1。
拉曼光譜是表征分析待測(cè)物質(zhì)分子振動(dòng)、轉(zhuǎn)動(dòng)能級(jí)的重要手段,可用于分子特征結(jié)構(gòu)分析[12]。如圖1A所示是張?jiān)8杉t葡萄酒拉曼光譜圖,激光積分時(shí)間為1~5 s??梢钥闯?首先,隨著激光積分時(shí)間的增加,激光照射樣品的累積時(shí)間相應(yīng)增加,張?jiān)8杉t葡萄酒拉曼光譜信號(hào)表現(xiàn)出在1 s時(shí),出現(xiàn)1個(gè)熒光峰和2個(gè)弱拉曼譜峰,2 s時(shí)拉曼譜峰信號(hào)增加,熒光峰信號(hào)強(qiáng)度也增加,3 s及之后熒光峰信號(hào)強(qiáng)度進(jìn)一步增強(qiáng),超出了儀器的信號(hào)檢測(cè)上限并掩蓋了拉曼譜峰信號(hào)。熒光峰的出現(xiàn)原因在于葡萄酒成分中含有豐富的酚類、氨基酸等成分,其中富含熒光基團(tuán),在一定的激發(fā)光照射下可獲得熒光,最佳熒光激發(fā)波長約為240 nm[13],并且有研究表明熒光峰的強(qiáng)度與葡萄酒的品質(zhì)間存在一定的相關(guān)性[14]。本文使用的是785 nm的激光器,已經(jīng)遠(yuǎn)離紅酒的最佳熒光激發(fā)波長,但是拉曼信號(hào)本身較弱,故需使用功率約450 mW的激光,使得紅酒的熒光信號(hào)產(chǎn)生難以避免。拉曼光譜圖中出現(xiàn)的2個(gè)拉曼光譜峰,~885 cm-1可歸屬于C-C伸縮振動(dòng)峰,~1 005 cm-1可歸屬于環(huán)振動(dòng)峰(源自苯丙氨酸)[15 - 16]。實(shí)驗(yàn)進(jìn)一步觀察了張?jiān)8杉t葡萄酒6個(gè)樣品的拉曼光譜數(shù)據(jù),同品種樣品的拉曼光譜圖間表現(xiàn)出較高的相似性。在同樣的實(shí)驗(yàn)條件下,獲取了同品牌不同系列的張?jiān)a劸茙煶嘞贾楦杉t葡萄酒和張?jiān)8杉t葡萄酒(佐餐級(jí))的拉曼光譜數(shù)據(jù),結(jié)果顯示隨著激光積分時(shí)間的增加,張?jiān)a劸茙煶嘞贾楦杉t葡萄酒和張?jiān)8杉t葡萄酒(佐餐級(jí))的拉曼光譜也表現(xiàn)出熒光峰和拉曼峰強(qiáng)度增加的趨勢(shì),不過,在譜峰形狀、強(qiáng)度上,不同系列酒間存在不同。
圖1B、圖1C分別為王朝干紅葡萄酒,長城干紅葡萄酒的拉曼光譜圖,可以看出王朝干紅葡萄酒的拉曼光譜信號(hào)隨著激光積分時(shí)間的增加,表現(xiàn)出熒光峰和拉曼峰強(qiáng)度增加的趨勢(shì),且隨著激光積分時(shí)間的增加,拉曼譜峰表現(xiàn)出1~4 s信號(hào)愈發(fā)清晰的現(xiàn)象,而到5 s時(shí)由于熒光信號(hào)增加,減弱了拉曼峰信號(hào)的清晰趨勢(shì)。長城干紅葡萄酒的拉曼光譜信號(hào)隨著激光積分時(shí)間的增加,也表現(xiàn)出熒光峰和拉曼峰強(qiáng)度增加的趨勢(shì)。上述分析表明,激光積分時(shí)間的不同,針對(duì)不同樣品體系呈現(xiàn)出的拉曼譜峰信息存在差異,且這種差異與各自品牌紅酒樣品間存在一致性,因此,拉曼光譜信息可用以紅酒樣品的特征表征,但具體最佳積分時(shí)間有必要進(jìn)一步探討,以利于模型的實(shí)際推廣應(yīng)用。
圖1 張?jiān)8杉t葡萄酒(A)、長城干紅葡萄酒(B)和王朝干紅葡萄酒的拉曼光譜圖(C)Fig.1 Raman spectra of Zhang Yu dry red wine(A),Dynasty dry red wine(B) and Great Wall dry red wine(C)
實(shí)驗(yàn)進(jìn)一步采用層次聚類分析法定量研究了張?jiān)M放撇煌盗衅咸丫埔约安煌放破咸丫圃诓煌す夥e分時(shí)間條件下的分類判別情況。如表1所示,首先針對(duì)張?jiān)8杉t葡萄酒及其同品牌不同系列的張?jiān)a劸茙煶嘞贾楦杉t葡萄酒,張?jiān)8杉t葡萄酒(佐餐級(jí)),在激光積分時(shí)間4 s時(shí)的距離度量和聚類樹創(chuàng)建方法的同表象型相關(guān)系數(shù)值展開分析。該相關(guān)系數(shù)是層次聚類對(duì)數(shù)據(jù)擬合程度的標(biāo)準(zhǔn)度量,該值越接近1,則聚類分析效果越理想。表1結(jié)果顯示,歐式距離結(jié)合平均距離法,以及歐式距離結(jié)合重心距離法的同表象型相關(guān)系數(shù)值(即C值)可達(dá)0.9920,綜合考慮激光積分時(shí)間1~5 s情況,歐式距離結(jié)合平均距離法的聚類效果較其他方法要好。
表2所示,比較研究了歐式距離結(jié)合平均距離法在激光積分時(shí)間1~5 s條件下的聚類樹判別結(jié)果,顯示出在激光積分時(shí)間1~5 s時(shí),識(shí)別正確率達(dá)到94.44%,其中4 s和5 s的C值均超過0.99,分別達(dá)到0.9920和0.9932。激光積分時(shí)間4 s,使用歐式距離結(jié)合平均距離法可實(shí)現(xiàn)優(yōu)化的張?jiān)8杉t葡萄酒同品牌3個(gè)不同系列葡萄酒的判別,判別效果如圖2所示。可以看出,張?jiān)8杉t葡萄酒的6個(gè)不同樣品可有效聚類,說明本文方案適用于目標(biāo)對(duì)象張?jiān)8杉t葡萄酒的品質(zhì)控制鑒別使用,同時(shí),結(jié)果也發(fā)現(xiàn)張?jiān)a劸茙煶嘞贾楦杉t葡萄酒6個(gè)樣品中,其中編號(hào)為9的樣品性質(zhì)與張?jiān)8杉t葡萄酒(佐餐級(jí))有較大相似,原因可能在于此2個(gè)系列酒間的生產(chǎn)工藝、原料來源等較為相近有關(guān)。
表1 不同距離度量和聚類樹創(chuàng)建方法的同表象型相關(guān)系數(shù)
表2 歐氏距離結(jié)合平均距離法繪制聚類樹的判別結(jié)果
表3所示,比較研究了張?jiān)8杉t葡萄酒與王朝干紅葡萄酒,長城干紅葡萄酒,在歐式距離結(jié)合平均距離法在激光積分時(shí)間1~5 s條件下的聚類樹判別結(jié)果,顯示出在激光積分時(shí)間1~4 s時(shí),識(shí)別正確率可以達(dá)到100%,其中4 s時(shí)的C值達(dá)到0.9892,5 s時(shí)的C值達(dá)到0.9895,但是識(shí)別率出現(xiàn)了降低。據(jù)此,激光積分時(shí)間4 s,使用歐式距離結(jié)合平均距離法可實(shí)現(xiàn)優(yōu)化的判別,判別效果如圖3所示??梢钥闯觯瑥?jiān)8杉t葡萄酒的6個(gè)不同樣品可有效聚類,各品牌酒間也可有效區(qū)分。
表3 歐氏距離結(jié)合平均距離法繪制聚類樹的判別結(jié)果
圖2 張?jiān)8杉t葡萄酒(Ⅰ,編號(hào)為1-6)、張?jiān)a劸茙煶嘞贾楦杉t葡萄酒(Ⅱ,編號(hào)為7-12)、張?jiān)8杉t葡萄酒(佐餐級(jí))(Ⅲ,編號(hào)為13-18)的聚類樹圖Fig.2 The clustering tree of Zhang Yu dry red wine(Ⅰ,No.1-6),Zhang Yu Cabernet Sauvignon dry red wine(Ⅱ,No.7-12) and Zhang Yu dry red wine(table level)(Ⅲ,No.13-18)(Euclidean distance and average distance method,laser integration time 4 s)
圖3 張?jiān)8杉t葡萄酒(Ⅰ,編號(hào)為1-6)、王朝干紅葡萄酒(Ⅳ,編號(hào)為7-12)、長城干紅葡萄酒(Ⅴ,編號(hào)為13-18)的聚類樹圖Fig.3 The clustering tree of Zhang Yu dry red wine(Ⅰ,No.1-6), Dynasty dry red wine(Ⅳ,No.7-12) and Great Wall dry red wine(Ⅲ,No.13-18)(Euclidean distance and average distance method,laser integration time 4 s)
實(shí)驗(yàn)以張?jiān)8杉t葡萄酒為主要研究對(duì)象,綜合運(yùn)用儀器分析技術(shù)與模式識(shí)別技術(shù),獲取了樣品的拉曼光譜數(shù)據(jù),并運(yùn)用層次聚類分析法,研究了張?jiān)8杉t葡萄酒同品牌3個(gè)系列間,以及與王朝干紅葡萄酒、長城干紅葡萄酒不同品牌間的快速鑒別控制情況。結(jié)果顯示張?jiān)8杉t葡萄酒同批次間性質(zhì)相似度高,可有效聚類,優(yōu)化方案顯示激光積分時(shí)間4 s,使用歐式距離結(jié)合平均距離法可實(shí)現(xiàn)張?jiān)8杉t葡萄酒同品牌3個(gè)不同系列葡萄酒,以及不同品牌葡萄酒間的高效判別。實(shí)驗(yàn)結(jié)果有效的論證了新快檢方法的應(yīng)用潛力,并具有采樣速度快,無需樣品前處理,計(jì)算機(jī)處理簡單,智能化程度高等優(yōu)點(diǎn)。