王化
摘 要:為了彌補(bǔ)傳統(tǒng)茶葉審評(píng)方法的不足,該文提出了一種基于高光譜技術(shù)的方法來(lái)識(shí)別茶葉品種。該方法能充分利用茶葉的內(nèi)部成分和外觀特征來(lái)綜合識(shí)別茶葉品種。采集茶葉的高光譜數(shù)據(jù),提取其顏色特征、紋理特征、光譜特征,結(jié)合支持向量機(jī)方法建立識(shí)別模型。結(jié)果表明,品種識(shí)別準(zhǔn)確率最高可達(dá)100%,驗(yàn)證了高光譜技術(shù)的優(yōu)越性。
關(guān)鍵詞:高光譜 特征提取 茶葉 品種識(shí)別
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2017)03(c)-0101-02
目前茶葉的假冒現(xiàn)象時(shí)常發(fā)生,茶葉市場(chǎng)混亂,對(duì)茶葉貿(mào)易造成了不良影響,嚴(yán)重?fù)p害了消費(fèi)者利益。如何快速、準(zhǔn)確地辨別茶葉真假已經(jīng)成為消費(fèi)者和生產(chǎn)者的迫切需要。
傳統(tǒng)的茶葉檢測(cè)方法主要是人為的感官審評(píng)和理化檢測(cè),這些方法主觀性強(qiáng)、影響因素多,缺點(diǎn)較多。對(duì)此,電子鼻、電子舌、機(jī)器視覺(jué)技術(shù)、光譜技術(shù)等無(wú)損檢測(cè)技術(shù)被應(yīng)用,人們根據(jù)茶葉內(nèi)部成分或者外部品質(zhì)來(lái)識(shí)別茶葉。但是以上方法不能對(duì)茶葉內(nèi)外品質(zhì)綜合判斷,容易失去部分信息,影響識(shí)別結(jié)果。近年來(lái),高光譜成像技術(shù)研究成為熱點(diǎn)。它把二維成像技術(shù)和光譜技術(shù)結(jié)合,同時(shí)獲取待測(cè)物質(zhì)的內(nèi)外信息,客觀快速地分析待測(cè)物質(zhì)。該文以龍井茶葉為研究對(duì)象,利用高光譜數(shù)據(jù)提取其顏色、紋理、光譜特征,結(jié)合支持向量機(jī)方法(SVM),建立基于光譜特征、圖像特征和二者融合的龍井茶葉品種識(shí)別模型,分析對(duì)比模型效果,確立基于高光譜技術(shù)的龍井茶葉品種識(shí)別的最優(yōu)模型[1]。
1 材料與方法
1.1 實(shí)驗(yàn)數(shù)據(jù)采集
材料選用浙江省杭州市汾口鎮(zhèn)的中茶108、龍井43號(hào)以及鳩坑群體種3種龍井鮮葉,采集后于當(dāng)天送往實(shí)驗(yàn)室。實(shí)驗(yàn)的高光譜數(shù)據(jù)采集系統(tǒng)主要包含SOC710VP高光譜成像光譜儀、2個(gè)250 W的Pro-light室內(nèi)高光譜照明、計(jì)算機(jī)等。其中SOC710VP高光譜成像光譜儀內(nèi)置掃描裝置、CCD和光譜儀,波長(zhǎng)范圍400~1 000 nm、光譜分辨率4.68 nm。
實(shí)驗(yàn)在暗室中進(jìn)行,稱取20 g茶葉作為一個(gè)樣本,均勻地平鋪在黑色培養(yǎng)皿中。為保證高光譜圖像清晰,采樣前反復(fù)調(diào)節(jié),每種茶葉樣本采集200組,共得到600組大小為520×696×128的高光譜數(shù)據(jù)。
1.2 特征提取與建模
高光譜數(shù)據(jù)是一個(gè)三維數(shù)據(jù)塊,同時(shí)包含了樣本的圖像信息和光譜信息,涵蓋茶葉樣本的內(nèi)外信息。但是,高光譜數(shù)據(jù)量過(guò)大以及波段之間相關(guān)性強(qiáng),三維數(shù)據(jù)塊之間存在大量的冗余信息,因此,高光譜數(shù)據(jù)的降維對(duì)于提高識(shí)別模型的識(shí)別速率和準(zhǔn)確率是非常有效的。主成分分析(PCA)是目前應(yīng)用最廣泛的降維方法之一。經(jīng)過(guò)PCA變換的高光譜數(shù)據(jù)只需少量的主成分就可以盡可能多地表征原始信息[2]。
在數(shù)字圖像處理中,物體的顏色、形狀和紋理是最常用的3種自然屬性,可以用來(lái)描述茶葉的外觀品質(zhì),不同品種茶葉甚至同一品種的不同等級(jí)茶葉的這些屬性都有差別。單片茶葉的形狀隨機(jī)性太大,因此,該文選擇顏色特征和紋理特征作為識(shí)別特征。顏色特征是茶葉品種識(shí)別的重要影響因子。為了定量描述并全面評(píng)價(jià)茶葉顏色,結(jié)合最常用的RGB模型和HSI模型提取紅色R、綠色G、藍(lán)色B、色調(diào)H、飽和度S、亮度I作為顏色特征。茶葉的紋理屬于自然紋理,一般采用統(tǒng)計(jì)分析方法。該文通過(guò)灰度共生矩陣(GLCM)方法提取對(duì)比度、相關(guān)性、能量、同質(zhì)性、熵共5個(gè)紋理特征[3]。
植被的內(nèi)部結(jié)構(gòu)特征和化學(xué)特性對(duì)不同波長(zhǎng)的光譜有不同的光譜響應(yīng)。植被光譜具有一些反射特性明顯的獨(dú)特譜帶,這些特征譜帶包含的信息量較大、代表性強(qiáng)、能反映不同物種之間的差異。該文應(yīng)用特征光譜位置參數(shù)(“三邊”位置)結(jié)合植被指數(shù)(比值植被指數(shù)、差值植被指數(shù)和歸一化差值植被指數(shù))作為光譜特征來(lái)識(shí)別龍井茶葉品種[4]。
2 結(jié)果分析
截取高光譜數(shù)據(jù)100×100×128大小的感興趣區(qū)域(ROI)作為PCA,3種茶葉的前兩幅主成分圖像的累計(jì)貢獻(xiàn)率均有90%以上,代表每個(gè)樣本圖像的大多數(shù)高光譜信息。因此,將PC1和PC2作為特征圖像,設(shè)定像元距離為1,在0°、45°、90°、135°4個(gè)方向上構(gòu)造GLCM,提取40個(gè)紋理特征。利用高光譜成像儀配套的SRAnal710軟件提取茶葉的RGB圖像,再提取ROI的6個(gè)顏色特征。中茶108的主成分圖像和RGB圖如圖1所示。
高光譜圖像每一個(gè)像素點(diǎn)都包含所有波長(zhǎng)下的光譜信息,為了使光譜信息更具有代表性,提取指定ROI的100×100個(gè)像素點(diǎn)的平均光譜信息作為該茶葉樣本的反射光譜,如圖2所示?;诜瓷涔庾V提取“紅邊”“黃邊”“藍(lán)邊”、RVI、DVI、NDVI共6個(gè)光譜特征。
將以上52個(gè)特征作為輸入向量,利用SVM建立識(shí)別模型。SVM的識(shí)別模型受核函數(shù)影響較大,選取常用的線性核函數(shù)、RBF核函數(shù)和sigmoid核函數(shù),對(duì)比識(shí)別結(jié)果。此外,用交叉驗(yàn)證法確定懲罰系數(shù)C、gamma參數(shù)等多個(gè)影響因子的最佳參數(shù)。模型的評(píng)價(jià)標(biāo)準(zhǔn)由識(shí)別準(zhǔn)確率(正確識(shí)別的種類數(shù)量/所有樣本數(shù)量)給定。結(jié)果如圖3所示。
該文充分利用高光譜數(shù)據(jù),提取圖像和光譜特征作為龍井茶葉的品種識(shí)別特征。模型的平均準(zhǔn)確率在99%左右,最高甚至達(dá)到100%,因此,利用高光譜技術(shù)識(shí)別龍井茶葉的品種是可行的,為今后茶葉市場(chǎng)的正規(guī)交易提供了技術(shù)支持。
參考文獻(xiàn)
[1] 吳瑞梅.名優(yōu)綠茶品質(zhì)感官評(píng)價(jià)的儀器化表征研究[D].江蘇大學(xué),2012.
[2] 湯守鵬,姚鑫鋒,姚霞,等.基于主成分分析和小波神經(jīng)網(wǎng)絡(luò)的近紅外多組分建模研究[J].分析化學(xué),2009,37(10):1445-1450.
[3] 吳瑞梅,吳彥紅,艾施榮,等.茶葉外形品質(zhì)的高光譜圖像量化分析[J].江西農(nóng)業(yè)大學(xué)學(xué)報(bào),2013,35(2):413-418.
[4] 蔣帆,喬欣,鄭華軍,等.基于高光譜分析技術(shù)的機(jī)炒龍井茶等級(jí)識(shí)別方法[J].農(nóng)業(yè)工程學(xué)報(bào),2011(7):343-348.