国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合光譜與紋理特征的龍井茶等級(jí)無(wú)損識(shí)別

2021-03-27 03:33:58陸江明范婷婷穆青爽康志龍
現(xiàn)代食品科技 2021年3期
關(guān)鍵詞:龍井茶蜜源識(shí)別率

陸江明,范婷婷,穆青爽,康志龍

(河北工業(yè)大學(xué)電子信息工程學(xué)院,天津 300401)

龍井茶是中國(guó)十大傳統(tǒng)名茶之一,其中含有多種有益于人類健康的營(yíng)養(yǎng)素和藥用成分,香氣濃郁,口感醇厚,受到各地消費(fèi)者青睞[1]。然而龍井茶分級(jí)混亂,質(zhì)量?jī)r(jià)格不一,嚴(yán)重影響了消費(fèi)者的購(gòu)買熱情和龍井茶的市場(chǎng)競(jìng)爭(zhēng)力。因此,研究一種無(wú)損、高效且準(zhǔn)確的龍井茶等級(jí)鑒定方法具有重要意義。

目前,龍井茶等級(jí)鑒定主要基于專家的感官評(píng)價(jià)[2],感官評(píng)估容易受到主觀因素的影響。高效液相色譜法、氣相色譜法和質(zhì)譜法通常用于實(shí)驗(yàn)室中分析茶葉的質(zhì)量[3,4],但測(cè)試具有破壞性,且操作復(fù)雜耗時(shí)。電子舌、電子鼻[5]等分析方法容易受到環(huán)境條件(如溫度和濕度)的影響,導(dǎo)致傳感器漂移[6]。近年來(lái)已經(jīng)報(bào)道了許多與光譜相關(guān)的無(wú)損檢測(cè)方法,其中高光譜成像技術(shù)引起了人們很大關(guān)注,它可以快速檢測(cè)樣品品質(zhì)與成分含量[7-11]。高光譜成像技術(shù)結(jié)合傳統(tǒng)成像和光譜技術(shù),能夠同時(shí)獲取圖像和光譜信息。到目前為止,高光譜成像技術(shù)在茶葉種類和等級(jí)識(shí)別上得到了一定發(fā)展[12],但研究大多是基于光譜信息,有關(guān)圖像信息(如紋理特征)利用的報(bào)道較少。如MISHRA[13]等人利用光譜信息實(shí)現(xiàn)了對(duì)六種不同商品茶分類;GE[14]等人研究了五種外觀相似的烏龍茶的識(shí)別;蔣帆[15]和LI[16]等研究了三個(gè)等級(jí)龍井茶和鐵觀音茶的識(shí)別,但是三個(gè)等級(jí)無(wú)法滿足實(shí)際的需求;于英杰[17]等人利用光譜信息實(shí)現(xiàn)了五個(gè)等級(jí)的鐵觀音茶的識(shí)別,但是由于沒有結(jié)合到圖像信息,故而準(zhǔn)確率較低。

本研究旨在融合高光譜圖像的光譜、紋理特征,結(jié)合機(jī)器學(xué)習(xí)算法,建立多等級(jí)龍井茶判別模型,為提高龍井茶等級(jí)識(shí)別水平提供可靠的理論基礎(chǔ)和技術(shù)支持。

1 材料與方法

1.1 材料

購(gòu)買六個(gè)等級(jí)的龍井茶,均來(lái)自杭州茶廠有限公司,符合官方龍井分級(jí)標(biāo)準(zhǔn)(DSBB33X02-95)。如圖1 所示,分別為特級(jí)龍井、一級(jí)龍井、二級(jí)龍井、三級(jí)龍井、四級(jí)龍井、五級(jí)龍井。每個(gè)等級(jí)茶葉分為480個(gè)樣本,共2880 個(gè)樣本,每個(gè)樣本5 g。放在直徑為3.5 cm、深度為1 cm 的黑色圓形塑料容器中。各等級(jí)按照3:1 分為訓(xùn)練集和預(yù)測(cè)集,最終訓(xùn)練集包含2160個(gè)樣本,預(yù)測(cè)集包含720 個(gè)樣本。

圖1 龍井茶樣本Fig.1 Samples of Longjing tea

1.2 高光譜圖像采集

實(shí)驗(yàn)采用的高光譜成像系統(tǒng)主要由光譜儀(Imspector N17,Spectral Imaging Ltd,Oulu,F(xiàn)inland),CCD 像機(jī)(Zelos-258GV,Kappa Optronics GmbH,Germany),聚光燈,移動(dòng)平臺(tái)和計(jì)算機(jī)等部件組成。采用線掃描模式采集高光譜反射圖像。成像系統(tǒng)光譜分辨率為3.2 nm,光譜范圍為900~1700 nm,屬于近紅外光譜(Near Infrared,NIR)。與可見近紅外光譜(Visible Near Infrared,VNIR)相比,NIR 可以提供更豐富的化學(xué)信息(如OH、CH 及NH 等化學(xué)鍵組成的分子結(jié)構(gòu)信息)[18]。為獲得清晰且不失真圖像,將茶葉樣品放在高光譜成像系統(tǒng)移動(dòng)平臺(tái)中間,鏡頭和樣本之間距離設(shè)為32 mm,平臺(tái)移動(dòng)速率設(shè)為16.8 mm/s,曝光時(shí)間設(shè)為20 ms,最終得到256 個(gè)波段下的高維數(shù)據(jù)立方體。

1.3 光譜數(shù)據(jù)預(yù)處理

圖像采集易受到照明強(qiáng)度、探測(cè)器靈敏度及光學(xué)器件投射特性等因素影響,因此本研究對(duì)采集的高光譜圖像進(jìn)行黑白校正。在相同實(shí)驗(yàn)條件下,分別采集接近全反射的白幀圖像和接近零反射的黑幀圖像。高光譜圖像的各個(gè)像素點(diǎn)反射率通過(guò)式(1)來(lái)校正:

式中,IR是校準(zhǔn)的反射率,Iraw是原始圖像反射強(qiáng)度,Idark是黑幀圖像反射強(qiáng)度,Iwhite是白幀圖像反射強(qiáng)度,i 和j 是空間坐標(biāo),k 是圖像的波長(zhǎng)。

圖2 龍井茶葉等級(jí)識(shí)別模型構(gòu)建流程圖Fig.2 Flow chart of Longjing tea class identification model construction

1.4 紋理特征提取

近距離高光譜圖像不僅有更高分辨率,還包含了更多有關(guān)樣本物理特征的紋理信息[19]?;叶裙采仃嚕℅ray-Level Co-Occurrence Matrix,GLCM)是紋理描述最簡(jiǎn)單的方法之一,已經(jīng)被廣泛應(yīng)用在近距離高光譜圖像領(lǐng)域[20,21]。相關(guān)文獻(xiàn)表明,GLCM 能夠很好地提取特征圖像中茶葉紋理特征[22]。每個(gè)樣本數(shù)據(jù)對(duì)應(yīng)256 個(gè)波段的圖像,若對(duì)所有圖像進(jìn)行紋理特征提取,計(jì)算復(fù)雜,且圖像之間的相關(guān)性會(huì)影響識(shí)別模型精度[23]。為獲取茶葉樣本最具代表性的數(shù)據(jù),減少不必要的運(yùn)算,需要對(duì)高光譜數(shù)據(jù)降維。相關(guān)研究表明,T-SNE 算法對(duì)茶樣本數(shù)據(jù)降維優(yōu)于其他方法[13]。

1.5 龍井茶葉等級(jí)判別模型構(gòu)建

1.5.1 支持向量機(jī)分類

在化學(xué)計(jì)量學(xué)領(lǐng)域,有多種方法可以對(duì)光譜特征進(jìn)行分類,但是在圖像處理領(lǐng)域,支持向量機(jī)(support vector machine,SVM)在融合光譜和紋理信息的分類上有更好的性能[24]。支持向量機(jī)是一種基于統(tǒng)計(jì)學(xué)習(xí)維數(shù)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的監(jiān)督學(xué)習(xí)模型[25],可以進(jìn)行分類和回歸分析。通過(guò)核函數(shù)將輸入空間映射到高維空間來(lái)構(gòu)造最優(yōu)分類平面,從而準(zhǔn)確分離不同的類別。相關(guān)研究表明,使用徑向基函數(shù)(radial basis function,RBF)作為核函數(shù)可以將非線性樣本映射到更高維度的空間,以處理樣本數(shù)據(jù)和類別之間的非線性關(guān)系[26]。

1.5.2 參數(shù)優(yōu)化

為解決SVM 參數(shù)在尋優(yōu)過(guò)程中易陷入局部最優(yōu)解的問(wèn)題,引入人工蜂群(Artificial Bee Colony,ABC)算法,通過(guò)ABC 算法可獲得SVM 模型懲罰因子C和核函數(shù)寬度g的最佳組合[27]。實(shí)驗(yàn)中參數(shù)尋優(yōu)問(wèn)題可轉(zhuǎn)化為蜜蜂尋找好的蜜源問(wèn)題,將C和g作為蜜源位置,分類正確率作為適應(yīng)度,利用ABC 算法尋找適應(yīng)度最高的蜜源位置。優(yōu)化算法步驟如下[28]:

(1)初始化相關(guān)參數(shù)。設(shè)置最大迭代次數(shù),蜂群大小,蜜源數(shù)量,蜜源最大循環(huán)次數(shù)及C和g的范圍。

(2)隨機(jī)選擇一個(gè)初始蜜源,進(jìn)行鄰域搜索,獲取新的蜜源,并更新當(dāng)前蜜源的相關(guān)信息。

(3)計(jì)算每個(gè)蜜源的適應(yīng)度值,根據(jù)適應(yīng)度值計(jì)算更新蜜源的概率,并據(jù)此更新每個(gè)蜜源。

(4)如果達(dá)到蜜源最大循環(huán)次數(shù)后的蜜源尚未更新,則會(huì)隨機(jī)生成一個(gè)新的蜜源。

(5)迭代到最大次數(shù)后,操作終止,輸出最佳蜜源位置,即最佳C和g的組合。

(6)將ABC 算法獲得的最優(yōu)參數(shù)C和g代入SVM 模型進(jìn)行訓(xùn)練。

1.5.3 識(shí)別模型構(gòu)建

數(shù)據(jù)融合方法包括數(shù)據(jù)級(jí)融合、特征級(jí)融合及決策級(jí)融合。由于很難確定兩類數(shù)據(jù)對(duì)最終結(jié)果的影響權(quán)重,而兩類數(shù)據(jù)都來(lái)自于高光譜圖像,且原始數(shù)據(jù)保留所有信息,因此本研究采用數(shù)據(jù)級(jí)融合方法?;诠庾V特征、紋理特征及融合特征,分別建立龍井茶等級(jí)識(shí)別模型,識(shí)別模型流程如圖2 所示。光譜模型、圖像模型及混合模型中,SVM 均采用默認(rèn)參數(shù),根據(jù)各模型的相對(duì)識(shí)別率來(lái)驗(yàn)證數(shù)據(jù)融合的作用,并得到性能相對(duì)較好的混合模型。然后應(yīng)用ABC 算法,迭代優(yōu)化混合模型SVM 參數(shù),得到最優(yōu)模型。

1.5.4 模型評(píng)估指標(biāo)

模型的性能根據(jù)正確率和Kappa系數(shù)兩個(gè)參數(shù)評(píng)估。正確率計(jì)算如式(2)所示:

其中,n1是預(yù)測(cè)正確的測(cè)試集樣本數(shù),n2是測(cè)試集樣本總數(shù)。

Kappa系數(shù)計(jì)算基于混淆矩陣,如式(3)所示:

其中,p0是每一類正確分類樣本數(shù)量之和與樣本總數(shù)的比值,即總體樣本精度。

假設(shè)每一類真實(shí)樣本個(gè)數(shù)分別為a1,a2,…,ac,而預(yù)測(cè)結(jié)果每一類樣本個(gè)數(shù)為b1,b2,…,bc,總樣本個(gè)數(shù)為n,則有式(4):

2 結(jié)果與討論

2.1 光譜數(shù)據(jù)處理與分析

圖3 原始光譜、SNV 預(yù)處理光譜和平均光譜Fig.3 Raw spectra, SNV preprocessed spectra and mean spectra

使用ENVI 5.3 分析軟件,選取龍井茶樣本感興趣區(qū)域(Region of Interest,ROI),然后將數(shù)據(jù)導(dǎo)入MATLAB R 2018b 軟件中進(jìn)行處理與分析。

為了提高模型魯棒性,每個(gè)樣本選取100×100 像素區(qū)域作為ROI,以ROI 的平均反射光強(qiáng)作為茶葉等級(jí)分類的特征參數(shù),即原始光譜數(shù)據(jù),如圖3a 所示。通常輻射校正足以消除光譜數(shù)據(jù)中照明不均勻的影響,但是當(dāng)茶葉樣品表面不均勻時(shí),光散射會(huì)導(dǎo)致加和乘性效應(yīng)[18]。本研究采用標(biāo)準(zhǔn)正態(tài)變量變換(Standard Normal Variate,SNV)對(duì)光譜進(jìn)行歸一化處理[29],結(jié)果如圖3b 所示,減小了由光散射引起的基線偏移。六個(gè)等級(jí)龍井茶樣本的平均光譜如圖3c所示。根據(jù)相關(guān)研究,1093~1121 nm 處光譜反射率與茶黃素含量相關(guān)[30],1131、1654 和1666 nm 處光譜反射率與茶多酚含量相關(guān)[31],1361 nm 處光譜反射率與水分含量相關(guān)[30],1480、1690 nm 處光譜反射率分別與NH、CH 基團(tuán)相關(guān)[32]。不同等級(jí)茶葉成分差異導(dǎo)致對(duì)光的吸收度不同,因而呈現(xiàn)不同的光譜特性。因此,可以依據(jù)光譜特性建立龍井茶等級(jí)識(shí)別模型。

2.2 紋理特征提取與分析

紋理是圖像特征研究的重點(diǎn),各特征圖像之間的相關(guān)性會(huì)導(dǎo)致較低的識(shí)別精度。本研究采用T-SNE 算法降維,相關(guān)程序由MATLAB 實(shí)現(xiàn)。前兩個(gè)特征波長(zhǎng)處的高光譜數(shù)據(jù)如圖4 所示(特征波長(zhǎng)由映射得到,并不代表具體某個(gè)波長(zhǎng)),橫軸代表第一個(gè)維度光譜特性,縱軸代表第二個(gè)維度光譜特性。二級(jí)龍井和三級(jí)龍井在同一簇中,說(shuō)明二者具有更相似的光譜特征,該結(jié)論可通過(guò)圖3 所示的光譜特性曲線驗(yàn)證。這表明通過(guò)T-SNE 算法進(jìn)行特征波長(zhǎng)提取,可以保留從高維空間向低維空間轉(zhuǎn)換時(shí)的數(shù)據(jù)結(jié)構(gòu)。

圖4 T-SNE 降維結(jié)果可視化Fig.4 Visualization of T-SNE feature extraction

以特級(jí)龍井茶樣本數(shù)據(jù)為例,通過(guò)T-SNE 算法,將256 個(gè)波段下的高光譜數(shù)據(jù)映射為4 個(gè)特征波長(zhǎng)下的數(shù)據(jù),并得到圖5 所示的四個(gè)特征圖像。選取11×11矩形像素區(qū)域?yàn)榛鶞?zhǔn)窗口,在四個(gè)方向(0°,45°,90°和135°)移動(dòng),分別構(gòu)建GLCM。每個(gè)方向上的GLCM 提取對(duì)比度、相關(guān)性、能量、均勻性、平均值、方差、熵、聚類突出度、聚類陰影、同質(zhì)性、總和平均值、總和方差及總和熵共13 個(gè)特征參數(shù),共提取208 個(gè)紋理特征(4 個(gè)采集方向×4 個(gè)特征圖像×13個(gè)特征參數(shù))。

圖5 特級(jí)龍井特征圖像Fig.5 Premium Longjing tea feature image

2.3 識(shí)別模型建立與分析

光譜特征數(shù)據(jù)、紋理特征數(shù)據(jù)、融合特征數(shù)據(jù)和對(duì)應(yīng)等級(jí)標(biāo)簽,分別用作SVM 輸入,預(yù)測(cè)等級(jí)標(biāo)簽作為輸出,得到光譜模型、圖像模型和混合模型。各模型中SVM 的懲罰因子C 和核函數(shù)寬度g 為默認(rèn)值,相關(guān)程序通過(guò)MATLAB 實(shí)現(xiàn)。

識(shí)別結(jié)果如圖6 所示,混淆矩陣對(duì)角線元素表示等級(jí)識(shí)別正確的樣本,非對(duì)角線元素表示分類錯(cuò)誤的樣本?;煜仃噷?duì)角線元素值越高,表示正確預(yù)測(cè)的數(shù)量越多。由圖6a 可知,光譜模型預(yù)測(cè)集識(shí)別率為91.12%,錯(cuò)誤主要集中在二、三級(jí)龍井茶識(shí)別,因?yàn)槎呔哂懈鼮橄嗨频墓庾V特性;由圖6b 可知,圖像模型預(yù)測(cè)集識(shí)別率為75.42%,錯(cuò)誤更多集中在四、五級(jí)龍井茶識(shí)別;由圖6c 可知,混合模型預(yù)測(cè)集識(shí)別率為95.14%,優(yōu)于其他兩個(gè)模型,這表明通過(guò)結(jié)合光譜和紋理特征,可以提高龍井茶識(shí)別模型精度。為了進(jìn)一步提高混合模型精度,引入ABC 算法優(yōu)化SVM 參數(shù),建立最優(yōu)模型。通過(guò)多次測(cè)試,按照如下設(shè)置初始化ABC 算法中參數(shù)時(shí),該模型可實(shí)現(xiàn)較好的分類和泛化能力。蜂群大小為10,最大迭代次數(shù)為150,蜜源數(shù)量為5,蜜源最大循環(huán)次數(shù)為100,C 和的g 搜索范圍為[0.01,200]。經(jīng)過(guò)ABC 算法優(yōu)化后,得到的最佳C 和g 分別為52.36 和0.15,然后將其代入SVM 模型進(jìn)行訓(xùn)練。圖6d 為最優(yōu)模型識(shí)別結(jié)果,預(yù)測(cè)集識(shí)別率可達(dá)98.61%,對(duì)各級(jí)龍井茶基本識(shí)別準(zhǔn)確。表1 為每個(gè)模型對(duì)各級(jí)龍井茶的識(shí)別率。

圖6 各模型識(shí)別結(jié)果Fig.6 Recognition results of each model

表1 各模型預(yù)測(cè)集識(shí)別率Table 1 The recognition rate of each model to the prediction set

2.4 識(shí)別模型性能驗(yàn)證

應(yīng)用ABC 算法優(yōu)化的SVM 混合模型(即最優(yōu)模型),對(duì)龍井茶高光譜圖像的每個(gè)像素點(diǎn)進(jìn)行可視化識(shí)別,用不同的顏色表示每個(gè)像素不同的預(yù)測(cè)值,形成圖7 所示的識(shí)別預(yù)測(cè)圖。圖7a、7b 分別為來(lái)自杭州茶廠有限公司龍井茶的灰度圖像及識(shí)別結(jié)果,從上到下依次為,特級(jí)龍井、一級(jí)龍井、二級(jí)龍井、三級(jí)龍井、四級(jí)龍井、五級(jí)龍井。由圖可知,該模型基本完成了對(duì)每個(gè)樣本像素點(diǎn)的識(shí)別,樣本邊緣處的錯(cuò)誤分類主要是實(shí)驗(yàn)所用黑色塑料容器引起的。為了進(jìn)一步驗(yàn)證該模型的泛化能力,以來(lái)自杭州獅峰茶葉有限公司的6 個(gè)等級(jí)龍井茶為實(shí)驗(yàn)對(duì)象,按照上述流程,進(jìn)行實(shí)驗(yàn)。圖7c、7d 分別為該品牌龍井茶的灰度圖像及可視化識(shí)別結(jié)果。由圖可知,該模型仍能夠基本實(shí)現(xiàn)對(duì)不同等級(jí)龍井茶像素點(diǎn)的識(shí)別,具有較好的泛化能力與應(yīng)用價(jià)值。

圖7 龍井茶識(shí)別預(yù)測(cè)圖Fig.7 Prediction map of Longjing tea recognizing

3 結(jié)論

本研究利用高光譜成像技術(shù),結(jié)合SNV、T-SNE、GLCM 等算法,基于光譜特征、紋理特征以及融合特征,分別建立龍井茶等級(jí)快速無(wú)損識(shí)別的SVM 模型。結(jié)果顯示,光譜模型預(yù)測(cè)集識(shí)別率為91.11%,其中對(duì)二、三級(jí)龍井茶識(shí)別錯(cuò)誤較多,因?yàn)槎呔哂懈嗨频墓庾V曲線;圖像模型預(yù)測(cè)集識(shí)別率為75.42%,但對(duì)二、三級(jí)龍井茶的識(shí)別率優(yōu)于光譜模型;混合模型預(yù)測(cè)集識(shí)別率為95.14%,優(yōu)于其他兩個(gè)模型。結(jié)果表明,高光譜圖像的光譜和空間域生成互補(bǔ)信息,對(duì)該信息的協(xié)同處理可以提高分類模型的正確率。當(dāng)前研究中龍井茶識(shí)別大多基于光譜信息,缺乏對(duì)高光譜圖像信息的應(yīng)用。為了進(jìn)一步提高識(shí)別精度,本研究引入ABC 算法,優(yōu)化SVM 混合模型參數(shù)。當(dāng)C和g分別為52.36 和0.15 時(shí),得到最優(yōu)模型,預(yù)測(cè)集識(shí)別率可達(dá)98.61%。最優(yōu)模型能夠基本實(shí)現(xiàn)對(duì)龍井茶樣本每個(gè)像素點(diǎn)的識(shí)別,且具有一定的泛化能力。本研究為改進(jìn)龍井茶等級(jí)評(píng)估技術(shù)提供了一種可靠的方法和技術(shù)指導(dǎo)。

猜你喜歡
龍井茶蜜源識(shí)別率
貴州寬闊水國(guó)家級(jí)自然保護(hù)區(qū)蜜源植物資源調(diào)查研究*
林下拓蜜源 蜂業(yè)上臺(tái)階
基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測(cè)
杭州龍井茶園
文化交流(2019年10期)2019-11-22 10:41:21
基于真耳分析的助聽器配戴者言語(yǔ)可懂度指數(shù)與言語(yǔ)識(shí)別率的關(guān)系
提升高速公路MTC二次抓拍車牌識(shí)別率方案研究
指示蜜源的導(dǎo)蜜鳥
著名的西湖龍井茶因何得名?
高速公路機(jī)電日常維護(hù)中車牌識(shí)別率分析系統(tǒng)的應(yīng)用
西湖龍井茶地現(xiàn)狀分布圖
茶博覽(2015年5期)2015-01-03 01:32:48
翁牛特旗| 阿坝县| 通州区| 搜索| 肥西县| 汝南县| 电白县| 措勤县| 宽城| 通道| 广南县| 宾阳县| 马山县| 虞城县| 青岛市| 根河市| 大姚县| 浙江省| 前郭尔| 临高县| 辉南县| 班玛县| 招远市| 沙田区| 尤溪县| 论坛| 邓州市| 马关县| 秦安县| 长宁区| 井冈山市| 昌都县| 疏勒县| 息烽县| 什邡市| 乌鲁木齐县| 锦州市| 大同县| 富川| 沛县| 五莲县|