国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于高光譜成像技術(shù)的烤煙上部煙葉成熟度光譜特征分析及判別模型構(gòu)建應(yīng)用研究

2024-03-26 08:07鄧建強(qiáng)王大彬乾艷尹忠春彭五星李富強(qiáng)任曉紅
中國煙草學(xué)報(bào) 2024年1期
關(guān)鍵詞:成熟度波段煙葉

鄧建強(qiáng),王大彬,乾艷,尹忠春,彭五星,李富強(qiáng),任曉紅*

基于高光譜成像技術(shù)的烤煙上部煙葉成熟度光譜特征分析及判別模型構(gòu)建應(yīng)用研究

鄧建強(qiáng)1,王大彬2,乾艷1,尹忠春1,彭五星1,李富強(qiáng)1,任曉紅1*

1 湖北省煙草公司恩施州公司,湖北 恩施 445000;2 中國農(nóng)業(yè)科學(xué)院煙草研究所,農(nóng)業(yè)農(nóng)村部煙草質(zhì)量安全風(fēng)險(xiǎn)評(píng)估實(shí)驗(yàn)室 青島 266101

【目的】研究不同成熟度上部煙葉的高光譜特征及智能化判別的可行性?!痉椒ā窟\(yùn)用便攜式高光譜儀采集3種成熟度(尚熟(SS)、成熟(CS)、過熟(GS))上部煙葉的高光譜圖像并提取光譜數(shù)據(jù)。運(yùn)用相關(guān)性分析、主成分分析以及方差分析等方法分析光譜特征并構(gòu)建5種模型(支持向量機(jī)(SVM)、K近鄰(KNN)、隨機(jī)森林(RF)、LightGBM和XGBoost)用于成熟度判別評(píng)價(jià)?!窘Y(jié)果】(1)可見光(400~720 nm)與近紅外(750~1000 nm)內(nèi)部各波段之間相關(guān)性較強(qiáng),而兩個(gè)區(qū)域之間相關(guān)性較弱;(2)5個(gè)特征值大于1的主成分(PC1~PC5)幾乎包含了所有的光譜信息,且主成分方差分析結(jié)果表明不同成熟度上部煙葉的光譜反射特征在可見光、紅邊以及部分近紅外區(qū)域(950~1000 nm)統(tǒng)計(jì)學(xué)差異顯著;(3)5種模型中SVM性能最優(yōu),2021年度樣品的判別精確率、召回率和F1分?jǐn)?shù)均在0.95以上,而2022年度以及2021+2022年度樣品分別在0.93和0.92以上?!窘Y(jié)論】上部煙葉高光譜存在多重共線性,具有很好的降維效果,且不同成熟度的光譜反射特征存在顯著差異。SVM判別性能在不同年度間具有很好的穩(wěn)定性,可用于上部煙葉成熟度判別。

便攜式高光譜儀;上部煙葉;成熟度;光譜特征;模型構(gòu)建及應(yīng)用

煙葉采收成熟度對(duì)烤后煙葉品質(zhì)有重要影響[1-2]??緹熒喜繜熑~占整株煙葉總產(chǎn)量的30%~40%,優(yōu)質(zhì)上部煙葉具有煙氣濃度高、香氣量足等特點(diǎn),是高檔卷煙的重要原料來源[3]。上部煙葉在成熟過程中發(fā)生一系列復(fù)雜的生理生化反應(yīng),導(dǎo)致其煙葉內(nèi)含物質(zhì)組成發(fā)生變化,進(jìn)而影響上部煙葉品質(zhì)[4],因此研究上部煙葉成熟過程中代謝物變化規(guī)律對(duì)于指導(dǎo)上部煙成熟采收具有重要意義[5-7]。然而,上述研究采用的生理生化指標(biāo)檢測方法,存在經(jīng)濟(jì)成本高、時(shí)間周期長等問題,無法在生產(chǎn)中大范圍推廣。目前技術(shù)人員主要通過葉片顏色、葉脈特征、莖葉夾角等外觀特征進(jìn)行成熟度判斷,但此過程依賴于主觀經(jīng)驗(yàn),對(duì)從業(yè)人員的經(jīng)驗(yàn)積累有一定要求,且個(gè)體之間主觀感受存在差異。因此發(fā)展一種快速檢測技術(shù)用于指導(dǎo)煙葉成熟采摘具有重要現(xiàn)實(shí)意義。

高光譜成像技術(shù)是一種三維檢測技術(shù),通過對(duì)目標(biāo)物進(jìn)行二維平面掃描可以給出每一個(gè)像素單元完整的光譜反射曲線,具有光譜波段多、分辨率高、圖譜合一等特點(diǎn)[8]。高光譜既能反映目標(biāo)物的外觀特征,又能探測內(nèi)部的化學(xué)成分信息,目前在農(nóng)產(chǎn)品品質(zhì)檢測方面已有相關(guān)研究報(bào)道[9-11],而成熟度是其中一個(gè)重要研究領(lǐng)域,如小白杏[12]、油茶果[13]以及玉米種子[14]等。在煙草領(lǐng)域,目前有關(guān)高光譜成像技術(shù)的研究亦有相關(guān)報(bào)道。李智慧等[15]利用高光譜成像技術(shù)和機(jī)器學(xué)習(xí)方法對(duì)煙葉中的非煙物質(zhì)進(jìn)行分類識(shí)別,訓(xùn)練集和測試集正確率分別為99.82%和99.47%。張慧等[16]基于高光譜和紋理融合的方法實(shí)現(xiàn)了烤煙的有效無損分類。張龍等[17]基于高光譜成像技術(shù)實(shí)現(xiàn)了煙葉和雜物的分類,總體分類精度達(dá)到99.92%。在煙葉成熟度研究方面,李鑫等[18]基于高光譜成像技術(shù)構(gòu)建了中部煙葉成熟度的判別模型,并取得了理想效果,但缺少對(duì)不同成熟度煙葉光譜特征的深入分析。因此本研究擬基于高光譜成像技術(shù)探究不同成熟度上部煙葉的光譜特征,在此基礎(chǔ)上構(gòu)建不同模型用于上部煙葉成熟度判別,最終為上部煙葉成熟度智能化檢測技術(shù)開發(fā)提供啟示和借鑒。

1 材料與方法

1.1 試驗(yàn)材料

試驗(yàn)于2021—2022年在湖北省恩施州宣恩縣椒園煙葉種植區(qū)(E 29.9751°,N 109.3915°,海拔1050 m)進(jìn)行,供試品種為云煙80,土壤類型為山地黃棕壤,煙田土壤的基礎(chǔ)理化性質(zhì)如下:土壤pH 6.20,全氮1.85 g/kg,有機(jī)質(zhì)27.65 g/kg,堿解氮149.36 mg/kg,速效磷30.08 mg/kg,速效鉀224.96 mg/kg。

1.2 設(shè)備與儀器

高光譜成像系統(tǒng)(北京易科泰生態(tài)技術(shù)有限公司)包括:便攜式高光譜儀(Specim IQ,空間分辨率為512×512像素,光譜分辨率7 nm,波段數(shù)204)、鹵素?zé)艄庠础⑷_架、校正白板、黑色幕布等。

1.3 高光譜圖像采集

從7月下旬煙草成熟期開始,每隔7 d左右由專業(yè)技術(shù)人員采摘代表尚熟(SS)、成熟(CS)和過熟(GS)的上部煙葉樣品進(jìn)行高光譜圖像掃描(曝光時(shí)間大約為220 ms)。2021年度共采集樣品91份,其中SS樣品30份、CS樣品30份、GS樣品31份。2022年度共采集樣品184份,其中SS樣品62份、CS樣品61份、GS樣品61份。

1.4 數(shù)據(jù)預(yù)處理

由于圖像中的每個(gè)像素點(diǎn)包含一條光譜曲線,利用ENVI軟件將整個(gè)葉片作為感興趣區(qū)域(Region of Interest, ROI),將ROI中所有像素點(diǎn)的光譜反射率的平均值作為該片煙葉的光譜反射數(shù)據(jù),最終得到代表不同成熟度所有煙葉樣品的高光譜數(shù)據(jù)。圖1展示了2021年度3個(gè)成熟度所有上部煙葉樣品的高光譜反射曲線。

注:(a)SS、(b)CS以及(c)GS。

Note : (a) SS, (b) CS and (c) GS.

圖1 2021年度烤煙上部煙葉所有樣品的高光譜反射曲線

Fig. 1 Hyperspectral reflection curve of upper tobacco leaf samples in 2021

1.5 模型介紹及評(píng)價(jià)

1.5.1 數(shù)據(jù)集劃分

首先將不同成熟度的上部煙葉樣品按照7:3的比例隨機(jī)劃分為訓(xùn)練集和測試集,且彼此之間樣品不重疊。其中,訓(xùn)練集用于模型構(gòu)建,并且在模型訓(xùn)練過程中采用了5折交叉驗(yàn)證的方法,測試集用于評(píng)價(jià)模型的泛化性能。

1.5.2 算法介紹

本研究采用支持向量機(jī)(SVM)、K近鄰(KNN)、隨機(jī)森林(RF)、LightGBM和XGBoost等算法對(duì)不同成熟度上部煙葉樣品數(shù)據(jù)集進(jìn)行建模。SVM是一種對(duì)數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器,其決策函數(shù)由少數(shù)的支持向量確定,是一個(gè)具有稀疏性和穩(wěn)健性的分類器,通過引入核函數(shù)可實(shí)現(xiàn)非線性分類。KNN是數(shù)據(jù)挖掘分類中最簡單的方法之一,其核心思想是如果一個(gè)樣本在特征空間中的K個(gè)最相鄰樣本大多屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別,并具有這個(gè)類別中樣本的特性。RF是Breiman等提出的一種基于決策樹的集成算法,對(duì)數(shù)據(jù)噪聲容忍度好,具有人工干預(yù)少、運(yùn)算速度快等優(yōu)點(diǎn)。LightGBM是一個(gè)實(shí)現(xiàn)GBDT算法的框架,支持高效率的并行訓(xùn)練,并且具有更快的訓(xùn)練速度、更低的內(nèi)存消耗、更好的準(zhǔn)確率,支持分布式可以快速處理海量數(shù)據(jù)等優(yōu)點(diǎn)。XGBoost是基于Boosting框架的一個(gè)算法工具包,可以用于并行計(jì)算效率、缺失值處理以及預(yù)測性能等方面。

1.5.3 模型評(píng)價(jià)指標(biāo)

1.5.3.1 混淆矩陣

表1為混淆矩陣,包括真正例(True Positive,TP)、假正例(False Positive,F(xiàn)P)、假反例(False Negative,F(xiàn)N)和真反例(True Negative,TN)4種情況。根據(jù)測試集中每個(gè)樣品預(yù)測的正確與否,把整個(gè)測試集的全部數(shù)據(jù),分別放到這4個(gè)格子的相應(yīng)位置。

表1 混淆矩陣表現(xiàn)形式

1.5.3.2 準(zhǔn)確率(Accuracy)

準(zhǔn)確率表示分類正確的樣本占總樣本的比例,公式(1):

1.5.3.3 精確率(Precision)

精確率又叫查準(zhǔn)率,表示預(yù)測結(jié)果為正例的樣本中實(shí)際為正樣本的比例,公式(2):

1.5.3.4 召回率(Recall)

召回率又被稱為查全率,表示預(yù)測結(jié)果為正例的樣本中實(shí)際正例數(shù)量占全樣本中正例樣本的比例,公式(3):

1.5.3.5 F1分?jǐn)?shù)

F1分?jǐn)?shù)是綜合了精確率和召回率的一個(gè)判斷指標(biāo),F(xiàn)1分?jǐn)?shù)取值范圍為0到1,1是最好,0是最差,F(xiàn)1分?jǐn)?shù)越高,說明模型越穩(wěn)健,公式(4):

1.6 數(shù)據(jù)分析軟件

本研究使用ENVI軟件提取煙葉樣品的高光譜數(shù)據(jù),使用 R語言進(jìn)行高光譜數(shù)據(jù)的特征分析,使用Python進(jìn)行判別模型構(gòu)建。

2 結(jié)果

2.1 不同成熟度上部煙葉高光譜特征分析

2.1.1 不同成熟度上部煙葉高光譜反射特征

圖2展示了上部煙葉成熟過程中高光譜反射曲線的變化??傮w上,上部葉片的高光譜曲線呈現(xiàn)典型的綠色植物光譜特征,即在400~500 nm和600~700 nm之間形成吸收波谷,在550 nm處形成反射峰,在680 nm附近反射率急劇上升,進(jìn)入近紅外區(qū)域后逐漸達(dá)到平臺(tái),反射率大約在0.7左右,在680~750 nm之間反射率急劇上升的區(qū)域就是所謂的“紅邊”。上部煙葉的光譜反射率在可見光區(qū)域差異顯著且隨成熟度增加而上升(GS>CS>SS);在紅邊位置,上部煙葉的光譜反射率隨成熟度同樣呈上升趨勢;在近紅外區(qū)域不同成熟度高光譜反射曲線視覺上差異不明顯。值得注意的是,在950 nm附近,所有葉片都有一個(gè)明顯的吸收峰,這是由葉片中水分子吸收導(dǎo)致的[8]。

圖2 三個(gè)成熟度烤煙上部煙葉的平均光譜曲線

2.1.2 不同成熟度上部煙葉高光譜相關(guān)性分析

圖3繪制了不同成熟度上部煙葉高光譜的相關(guān)性。如圖3所示,400~720 nm波段之間存在正相關(guān)性,750~1000 nm波段之間同樣具有正相關(guān)性,而400~720 nm與750~1000 nm兩個(gè)區(qū)域之間相關(guān)性較弱,甚至某些波段間呈現(xiàn)負(fù)相關(guān)。

注:藍(lán)色代表正相關(guān),紅色代表負(fù)相關(guān),顏色越深表示相關(guān)性越強(qiáng),反之相關(guān)性越弱。

Note: Blue represents positive correlation, red represents negative correlation. The darker the color, the stronger the correlation, and vice versa, the weaker the correlation.

圖3 不同成熟度上部煙葉高光譜各波段間的相關(guān)性矩陣

Fig. 3 Correlation matrix among various bands of hyperspectral data for upper tobacco leaves at different maturity levels

2.1.3 不同成熟度上部煙葉高光譜主成分分析及其方差分析

為探究不同成熟度上部煙葉高光譜特征差異,需對(duì)高光譜波段進(jìn)行比較分析,然而高光譜波段數(shù)量多,對(duì)其全部波長進(jìn)行差異性分析工作量十分龐大,若僅分析比較少數(shù)波段則缺乏代表性,因此對(duì)其降維處理減少變量個(gè)數(shù)是進(jìn)行差異分析的必要條件。相關(guān)性分析結(jié)果表明不同成熟度上部煙葉各波段之間存在較高的相關(guān)性,因此它們的光譜數(shù)據(jù)特別適合利用主成分分析進(jìn)行降維處理。表2列出了上部煙葉高光譜數(shù)據(jù)主成分特征值及其貢獻(xiàn)率,共提取得到5個(gè)特征值大于1的主成分,它們的方差累積貢獻(xiàn)率達(dá)到0.99,表明以上5個(gè)主成分能夠全面地反映烤煙上部葉片的光譜信息。

表2 烤煙上部煙葉高光譜主成分特征值及貢獻(xiàn)率

各主成分在400~1000 nm波段上的載荷系數(shù)如圖4a所示。其中 PC1在400~740 nm附近具有較高的載荷系數(shù),PC2在740~1000 nm范圍內(nèi)載荷系數(shù)較高,PC3在980 nm附近載荷系數(shù)達(dá)到最大值,約為0.4,在其它波段上載荷系數(shù)較小,PC4在400 nm時(shí)載荷系數(shù)約為0.5,此后隨著波長增加,載荷系數(shù)相對(duì)較低,PC5的載荷系數(shù)在680~750 nm之間存在一個(gè)明顯的峰值,最大值在0.3左右,在其它波段上載荷系數(shù)較低。載荷系數(shù)越大意味著各主成分包含該波段上的光譜信息越多,因此PC1主要包括絕大部分可見光信息、部分紅邊信息,PC2主要包含絕大部分近紅外信息、部分紅邊信息,PC3主要包含950~1000 nm范圍內(nèi)部分近紅外信息,PC4主要包含部分紫色光(400~430 nm)信息,PC5主要包含部分紅邊信息。

在此基礎(chǔ)上,本研究進(jìn)一步分析比較了不同成熟度烤煙上部葉5個(gè)主成分的差異性(圖4b~4f)。對(duì)于PC1,3個(gè)成熟度得分平均值排序?yàn)镚S>CS>SS,且三者之間存在統(tǒng)計(jì)學(xué)極顯著差異(<0.01)。對(duì)于PC2,3個(gè)成熟度得分均值排序?yàn)镃S>SS>GS,且三者之間統(tǒng)計(jì)學(xué)差異不顯著(>0.05)。對(duì)于PC3,3個(gè)成熟度得分均值排序?yàn)镚S>CS>SS,其中SS極顯著低于CS和GS(<0.01),而CS和GS之間差異不明顯(>0.05)。對(duì)于PC4,3個(gè)成熟度得分均值排序?yàn)镚S>CS>SS,且SS同樣極顯著低于CS和GS(<0.01),而CS和GS之間差異不明顯(>0.05)。對(duì)于PC5,3個(gè)成熟度得分均值排序?yàn)镚S>CS>SS,且三者之間差異極顯著(<0.01)。

注:abc代表差異顯著(<0.05),ABC代表差異極顯著(<0.01)。

Note: abc represents significant difference (<0.05), ABC represents extremely significant difference (<0.01).

圖4 不同成熟度上部煙葉各主成分載荷系數(shù)變化曲線(a)以及各主成分箱線圖和方差分析結(jié)果(b~f)

Fig. 4 Curves of loading coefficients of principal components derived from upper tobacco leaves at different maturity levels (a) and boxplots and variance analysis of principal components (b-f)

2.2 模型構(gòu)建及應(yīng)用

2.2.1 5種模型優(yōu)化評(píng)價(jià)

將2021年度訓(xùn)練集中上部煙葉的高光譜數(shù)據(jù)輸入到SVM、RF、KNN、LightGBM和XGBoost 5種模型中,使用網(wǎng)格搜索并采用5折交叉驗(yàn)證的方法得到各個(gè)模型的最優(yōu)超參數(shù)組合(表3)。

表3 5種模型的最優(yōu)超參數(shù)組合

續(xù)表3

方法Methods超參數(shù)Hyperparameters搜索空間Search Space KNNn_neighbors7 p3 weightsdistance LightGBMlearning_rate0.01 max_depth-1 min_child_samples2 num_leaves3 reg_alpha0 XGBoosteta0.01 eval_metricmlogloss max_depth1 gamma0.0001

將以上具有最優(yōu)超參數(shù)組合的5種模型應(yīng)用到2021年度測試集中上部煙葉成熟度判別,通過分析比較各項(xiàng)性能指標(biāo),進(jìn)而確定最優(yōu)模型(圖5)。如圖5a所示,SVM的判別準(zhǔn)確率最高,達(dá)到95%以上,其余4種模型的判別準(zhǔn)確率相同,均在90%以上。5種模型對(duì)測試集樣品判別的混淆矩陣結(jié)果如圖5b~5f所示,在SVM中有一個(gè)SS樣品被誤判為CS,而其它4個(gè)模型中有兩個(gè)SS樣品被誤判為CS。

注:a,模型準(zhǔn)確率;b,SVM;c,RF;d,KNN;e,LightGBM;f,XGBoost。

Note: a, accuracy of models; b, SVM; c, RF; d, KNN; e, LightGBM; f, XGBoost.

圖5 5種模型判別測試集上部煙葉成熟度的準(zhǔn)確率以及混淆矩陣結(jié)果

Fig. 5 Accuracy of the five models in classifying the maturity of upper tobacco leaves from test set and the results of confusion matrix

基于混淆矩陣的結(jié)果,本研究計(jì)算了5種模型對(duì)不同成熟度上部煙葉判別的精確率、召回率以及F1分?jǐn)?shù)等指標(biāo)(表4)。對(duì)于SS樣品,5種模型的精確率均為100%,SVM的召回率(89%)和F1分?jǐn)?shù)(94%)最高,其它4種模型相同(78%、88%);對(duì)于CS樣品,SVM的精確率(86%)和F1分?jǐn)?shù)(92%)最高,5種模型的召回率均為100%;對(duì)于GS樣品,5種模型的精確率、召回率和F1分?jǐn)?shù)均為100%。由此可見,SVM對(duì)SS和CS樣品的判別性能優(yōu)于其它4種模型,5種模型對(duì)GS樣品的判別性能一致。5種模型對(duì)所有成熟度上部煙葉判別的精確率、召回率以及F1分?jǐn)?shù)的結(jié)果如圖6所示,SVM的精確率、召回率以及F1分?jǐn)?shù)均大于0.95,優(yōu)于其它4種模型,因此選擇SVM作為上部煙葉成熟度的最優(yōu)判別模型。

表4 5種模型判別上部煙葉成熟度的精確率、召回率以及F1分?jǐn)?shù)

圖6 5種模型判別上部煙葉成熟度的精確率、召回率以及F1分?jǐn)?shù)的平均值

2.2.2 SVM模型應(yīng)用驗(yàn)證

為驗(yàn)證SVM模型對(duì)不同年度間上部煙葉成熟度判別應(yīng)用的穩(wěn)定性,本研究利用2022年度以及2021+2022年度上部煙葉樣品的訓(xùn)練集對(duì)SVM模型進(jìn)行重新訓(xùn)練構(gòu)建,然后利用測試集進(jìn)行應(yīng)用驗(yàn)證(圖7)。對(duì)于2022年度上部煙葉(圖7a),SS樣品中有1個(gè)被誤判為CS,CS樣品中有1個(gè)被誤判為SS,GS樣品中有2個(gè)被誤判為CS;對(duì)于2021+2022年度樣品(圖7b),SS中有3個(gè)樣品被誤判為CS,CS中有1個(gè)被誤判為SS,GS中有3個(gè)被誤判為CS。

注:a,2022年度樣品;b,2021+2022年度樣品。

Note: a, Samples from 2022; b, Samples from 2021+2022.

圖7 SVM判別不同年度上部煙葉成熟度的混淆矩陣結(jié)果

Fig.7 Confusion matrix results of SVM in classifying the maturity of upper tobacco leaves across different years

基于混淆矩陣結(jié)果,本研究分別計(jì)算了SVM對(duì)2021和2021+2022年度上部煙葉成熟度判別的精確率、召回率和F1分?jǐn)?shù)(表5)。對(duì)于2022年度,SS、CS和GS樣品的精確率為94%、86%和100%,召回率為94%、95%和91%,F(xiàn)1分?jǐn)?shù)為94%、90%和95%,3項(xiàng)指標(biāo)在所有成熟度上的平均值均為93%。對(duì)于2021+2022年度,SS、CS和GS樣品的精確率為97%、82%和100%,召回率為90%、97%和90%,F(xiàn)1分?jǐn)?shù)為93%、89%和95%,3項(xiàng)指標(biāo)的平均值分別為93%、92%和92%。

表5 SVM判別不同年度上部煙葉成熟度的精確率、召回率和F1分?jǐn)?shù)

3 討論

綠色植物的高光譜反射特性是由內(nèi)部組織結(jié)構(gòu)形態(tài)和化學(xué)成分決定的。在可見光范圍內(nèi),色素是影響植物光譜吸收的主要因素,其中葉綠素所起的作用最大,此外葉紅素和葉黃素以及花青苷在可見光波段也有吸收[8]。當(dāng)植物開始成熟衰老時(shí),葉片中色素含量降低,進(jìn)而導(dǎo)致葉片的高光譜反射特性發(fā)生變化[8]。在近紅外波段,植被的光譜反射特性主要受植物葉片內(nèi)部構(gòu)造以及-C-H、-N-H和-O-H等化學(xué)基團(tuán)的影 響[8]。在可見光與近紅外之間,反射率急劇上升,形成所謂“紅邊”,這是綠色植物高光譜反射曲線最為明顯的特征[8]。在本研究中,烤煙上部煙葉成熟過程中葉綠素等色素含量逐漸減少導(dǎo)致了可見光區(qū)域的光譜反射率逐漸上升,這與李鑫等[18]的研究結(jié)果一致,而在近紅外區(qū)域,葉片成熟過程中內(nèi)部構(gòu)造以及化學(xué)基團(tuán)的變化對(duì)上部煙葉的光譜反射率影響較小。相關(guān)性分析表明,上部煙葉在可見光和近紅外兩個(gè)區(qū)域之間的高光譜波段相關(guān)性較弱,說明兩個(gè)區(qū)域之間相對(duì)獨(dú)立,內(nèi)在關(guān)聯(lián)性較小,而兩個(gè)區(qū)域內(nèi)部各自波段之間相關(guān)性較強(qiáng),內(nèi)在關(guān)聯(lián)性強(qiáng),具有很好的降維潛能。

主成分分析共提取得到5個(gè)主成分,它們的累積方差貢獻(xiàn)率達(dá)到0.99,表明上部煙葉高光譜的204個(gè)波段可被壓縮為5個(gè)主成分變量,極大簡化了數(shù)據(jù)的復(fù)雜程度,同時(shí)也進(jìn)一步說明上部煙葉高光譜存在嚴(yán)重多重共線性。對(duì)于不同成熟度上部煙葉高光譜特征的差異性,根據(jù)各主成分的載荷系數(shù)以及方差分析結(jié)果可知,總體上不同成熟度上部煙葉在可見光區(qū)域具有顯著性差異,而在近紅外區(qū)域差異不明顯。950~1000 nm近紅外區(qū)域內(nèi)包含葉片含水量信息,根據(jù)PC3方差分析結(jié)果可推知上部煙葉水分含量隨成熟度增加而降低[19],且SS水分含量與CS、GS存在極顯著差異,而CS和GS之間差異不明顯。在400~430 nm紫色光區(qū)域,SS與CS、GS的光譜反射率差異極顯著,而CS和GS之間反射率差異不顯著。在紅邊位置,不同成熟度上部煙葉差異同樣顯著。以上結(jié)果表明不同成熟度上部煙葉的高光譜反射特征存在明顯差異,這為判別模型構(gòu)建奠定了理論基礎(chǔ)。

以上5種模型中SVM具有最優(yōu)判別性能,與李鑫等[18]研究結(jié)果一致,可能原因是煙葉成熟是一個(gè)漸進(jìn)演化的過程,成熟度判別實(shí)質(zhì)上是在兩個(gè)相鄰類別之間找到一個(gè)合適的臨界狀態(tài),而SVM分類原理同樣是在兩個(gè)類別之間找到一個(gè)最優(yōu)超平面,因此SVM的工作原理特別適用于煙葉成熟度判別。對(duì)于其它4種模型,KNN算法是基于距離度量的依據(jù)K個(gè)最近鄰樣本屬性進(jìn)行分類的算法,RF是基于集成學(xué)習(xí)的思想將多棵決策樹進(jìn)行集成的算法,根據(jù)每棵決策樹的結(jié)果取其平均值實(shí)現(xiàn)分類,而LightGBM和XGBoost是基于GBDT思想框架下的兩種不同算法,以上4種模型無法在兩個(gè)成熟度類別之間找到一個(gè)臨界狀態(tài),因而可能影響了判別性能[20]。此外,本研究進(jìn)一步考察驗(yàn)證了SVM模型對(duì)不同年度間上部煙葉成熟度判別性能的穩(wěn)定性,2022年度以及2021+2022年度上部煙葉判別的精確率、召回率和F1分?jǐn)?shù)的平均值均在92%以上,與2021年度的判別結(jié)果近乎一致,表明SVM模型可用于不同年度間上部煙葉成熟度判別。此外,SVM對(duì)CS樣品的判別性能弱于SS和GS,原因可能是CS分別與SS、GS之間存在臨界狀態(tài)增加了SVM尋找最優(yōu)超平面時(shí)的難度,使得SVM在判別CS與SS以及CS與GS時(shí)可能會(huì)發(fā)生誤判,從而增加了CS誤判的概率。

4 結(jié)論

本研究基于高光譜成像技術(shù)探究了不同成熟度烤煙上部葉的光譜特征并構(gòu)建了成熟度判別模型。不同成熟度上部煙葉高光譜波段存在多重共線性,且光譜反射特征在可見光、紅邊以及部分近紅外區(qū)域(950~1000 nm)差異顯著。5種判別模型中SVM性能最優(yōu)且在不同年度間具有很好的穩(wěn)定性,可用于煙葉生產(chǎn)中成熟度判別。本研究為將來煙葉成熟度智能化判別提供了理論和技術(shù)支持。

[1] 左天覺. 煙草的生產(chǎn)、生理和生物化學(xué)[M]. 上海:上海遠(yuǎn)東出版社,1993.

ZUO Tianjue. Production, physiology, and biochemistry of tobacco plant[M]. Shanghai: Shanghai Far East Publishers,1993.

[2] 宮長榮. 煙草調(diào)制學(xué)[M]. 北京:中國農(nóng)業(yè)出版社,2003.

GONG Changrong. Tobacco curing[M]. Beijing: China Agriculture Press, 2003.

[3] 朱尊權(quán). 提高上部煙葉可用性是促“卷煙上水平”的重要措施[J]. 煙草科技,2010(6): 5–9, 31.

ZHU Zunquan. Improving usability of upper leaves, an important measure for accelerating up-grading cigarette quality[J]. Tobacco Science & Technology, 2010(6): 5–9, 31.

[4] 賈中林,鄭慶霞,戴華鑫,等. 烤煙上部葉成熟過程中代謝組的差異分析[J]. 煙草科技,2023, 56(1): 1-10.

JIA Zhonglin, ZHENG Qingxia, DAI Huaxin, et al. Differential analysis of metabolome of upper flue-cured tobacco leaf during ripening process[J]. Tobacco Science & Technology, 2023, 56(1): 1-10.

[5] 賈中林,尹啟生,戴華鑫,等. 烤煙上部煙葉成熟生理特性研究進(jìn)展[J]. 煙草科技,2022, 55(7): 99-112.

JIA Zhonglin, YIN Qisheng, DAI Huaxin, et al. Research progress on physiological characteristics of mature upper leaves of flue-cured tobacco[J]. Tobacco Science & Technology, 2022, 55(7): 99-112.

[6] 孫皓月,李文剛,俞世康,等. 上部葉脂質(zhì)代謝與煙葉褐變的關(guān)系研究[J]. 中國煙草學(xué)報(bào),2022, 28(04): 31-38.

SUN Haoyue, LI Wengang, YU Shikang, et al. Study on the relationship between lipid metabolism and browning of upper tobacco leaves[J]. Acta Tabacaria Sinica, 2022, 28(04): 31-38.

[7] 孫光偉,陳振國,王玉軍,等. 烤煙上部葉采收時(shí)SPAD值與鮮煙組織結(jié)構(gòu)、生理指標(biāo)及烤后煙葉內(nèi)在質(zhì)量的關(guān)系[J]. 中國煙草學(xué)報(bào),2019, 25(05): 63-69+104.

SUN Guangwei, CHEN Zhenguo, WANG Yujun, et al. Relationships of SPAD value with tissue structure, physiological index and internal quality of flue-cured tobacco upper leaves[J]. Acta Tabacaria Sinica, 2019, 25(05): 63-69+104.

[8] 童慶禧,張兵,鄭蘭芬,等. 高光譜遙感[M]. 北京:高等教育出版社,2006.

TONG Qingxi, ZHANG Bing, ZHENG Lanfen, et al. Hyperspectral remote sensing[M]. Beijing: Higher Education Press, 2006.

[9] 吳永清,李明,張波,等. 高光譜成像技術(shù)在谷物品質(zhì)檢測中的應(yīng)用進(jìn)展[J]. 中國糧油學(xué)報(bào),2021, 36 (5): 165-173.

WU Yongqing, LI Ming, ZHANG Bo, et al. Application progress of hyperspectral imaging technology in grain quality inspection[J]. Journal of the Chinese Cereals and Oils Association, 2021, 36 (5): 165-173.

[10] 李江波,饒秀勤,應(yīng)義斌. 農(nóng)產(chǎn)品外部品質(zhì)無損檢測中高光譜成像技術(shù)的應(yīng)用研究進(jìn)展[J]. 光譜學(xué)與光譜分析,2011, 31 (8): 2021-2026.

LI Jiangbo, RAO Xiuqin, YING Yibin. Research progress of hyperspectral imaging technology in nondestructive testing of agricultural products[J]. Spectroscopy and Spectral Analysis, 2011, 31 (8): 2021-2026.

[11] 何馥嫻,蒙慶華,唐柳,等. 高光譜成像技術(shù)在水果品質(zhì)檢測中的研究進(jìn)展[J]. 果樹學(xué)報(bào),2021, 38 (9): 1590-1599.

HE Fuxian, MENG Qinghua, TANG Liu, et al. Research progress of hyperspectral imaging technology in fruit quality detection [J]. Journal of Fruit Science, 2021, 38 (9): 1590-1599.

[12] 劉金秀,賀小偉,羅華平,等. 基于高光譜成像技術(shù)的小白杏成熟度判別模型[J]. 食品研究與開發(fā),2022, 43(15): 158-165.

LIU Jinxiu, HE Xiaowei, LUO Huaping, et al. Prunus Armeniaca maturity discrimination model based on hyperspectral imaging technology[J]. Food Research and Development, 2022, 43(15): 158-165.

[13] 胡逸磊,姜洪喆,周宏平,等. 高光譜成像技術(shù)檢測油茶果成熟度[J]. 食品科學(xué),2022, 43(16): 324-331.

HU Yilei, JIANG Hongzhe, ZHOU Hongping, et al. Detection of Camellia oleifera fruit maturity by hyperspectral imaging [J]. Food Science, 2022, 43(16): 324-331.

[14] 楊小玲,由昭紅,成芳. 高光譜成像技術(shù)檢測玉米種子成熟度[J]. 光譜學(xué)與光譜分析,2016, 36(12): 4028-4033.

YANG Xiaoling, YOU Zhaohong, CHENG Fang. Detection of corn seed maturity by hyperspectral imaging [J]. Spectroscopy and Spectral Analysis, 2016, 36(12): 4028-4033.

[15] 李智慧,梅吉帆,李輝,等. 高光譜成像的非煙物質(zhì)分類識(shí)別研究[J]. 中國煙草學(xué)報(bào),2022, 28 (3): 81-88.

LI Zhihui, MEI Jifan, LI Hui, et al. Classification and identification of non-smoking substances by hyperspectral imaging [J]. Acta Tabacaria Sinica, 2022, 28 (3): 81-88.

[16] 張慧,張文偉,張永毅,等. 基于高光譜與紋理融合的烤煙分類方法研究[J]. 中國煙草學(xué)報(bào),2022, 28 (3): 72-80.

ZHANG Hui, ZHANG Wenwei, ZHANG Yongyi, et al. Study on classification method of flue-cured tobacco based on hyperspectral and texture fusion [J]. Acta Tabacaria Sinica, 2022, 28 (3): 72-80.

[17] 張龍,馬嘯宇,王銳亮,等. 高光譜成像技術(shù)在煙葉和雜物分類中的應(yīng)用[J]. 煙草科技,2020, 53 (8): 72-78.

ZHANG Long, MA Xiaoyu, WANG Ruiliang, et al. Application of hyperspectral imaging technology in classification of tobacco leaves and sundries[J]. Tobacco Science and Technology, 2020, 53 (8): 72-78.

[18] 李鑫,湯衛(wèi)榮,張永輝,等. 基于高光譜成像技術(shù)的煙葉田間成熟度判別模型[J]. 煙草科技,2022, 55 (7): 17-24.

LI Xin, TANG Weirong, ZHANG Yonghui, et al. Evaluation model of tobacco field maturity based on hyperspectral imaging technology[J]. Tobacco Science and Technology, 2022, 55 (7): 17-24.

[19] 劉輝. 貴陽煙區(qū)煙葉成熟度對(duì)其質(zhì)量香韻影響[D]. 北京:中國農(nóng)業(yè)科學(xué)院,2020.

LIU Hui. Effect of tobacco maturity on quality and aroma note in Guiyang tobacco area[D]. Beijing: Chinese Academy of Agricultural Sciences, 2020.

[20] Degtyarev V V, Tsavdaridis K D. Buckling and ultimate load prediction models for perforated steel beams using machine learning algorithms[J]. Journal of Building Engineering, 2022, 51: 104316.

Spectral characteristics analysis and discriminating model construction of flue-cured upper tobacco leaves with different maturity based on hyperspectral imaging technology

DENG Jianqiang1, WANG Dabin2, QIAN Yan1, YIN Zhongchun1, PENG Wuxing1, LI Fuqiang1, REN Xiaohong1*

1 Enshi Tobacco Company of Hubei Province, Enshi, Hubei, 445000, China;2 Laboratory of Quality & Safety Risk Assessment for Tobacco, Ministry of Agriculture, Tobacco Research Institute of Chinese Academy of Agricultural Sciences, Qingdao, 266101, China

The purpose of this study was to investigate the hyperspectral characteristics of upper tobacco leaves at different-maturity levels and the feasibility of intelligent discrimination.In this study, a portable hyperspectral instrument was used to collect the hyperspectral imagines of upper tobacco leaves of three different-maturity levels (pre-maturity (SS), maturity (CS) and post-maturity (GS) ) and extracted their spectral data. Their spectral characteristics were studied by using correlation analysis, principal components analysis and variation analysis, and 5 models (SVM, KNN, RF, LightGBM and XGBoost) were constructed for evaluating their discriminant performances of tobacco leaf maturity.The results showed that: (1) there was a strong correlation among the bands within the visible light (400-720 nm) or the near infrared (750-1000 nm) regions, while the correlation between the two regions was weak. (2) the 5 principal components (PC1-PC5) with eigenvalues greater than 1 almost contained all the hyperspectral information. The spectral reflectance characteristics of upper tobacco leaves with different maturity levels showed significant difference in visible light, red edge and part of near infrared region (950-1000 nm). (3) Among the 5 models, SVM has the best evaluation, with precision, recall and F1 scores for the samples in 2021 above 0.95, and for the samples in 2022 and 2021+2022 above 0.93 and 0.92 respectively.The hyperspectral data of the upper tobacco leaves exhibit multicollinearity, which has excellent dimensionality reduction effects. Moreover, there are significant differences in spectral reflectance characteristics at different maturity levels. The SVM discriminant performance has good stability across different years and can be used for determining the maturity of upper tobacco leaves .

portable hyperspectral imager; upper tobacco leaf; maturity; spectral characteristics; model construction and application

. Email:370926566@qq.com

湖北省煙草公司科技項(xiàng)目“基于高光譜成像的中棵煙長勢長相及上部煙成熟度判別技術(shù)研究”(027Y2021-025)

鄧建強(qiáng)(1984—),博士,高級(jí)農(nóng)藝師,主要研究方向:植煙土壤資源利用與煙葉質(zhì)量提升,Email:djq1djq2@sina.com

任曉紅(1979—),農(nóng)藝師,主要研究方向:煙葉栽培與質(zhì)量評(píng)價(jià),Email:370926566@qq.com

2023-02-10;

2023-08-01

鄧建強(qiáng),王大彬,乾艷,等. 基于高光譜成像技術(shù)的烤煙上部煙葉成熟度光譜特征分析及判別模型構(gòu)建應(yīng)用研究[J]. 中國煙草學(xué) 報(bào),2024,30(1). DENG Jianqiang, WANG Dabin, QIAN Yan, et al. Spectral characteristics analysis and discriminating model construction of flue-cured upper tobacco leaves with different maturity based on hyperspectral imaging technology[J]. Acta Tabacaria Sinica, 2024,30(1). doi:10.16472/j.chinatobacco.2023.T0014

猜你喜歡
成熟度波段煙葉
產(chǎn)品制造成熟度在型號(hào)批生產(chǎn)風(fēng)險(xiǎn)管理中的應(yīng)用
整機(jī)產(chǎn)品成熟度模型研究與建立
關(guān)于新形勢下煙葉生產(chǎn)可持續(xù)發(fā)展的思考
不同成熟度野生水茄果實(shí)的種子萌發(fā)差異研究
剛好夠吃6天的香蕉
煙葉主要真菌病害的發(fā)生與防治
M87的多波段輻射過程及其能譜擬合
日常維護(hù)對(duì)L 波段雷達(dá)的重要性
一種降低造紙法再造煙葉平滑度的方法
基于SPOT影像的最佳波段組合選取研究