国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于GA-PLS-SPA的辣椒葉片葉綠素含量高光譜估測

2024-05-22 19:49:21彭俊杰汪泓王宇肖玖軍李可相邢丹
江蘇農(nóng)業(yè)科學(xué) 2024年7期
關(guān)鍵詞:葉綠素辣椒

彭俊杰 汪泓 王宇 肖玖軍 李可相 邢丹

彭俊杰,汪 泓,王 宇,等. 基于GA-PLS-SPA的辣椒葉片葉綠素含量高光譜估測[J]. 江蘇農(nóng)業(yè)科學(xué),2024,52(7):184-192.

doi:10.15889/j.issn.1002-1302.2024.07.025

(1.貴州大學(xué)礦業(yè)學(xué)院,貴州貴陽 550025; 2.貴州省山地資源研究所,貴州貴陽 550001; 3.貴州省土地綠色整治工程研究中心,貴州貴陽 550001; 4.貴州省農(nóng)業(yè)科學(xué)院辣椒研究所,貴州貴陽 550009)

摘要:葉綠素對辣椒的長勢評估和營養(yǎng)狀況管理具有重要的意義,針對高光譜存在數(shù)據(jù)量大和冗余度高的問題,探究不同特征選擇算法相結(jié)合進行高光譜葉綠素含量估測的可行性。以貴州省遵義市栽培辣椒為研究對象,采集盛果期辣椒冠層高光譜數(shù)據(jù),通過卷積平滑(SG)、一階微分(FD)、二階微分(SD)和多元散射校正(MSC)處理原始光譜數(shù)據(jù),比較不同預(yù)處理方法下的貝葉斯優(yōu)化隨機森林(BO-RF)估測效果,以MSC預(yù)處理后的數(shù)據(jù)為基礎(chǔ),運用遺傳偏最小二乘算法結(jié)合連續(xù)投影算法(GA-PLS-SPA)進行最優(yōu)特征波段選取,最后以GA-PLS、SPA和GA-PLS-SPA分別選取的特征波段作為輸入變量,建立BO-RF、RF和BP神經(jīng)網(wǎng)絡(luò)模型來驗證GA-PLS-SPA的普適性和廣泛性。結(jié)果表明,MSC相比其他預(yù)處理方法對葉綠素含量的反演效果最好;相同估測模型條件下,基于GA-PLS-SPA建立的估測模型精度最高,選取特征波段數(shù)量最少,為7個,GA-PLS-SPA-BO-RF是估測葉綠素含量的最佳模型,訓(xùn)練集的R2、RMSE和RPD分別為0.896、2.791和3.124,測試集的R2、RMSE和RPD分別為0.913、2.965和3.414;相同算法建模條件下,BO-RF的精度明顯高于RF和BP神經(jīng)網(wǎng)絡(luò)。MSC處理后的光譜能極大程度提取出辣椒葉片的葉綠素信息,GA-PLS-SPA能有效實現(xiàn)特征波段選取,降低模型復(fù)雜度,BO-RF具有良好的葉綠素含量反演能力。

關(guān)鍵詞:辣椒;葉綠素;高光譜波段選擇;遺傳偏最小二乘算法;連續(xù)投影算法;貝葉斯優(yōu)化隨機森林

中圖分類號:S127;641.301? 文獻標志碼:A? 文章編號:1002-1302(2024)07-0184-08

葉綠素含量是作物的重要生理生化參數(shù),是進行光合作用的重要物質(zhì),能反映作物的生長狀況,是重要的長勢監(jiān)測指標,因此,快速、精準地監(jiān)測葉綠素含量對田間生產(chǎn)具有科學(xué)指導(dǎo)意義[1]。傳統(tǒng)葉綠素含量測定方法存在破壞性、價格昂貴和費時等特點,便攜式葉綠素儀通常用于測定植物葉片的SPAD值,可以在不破壞植物的情況下快速精確測定葉綠素含量。高光譜遙感因其提供了快速、無損、及時的數(shù)據(jù)采集方法,被廣泛用于精確葉綠素含量測定[2]。SPAD值只能反映植株個體水平,實際監(jiān)測作物群體長勢相對耗時,因此,分析作物光譜信息與植株個體SPAD值之間的關(guān)系,對于快速估算SPAD值和發(fā)展精準農(nóng)業(yè)具有重要意義[3]。

辣椒種植和加工產(chǎn)業(yè)是貴州省的優(yōu)勢產(chǎn)業(yè),其產(chǎn)加銷規(guī)模位居全國首位,是賦能鄉(xiāng)村振興的重要抓手,然而目前對于高光譜葉綠素含量估測的研究主要集中在水稻、小麥和棉花等作物上,關(guān)于辣椒葉片葉綠素含量估測的研究較少,因此有必要進行相關(guān)探討[4-6]。針對辣椒葉片葉綠素含量估測研究方法較少和研究內(nèi)容不夠豐富等問題,蔣煥煜等利用近紅外漫反射全波段范圍內(nèi)原始光譜結(jié)合偏最小二乘法(PLS)構(gòu)建了尖椒葉片葉綠素含量估測模型[7]。郭宏亮等使用多元線性回歸分別建立辣椒葉片葉綠素a、葉綠素b含量的檢測模型并進行對比,但是該模型存在可能會丟失部分有用光譜信息或回歸過程中沒有考慮光譜矩陣中的噪聲導(dǎo)致過擬合情況[8]。以往的研究主要采用單波段和多波段植被指數(shù)或全光譜數(shù)據(jù)建立的機器學(xué)習(xí)模型來估測葉綠素含量,然而采用全光譜數(shù)據(jù)時未考慮各波段間的共線性,難以解決光譜數(shù)據(jù)的冗余問題,而使用單一敏感波段時未考慮到其他波段,會造成光譜數(shù)據(jù)的浪費[9]。因此,對高光譜數(shù)據(jù)進行特征波段選取是提高模型精度、降低模型復(fù)雜度的必要條件。遺傳算法(GA)、遺傳偏最小二乘算法(GA-PLS)和連續(xù)投影算法(SPA)是常見的特征選取算法,GA是一種模擬自然進化搜索全局最優(yōu)解的方法,GA-PLS綜合了GA的全局優(yōu)化搜索能力和PLS可有效解決變量間多重共線性問題的能力,SPA不僅能夠減少參與建模的光譜波段個數(shù),而且能夠保證特征波段之間的共線性最小,從而提高建模效率[10-11]。目前在葉綠素含量估測研究中,利用特征選取算法相互結(jié)合進行波段選取的研究較少,劉潭等提出一種融合相關(guān)系數(shù)法、連續(xù)投影算法和隨機蛙跳算法的算法來選取特征波段,并證明融合后的算法所建立的葉綠素含量估測模型精度更高[12]。高洪燕等在對生菜冠層氮素含量進行檢測的研究中提出,BiPLS-GA-SPA 3種算法聯(lián)用能極大程度去除光譜和相鄰變量間的共線性[13]。章海亮等提出,遺傳算法結(jié)合連續(xù)投影算法挑選的特征波長可以應(yīng)用于近紅外光譜檢測土壤有機質(zhì)含量[14]。以上研究表明,特征選取算法組合使用的效果比單一算法好,能最大程度提高模型精度和簡化模型。

合適的光譜預(yù)處理方法,可以有效降低光譜中的噪聲信息,提高模型的穩(wěn)健性[15]。趙菡利用多項式基線扣除、多元散射校正(MSC)和卷積平滑(SG)等光譜變換方法結(jié)合XGBoost構(gòu)建蘋果葉片生化參數(shù)反演模型,提出SG-MSC-SPA-XGBoost算法組合反演效果最好[16]。楊曉宇等利用標準正態(tài)變量變換(SNV)、MSC、光譜一階微分(FD)和二階微分(SD)4種方法對高光譜數(shù)據(jù)進行預(yù)處理并進行對比分析,提出MSC能有效降低原始光譜噪聲,增強光譜反射率與土壤屬性間的相關(guān)性[17]。以上研究表明,MSC能有效去除光譜散射影響,提高模型精度和普適性。隨機森林是基于多棵回歸樹的集成學(xué)習(xí)模型,較單棵決策樹回歸具有更高的估測精度和更好的泛化性能,是目前應(yīng)用于反演研究較多的機器學(xué)習(xí)模型[18-20]。貝葉斯優(yōu)化框架只需經(jīng)過少數(shù)次的目標函數(shù)評估即可獲得理想解,對于求解目標函數(shù)表達式未知、非凸的復(fù)雜優(yōu)化問題,貝葉斯優(yōu)化是一種有效方法[21]。然而,BO-RF在葉綠素反演研究中的應(yīng)用還鮮有報道。

本研究以貴州省遵義市栽種的辣椒為研究對象,測定SPAD值和冠層高光譜數(shù)據(jù),首先利用SG、FD、SD和MSC 4種光譜變換方法對原始光譜進行處理,并對比分析出最佳預(yù)處理方法,然后引入GA-PLS結(jié)合SPA算法選取最優(yōu)特征波段,最后以最優(yōu)特征波段為輸入變量,構(gòu)建貝葉斯優(yōu)化隨機森林(BO-RF)、隨機森林(RF)和BP神經(jīng)網(wǎng)絡(luò)(反向傳播網(wǎng)絡(luò))3個模型進行辣椒葉片葉綠素含量估測研究,以對比分析貝葉斯優(yōu)化模型相比傳統(tǒng)機器學(xué)習(xí)模型的優(yōu)越性,驗證GA-PLS-SPA方法的普適性和泛化性。

1 材料與方法

1.1 研究區(qū)概況與試驗設(shè)計

研究時間為2021年9月6日(辣椒盛果期)。研究地點位于貴州省遵義市新蒲新區(qū)貴州省農(nóng)業(yè)科學(xué)院辣椒研究所官莊示范基地(104°18′20″E,25°19′44″N),屬于亞熱帶高原季風(fēng)濕潤性氣候區(qū),海拔高度為 800~1 150 m,日照充足,年降水量約為1 200 mm,氣候、土壤等自然條件十分適合辣椒栽培。研究區(qū)采用2因素裂區(qū)設(shè)計,主要種植黔椒8號、紅辣18號、辣研101號和紅全球4個辣椒品種,種植時間為2021年4月9日。

1.2 數(shù)據(jù)獲取與處理

1.2.1 辣椒葉片SPAD值測定

采用日本生產(chǎn)的SPAD-502葉綠素儀測定辣椒葉片SPAD值。測定時避開葉脈和不平整區(qū)域,在每張葉片上、中、下部分分別測定6~10次,然后取平均值作為樣本實測值。

1.2.2 高光譜數(shù)據(jù)測定

采用美國ASD FieldSpec4 Standard-Res便攜式地物光譜儀對辣椒冠層光譜信號予以測定,光譜范圍為350~2 500 nm,取樣間隔為1 nm。天氣晴朗無風(fēng),采集時間為10:00—15:00。傳感器探頭垂直于植被,距離葉片高度15~30 cm,每采集5株植株進行白板校正,每株植株重復(fù)測量5次,取平均值作為該樣本的反射率。

1.2.3 高光譜數(shù)據(jù)預(yù)處理

由于葉綠素主要與高光譜的可見光和近紅外波段有相關(guān)性,因此選取的試驗光譜區(qū)域為400~1 000 nm。為減少外界噪聲影響和突出辣椒光譜曲線的特征信息,對原始光譜進行SG處理、并在SG處理的基礎(chǔ)上分別進行MSC、FD和SD預(yù)處理,所有預(yù)處理過程均在Matlab R2020b中完成。

1.3 特征波段選取

1.3.1 遺傳偏最小二乘算法

GA-PLS是通過結(jié)合遺傳算法全局尋優(yōu)和偏最小二乘法消除共線性的特點,實現(xiàn)對光譜數(shù)據(jù)的特征參數(shù)選擇[2,22]。本研究以SPAD值為優(yōu)化目標,葉片光譜數(shù)據(jù)為基因,進行二進制編碼,隨機生成初始種群,再將偏最小二乘算法中交叉均方根驗證誤差(RMSECV)作為遺傳算法中的適應(yīng)度函數(shù),并使用遺傳算法進行變量篩選。GA-PLS的結(jié)果具有隨機性,因此重復(fù)執(zhí)行10次,再根據(jù)貢獻率高、RMSECV值小的篩選原則選取特征波段。

1.3.2 連續(xù)投影算法

SPA能基于相關(guān)性計算快速選擇低冗余有效波長[23-24]。這種方法能最大程度消除光譜信息冗余和特征波段之間的共線性影響,提高模型運行效率和估測精度。本研究通過GA-PLS第1次特征選取獲得有效特征波段,再利用SPA進行第2次特征波段選取,使最大投影向量所對應(yīng)的波段為有效特征波段,消除了通過GA-PLS篩選出的變量子集中可能包含的冗余變量。SPA和GA-PLS均通過Matlab R2020b完成。

1.4 模型構(gòu)建及精度驗證

1.4.1 模型構(gòu)建

本研究以GA-PLS-SPA篩選后的最優(yōu)特征光譜為輸入變量,葉綠素含量實測值為輸出變量,通過Matlab R2020b分別構(gòu)建貝葉斯優(yōu)化隨機森林(BO-RF)、隨機森林(RF)和BP神經(jīng)網(wǎng)絡(luò)3種回歸模型,首先利用貝葉斯優(yōu)化隨機森林對比分析不同光譜預(yù)處理對辣椒葉片葉綠素含量的估測效果,獲得最優(yōu)光譜預(yù)處理方法,然后利用上述3種模型對比分析GA-PLS結(jié)合SPA對葉綠素含量的估測效果和該方法的適用性和普適性。

RF具有非常強的擬合能力,建模速度快,處理大數(shù)據(jù)集(高光譜數(shù)據(jù))時非常高效,而且算法對于結(jié)果具有可解釋性,在解決反演問題方面具有獨特的優(yōu)勢[25]。RF善于處理變量間的非線性關(guān)系,但其估測性能受回歸樹棵數(shù)、回歸樹最大深度、節(jié)點劃分所需最小樣本數(shù)、葉子節(jié)點最小樣本數(shù)等參數(shù)的影響[18]。本研究中隨機森林的超參數(shù)設(shè)置為n_estimators=100,max_depths=3,其他參數(shù)采用隨機森林默認值。

超參數(shù)優(yōu)化能有效提高機器學(xué)習(xí)模型精度,貝葉斯優(yōu)化是高效的全局優(yōu)化算法,可以在短時間內(nèi)獲得最優(yōu)超參數(shù)值。其在優(yōu)化過程中利用了貝葉斯定理[26]:

p(f|1 ∶t)=p(M1 ∶t|f)p(f)p(M1 ∶t);(1)

1 ∶t= {(x1,y1),(x2,y2),…,(xt,yt)};?(2)

yt=f(xt)+εt。(3)

式中:f表示參數(shù)模型中的參數(shù),M1 ∶t表示已觀測集合;xt表示決策向量;yt表示觀測值;εt表示觀測誤差;p(M1 ∶t|f)表示近似分布;p(f)表示f的先驗概率分布;p(M1 ∶t)表示邊際化f的邊際似然分布;p(f|M1 ∶t) 表示f的后驗概率分布。

貝葉斯優(yōu)化采用迭代的方式執(zhí)行優(yōu)化流程,首先隨機生成初始化點,然后將選定的評估點值代入目標函數(shù)求出函數(shù)值,形成新的觀測值點來擴充歷史觀測集,并根據(jù)新的觀測集更新概率代理模型,為下一次迭代做準備;重復(fù)上述過程,直到滿足精度要求[18]。本研究以高斯過程為概率代理模型,交叉驗證精度為目標函數(shù),重復(fù)優(yōu)化迭代多次尋找最優(yōu)超參數(shù)。貝葉斯進行隨機森林超參數(shù)優(yōu)化的結(jié)果為n_estimators=120,max_depths=6,其他參數(shù)采用隨機森林默認值。

BP神經(jīng)網(wǎng)絡(luò)是一種具有良好非線性映射能力的神經(jīng)網(wǎng)絡(luò)[27]。國內(nèi)外一些研究人員已經(jīng)使用BP神經(jīng)網(wǎng)絡(luò)建立了作物葉綠素含量估測模型,并取得了良好的效果。模型主要參數(shù)設(shè)置為訓(xùn)練均方根誤差小于1×10-5,學(xué)習(xí)率為0.01。

1.4.2 精度驗證

本研究選用決定系數(shù)(R2)、均方根誤差(RMSE)和相對分析誤差(RPD)作為模型精度評價指標。R2用來評價模型的穩(wěn)定性,R2越接近1,說明模型穩(wěn)定性越好;RPD和RMSE用來評價模型的估測能力,RMSE越小模型估測能力越強;當(dāng)RPD<1.4時,表示模型不能估測樣本;當(dāng)1.4≤RPD<2.0時,表示模型可以對樣本進行大致估計,可以通過對模型進行改進,提高模型的估測能力;當(dāng)RPD≥2.0時,表示該模型魯棒性較強[28]。具體公式見式(4)~式(6)。

RMSE=∑ni=1(y^i-y^)2[]n;?(4)

R2=1-∑n[]i=1(y[DD(-*1]^i-yi)2[]∑n[]i=1(yi-y)2 ;(5)

RPD=SD[]RMSE。(6)

式中:n表示樣本數(shù);y^i為估測值;yi為實測值;y為樣品均值;SD表示估測樣本的標準差。

2 結(jié)果與分析

2.1 辣椒SPAD值統(tǒng)計分析

本研究共采集80株植株作為有效研究樣本,每株植株為1個樣本,采用最小距離算法(KS)劃分數(shù)據(jù)集,選取75%的樣本數(shù)據(jù)(60株)用來訓(xùn)練模型,25%(20株)用來測試模型,劃分結(jié)果如表1所示。訓(xùn)練集樣品的辣椒葉片SPAD值范圍為37.0~76.5,均值為61.42,標準差為8.66;測試集樣品的辣椒葉片SPAD值范圍為37.0~71.9,均值為61.04,標準差為10.07,訓(xùn)練集和測試集樣本的變異系數(shù)分別為14.10%和16.50%,變異系數(shù)均小于20%,變異程度較小,樣本劃分合理。

2.2 原始光譜和光譜預(yù)處理分析

為分析不同高光譜預(yù)處理方法對辣椒葉片葉綠素含量估測模型的影響,分別對原始光譜進行SG、FD、SD和MSC 4種預(yù)處理,原始光譜和預(yù)處理后的光譜如圖1所示,不同預(yù)處理方法下的模型估測結(jié)果如表2所示。由圖1-a可知,辣椒葉片的原始光譜曲線與典型植被光譜曲線的變化趨勢基本相同,具有明顯的變化規(guī)律,即可見光波段(400~780 nm)反射率較低,光譜曲線大量重疊,近紅外波段(780~1 000 nm)反射率較高,然而光譜反射率值差異較大,其中在400~500 nm和600~680 nm波段內(nèi)出現(xiàn)葉綠素強吸收帶,綠光波段(550 nm)出現(xiàn)反射峰,680~760 nm波段隨波長增加反射率急劇上升,760~1 000 nm波段形成植被特有的高反射率平臺。通過圖1-b至圖1-e可知,SG、FD、SD和MSC 4種預(yù)處理均可在不同程度上消除原始光譜的基線平移和漂移問題,減少因環(huán)境、儀器自身等因素造成的背景噪聲,增強部分波段反射率。

由表2可知,通過原始光譜建模的訓(xùn)練集和測試集的R2分別為0.786和0.534,RPD分別為2.160和1.473,說明原始光譜存在一定的噪聲影響,模型存在過擬合現(xiàn)象。進行SG、FD、SD和MSC這4種預(yù)處理后,模型的估測精度都有一定程度的提高,均能較好地實現(xiàn)葉綠素含量估測,其中MSC預(yù)處理后的估測精度最高,訓(xùn)練集和測試集的R2均大于0.8,RPD均在2.5左右,說明MSC預(yù)處理能最大程度消除光譜散射影響;SD預(yù)處理后的估測精度最低,訓(xùn)練集和測試集的R2均小于0.75,RPD均在2左右。FD和SD預(yù)處理后的建模精度比MSC處理后的建模精度低,說明整數(shù)階微分會忽略一些與葉綠素含量相關(guān)的信息,造成光譜信息丟失或背景噪聲放大,影響模型性能[29-30]。因此,將MSC預(yù)處理后的光譜作為后續(xù)分析研究特征波段選取的基礎(chǔ)。

2.3 特征波段選取結(jié)果分析

2.3.1 GA-PLS選取特征波段分析

高光譜數(shù)據(jù)具有信息冗余和波譜間信息重疊的特征,需要進行特征波段選取,以減少建模波段數(shù)并提升估測精度。本研究利用GA-PLS對MSC處理后的辣椒葉片反射光譜(400~1 000 nm)進行第1次特征波段選取,共計選取601個波段,GA-PLS返回貢獻率及RMSECV結(jié)果如表3所示。由表3可知,共篩選了4個波段數(shù),分別為9、17、49、126個波段,對應(yīng)的貢獻率均達到99%以上,對應(yīng)的RMSECV值最大為0.075,最小為0.071。當(dāng)49個波段被選用時,貢獻率最大,為99.486%,RMSECV值最小,為0.071,根據(jù)貢獻率高、RMSECV值小的篩選原則,選擇49個特征波段用于后續(xù)連續(xù)投影算法研究。圖2表示GA-PLS所選取特征波段在MSC光譜曲線上的分布情況。綜合分析來看,GA-PLS具有良好的全局搜索和信息提取能力,選取49個特征波段,被剔除波段數(shù)占總波段數(shù)的91.847%,可以最大程度消除無用波段;所選特征波段分布在550 nm和 700 nm 附近以及近紅外波段,集中在可見光波段內(nèi)的特征波段較多,說明此處含有與葉綠素相關(guān)的信息較多,但也可能含有少量冗余信息,因此被選取的49個特征波段不是最優(yōu)特征波段數(shù)。

2.3.2 GA-PLS-SPA選取特征波段分析

為了進一步簡化模型和減少冗余信息以提高模型精度,在GA-PLS篩選出49個波段的基礎(chǔ)上,利用SPA進行第2次特征波段選取。GA-PLS-SPA所選取特征波段在MSC光譜曲線上的分布情況如圖3-a所示。由圖3-a可知,通過SPA算法進一步篩選后,被選特征波段數(shù)量大幅減少,共選出7個波段,占GA-PLS選取波段總數(shù)的14.286%,占MSC光譜波段總數(shù)的1.165%,即原始MSC光譜數(shù)據(jù)的壓縮率為98.835%,輸入變量減少的同時簡化了模型結(jié)構(gòu);GA-PLS-SPA選取出的7個最優(yōu)特征波段為524、598、644、685、712、784、903 nm,所選波段分布在綠峰(500~600 nm)、紅邊(700 nm左右)和近紅外波段(780~1 000 nm)處,其中位于可見光波段內(nèi)的特征波段最多,有5個波段,位于近紅外波段內(nèi)的特征波段最少,有2個波段。圖3-b表示利用SPA對MSC光譜選取特征波段的結(jié)果,可以看出,SPA選取特征波段數(shù)為78個,被剔除波段數(shù)占總波段數(shù)的87.022%,所選特征波段集中在可見光和近紅外波段,說明直接利用SPA對MSC原始光譜進行波段特征選取可以在一定程度上消除冗余波段,但不能明顯確定對辣椒葉片葉綠素敏感性強的波段。

2.4 葉綠素含量估測模型結(jié)果與分析

表4是基于不同特征選取方法的不同回歸模型的估測結(jié)果,可以看出,通過SPA、GA-PLS和GA-PLS-SPA構(gòu)建的回歸模型均能在一定程度上提高模型精度和減少需要輸入的特征波段數(shù)量?;贛SC全光譜建模中BO-RF精度最高,訓(xùn)練集R2、RMSE和RPD分別為0.839、3.472和2.498,測試集R2、RMSE和RPD分別為0.838、4.055和2.507,RF和BP精度偏低,估測效果一般,RPD均小于2,說明全光譜數(shù)據(jù)量大且含有冗余信息較多,需要進行特征波段優(yōu)選?;赟PA或者GA-PLS建模中BO-RF、RF和BP 3個模型均能達到估測辣椒葉片葉綠素含量的要求,其中BO-RF模型效果最好,RF和BP效果表現(xiàn)一般,RF和BP訓(xùn)練集的R2均小于0.82,RMSE最小為3.743,RPD范圍為2.091~2.313,測試集的R2均小于0.81,RMSE最小為4.404,RPD范圍為2.042~2.286?;贕A-PLS-SPA建模中BO-RF、RF和BP 3個模型精度均得到顯著提高并且明顯高于全光譜、SPA或GA-PLS建模,其中BO-RF模型精度最優(yōu),訓(xùn)練集的R2、RMSE和RPD分別為0.896、2.791和3.124,測試集的R2、RMSE和RPD分別為0.913、2.965和3.414。說明SPA和GA-PLS選取出的特征波段還含有不同程度的冗余信息,波段間存在信息重疊,GA-PLS-SPA通過2次特征波段選取進一步消除了冗余信息,選出的波段更具有代表性,模型也大大簡化。

綜上所述,GA-PLS-SPA是一種高效的特征波段選取方法,BO-RF在反演葉綠素含量方面具有極大的優(yōu)越性,兩者結(jié)合構(gòu)建的辣椒葉片葉綠素含量反演模型的估測效果明顯優(yōu)于RF或BP建立的模型,GA-PLS-SPA-BO-RF可有效提高建模效率和精度。圖4表示GA-PLS-SPA-BO-RF模型的訓(xùn)練集和測試集散點分布。

3 討論與結(jié)論

3.1 討論

本研究結(jié)果顯示,辣椒葉片的原始光譜曲線符合綠色植物葉片光譜曲線的變化規(guī)律,即在葉綠素和類胡蘿卜素的強吸收帶(400~490 nm)處反射率較低;在綠光波段,葉綠素的強反射導(dǎo)致光譜曲線出現(xiàn)波峰;在近紅外波段反射率急劇上升后出現(xiàn)反射率平臺,這可能與葉綠素對紅光波段強烈吸收和近紅外波段在葉片內(nèi)部多次散射而形成強反射有關(guān)[31]。卷積平滑、多元散射校正、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)4種光譜預(yù)處理方法可有效提高模型估測精度,其中基于多元散射校正方法構(gòu)建的模型精度最高。這主要是因為多元散射校正解決了冠層反射光譜絕對強度差異大,光譜間存在基線平移和偏移的問題,增強了與葉綠素相關(guān)的有效信息,提高了光譜信噪比,這與毛博慧等研究得出的結(jié)論[32-33]一致。對復(fù)雜樣品的光譜數(shù)據(jù)進行分析時,雖然多種預(yù)處理方法可以被用于數(shù)據(jù)的預(yù)處理,但找到一種最佳的預(yù)處理方法是很重要的工作[34]。

GA-PLS、SPA、GA-PLS-SPA分別選擇了49、78、7個特征波段進行建模。結(jié)果表明,對高光譜數(shù)據(jù)進行特征波段選取,可在提升模型精度的同時簡化模型結(jié)構(gòu),而且GA-PLS-SPA建模效果要優(yōu)于單一的GA-PLS或SPA建模。這是因為高光譜能帶來豐富光譜信息的同時,也帶來了信息冗余,需要進行特征波段選?。?5-36]。相關(guān)研究表明,SPA篩選出的波段子集中可能包含一些無信息波段甚至是干擾波段,不能保證選取出的波段之間共線性最小[37-38]。GA-PLS具有良好的全局搜索能力和信息提取能力,通過GA-PLS在全光譜范圍內(nèi)選取特征波段構(gòu)成SPA的候選集,然后在此基礎(chǔ)上進行SPA特征波段選取,避免了SPA選擇結(jié)果中包含無信息波段和干擾波段。本研究所選取的特征波段分布在綠峰(500~600 nm)、紅邊(700 nm左右)和近紅外波段(780~1 000 nm)處,與前人的研究基本相同,然而具體特征波段不同[2,32]。這是因為辣椒品種和果實顏色不同會造成所選具體特征波段不同,并且辣椒葉片光譜內(nèi)可能存在土壤和雜草等干擾物造成的背景噪聲。

傳統(tǒng)線性回歸模型可能會忽略高光譜與葉綠素的非線性關(guān)系,導(dǎo)致估測模型精度受到影響[39]。因此,本研究利用貝葉斯優(yōu)化隨機森林方法,輸入通過GA-PLS-SPA選取的7個最優(yōu)特征波段,建立辣椒葉片葉綠素含量估測模型。由結(jié)果可知,BO-RF 模型的精度明顯高于RF模型,這主要是因為貝葉斯優(yōu)化調(diào)節(jié)了n_estimators和max_depths等對隨機森林模型性能影響較大的超參數(shù),并且貝葉斯優(yōu)化迭代次數(shù)少,收斂速度快,適合小維度的調(diào)參需求。

3.2 結(jié)論

本研究以80個辣椒葉片的SPAD值為研究對象,對原始光譜進行SG、FD、SD和MSC 4種預(yù)處理,并進行對比分析,提出結(jié)合GA-PLS和SPA選取最優(yōu)特征波段,并與全光譜、SPA和GA-PLS進行比較,同時構(gòu)建了BO-RF、RF和BP估測模型,主要結(jié)論如下:

(1)SG、FD、SD和MSC 4種預(yù)處理均在不同程度上提高了模型精度,其中利用MSC預(yù)處理后的光譜數(shù)據(jù)建立的模型精度最高,說明MSC能有效解決基線偏移和漂移問題,是一種能有效提高建模精度的光譜預(yù)處理方法。

(2)GA-PLS-SPA選取的7個最優(yōu)特征波長建模精度最高,并且構(gòu)建的BO-RF、RF和BP 3個模型均能實現(xiàn)辣椒葉片葉綠素含量估測,其中GA-PLS-SPA-BO-RF精度最高,訓(xùn)練集的R2、RMSE和RPD分別為0.896、2.791和3.124,測試集的R2、RMSE和RPD分別為0.913、2.965和3.414。表明GA-PLS-SPA能提高模型精度的同時簡化模型復(fù)雜度,是一種具有強泛化性和適用性的特征波長選取算法。

(3)在相同特征波段建模時,BO-RF模型的精度比RF模型高,說明貝葉斯優(yōu)化可以避免不必要的參數(shù)評估,能有效解決RF模型的局部最優(yōu)問題,提高RF模型的性能。

本研究僅針對辣椒盛果期的葉綠素含量進行研究和模型構(gòu)建,同時樣本數(shù)量還不夠豐富,未來將繼續(xù)研究關(guān)于不同品種或相同品種不同生育期的辣椒葉片葉綠素含量估測方法。

參考文獻:

[1]馮海寬,陶惠林,趙 鈺,等. 利用無人機高光譜估算冬小麥葉綠素含量[J]. 光譜學(xué)與光譜分析,2022,42(11):3575-3580.

[2]Chen X W,Dong Z Y,Liu J B,et al. Hyperspectral characteristics and quantitative analysis of leaf chlorophyll by reflectance spectroscopy based on a genetic algorithm in combination with partial least squares regression[J]. Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2020,243:118786.

[3]武改紅,馮美臣,楊武德,等. 冬小麥葉片SPAD值高光譜估測的預(yù)處理方法[J]. 生態(tài)學(xué)雜志,2018,37(5):1589-1594.

[4]Ban S T,Liu W Z,Tian M L,et al. Rice leaf chlorophyll content estimation using UAV-based spectral images in different regions[J]. Agronomy,2022,12(11):2832.

[5]Wang T L,Gao M F,Cao C L,et al. Winter wheat chlorophyll content retrieval based on machine learning using in situ hyperspectral data[J]. Computers and Electronics in Agriculture,2022,193:106728.

[6]Xiao Q L,Tang W T,Zhang C,et al. Spectral preprocessing combined with deep transfer learning to evaluate chlorophyll content in cotton leaves[J]. Plant Phenomics,2022,2022:9813841.

[7]蔣煥煜,應(yīng)義斌. 尖椒葉片葉綠素含量的近紅外檢測分析實驗研究[J]. 光譜學(xué)與光譜分析,2007,27(3):499-502.

[8]郭宏亮,黃 帥,聶楚楚,等. 基于分光吸收特性的辣椒葉片葉綠素含量測量方法研究[J]. 東北農(nóng)業(yè)科學(xué),2021,46(5):82-86.

[9]肖志云,王伊凝. 基于RF-VR的紫丁香葉片葉綠素含量高光譜反演[J]. 浙江農(nóng)業(yè)學(xué)報,2021,33(11):2164-2173.

[10]王玉娜,李粉玲,王偉東,等. 基于連續(xù)投影算法和光譜變換的冬小麥生物量高光譜遙感估算[J]. 麥類作物學(xué)報,2020,40(11):1389-1398.

[11]蔡建楠,劉海龍,姜 波,等. 基于GA-PLS算法的河網(wǎng)水體化學(xué)需氧量高光譜反演[J]. 灌溉排水學(xué)報,2020,39(9):126-131.

[12]劉 潭,許童羽,于豐華,等. 改進特征波段選取和混合集成建模的東北粳稻葉綠素含量估算[J]. 光譜學(xué)與光譜分析,2021,41(8):2556-2564.

[13]高洪燕,毛罕平,張曉東. 光譜技術(shù)結(jié)合BiPLS-GA-SPA和ELM算法的生菜冠層氮素含量檢測研究[J]. 光譜學(xué)與光譜分析,2016,36(2):491-495.

[14]章海亮,羅 微,劉雪梅,等. 應(yīng)用遺傳算法結(jié)合連續(xù)投影算法近紅外光譜檢測土壤有機質(zhì)研究[J]. 光譜學(xué)與光譜分析,2017,37(2):584-587.

[15]劉燕德,程夢杰,郝 勇,等. 柑橘葉片葉綠素含量拉曼光譜定量分析方法研究[J]. 光譜學(xué)與光譜分析,2019,39(6):1768-1772.

[16]趙 菡. 蘋果葉片高光譜生化參數(shù)高通量反演模型研究[D]. 阿拉爾市:塔里木大學(xué),2022:38-66.

[17]楊曉宇,包妮沙,曹 粵,等. 基于無人機成像光譜技術(shù)的農(nóng)田土壤養(yǎng)分估測及制圖[J]. 地理與地理信息科學(xué),2021,37(5):38-45.

[18]楊練兵,陳春波,鄭宏偉,等. 基于優(yōu)化隨機森林回歸模型的土壤鹽漬化反演[J]. 地球信息科學(xué)學(xué)報,2021,23(9):1662-1674.

[19]陳 瀾,常慶瑞,高一帆,等. 獼猴桃葉片葉綠素含量高光譜估算模型研究[J]. 西北農(nóng)林科技大學(xué)學(xué)報(自然科學(xué)版),2020,48(6):79-89,98.

[20]王 慶,車熒璞,柴宏紅,等. 基于無人機影像的冠層光譜和結(jié)構(gòu)特征監(jiān)測甜菜長勢[J]. 農(nóng)業(yè)工程學(xué)報,2021,37(20):90-98.

[21]李愛民,王海隆,許有成. 優(yōu)化隨機森林算法的城市湖泊DOC質(zhì)量濃度遙感反演[J]. 鄭州大學(xué)學(xué)報(工學(xué)版),2022,43(6):90-96.

[22]Jin J,Wang Q. Evaluation of informative bands used in different PLS regressions for estimating leaf biochemical contents from hyperspectral reflectance[J]. Remote Sensing,2019,11(2):197.

[23]袁 瑩,王 偉,褚 璇,等. 光譜特征波長的SPA選取和基于SVM的玉米顆粒霉變程度定性判別[J]. 光譜學(xué)與光譜分析,2016,36(1):226-230.

[24]Wang X W,Xing X Y,Zhao M C,et al. Comparison of multispectral modeling of physiochemical attributes of greengage:Brix and pH values[J]. Food Science and Technology,2021,41(S2):611-618.

[25]由明明,常慶瑞,田明璐,等. 基于隨機森林回歸的油菜葉片SPAD值遙感估算[J]. 干旱地區(qū)農(nóng)業(yè)研究,2019,37(1):74-81.

[26]崔佳旭,楊 博. 貝葉斯優(yōu)化方法和應(yīng)用綜述[J]. 軟件學(xué)報,2018,29(10):3068-3090.

[27]Qi H X,Wu Z Y,Zhang L,et al. Monitoring of peanut leaves chlorophyll content based on drone-based multispectral image feature extraction[J]. Computers and Electronics in Agriculture,2021,187:106292.

[28]Wang F L,Yang M,Ma L F,et al. Estimation of above-ground biomass of winter wheat based on consumer-grade multi-spectral UAV[J]. Remote Sensing,2022,14(5):1251.

[29]李長春,施錦錦,馬春艷,等. 基于小波變換和分數(shù)階微分的冬小麥葉綠素含量估算[J]. 農(nóng)業(yè)機械學(xué)報,2021,52(8):172-182. [HJ2mm]

[30]Bhadra S,Sagan V,Maimaitijiang M,et al. Quantifying leaf chlorophyll concentration of Sorghum from hyperspectral data using derivative calculus and machine learning[J]. Remote Sensing,2020,12(13):2082.

[31]唐恒朋,錢曉剛,李莉婕,等. 不同施氮水平辣椒單葉光譜特征及SPAD值與葉綠素含量的相關(guān)性[J]. 西南農(nóng)業(yè)學(xué)報,2016,29(10):2324-2329.

[32]毛博慧,李民贊,孫 紅,等. 冬小麥苗期葉綠素含量檢測光譜學(xué)參數(shù)尋優(yōu)[J]. 農(nóng)業(yè)工程學(xué)報,2017,33(增刊1):164-169.

[33]Kong L J,Yu H Y,Piao Z J,et al. Study of spectral response characteristics of oilseed rape (Brassica napus) to particulate [JP3]matters based on hyper-spectral technique[J]. Phyton-International [JP]Journal of Experimental Botany,2021,90(3):1015-1030.

[34]第五鵬瑤,卞?;?,王姿方,等. 光譜預(yù)處理方法選擇研究[J]. 光譜學(xué)與光譜分析,2019,39(9):2800-2806.

[35]楊紅艷,杜健民. 高光譜遙感圖像波段選擇研究進展綜述[J]. 計算機工程與應(yīng)用,2022,58(10):1-12.

[36]Yang J,Yang S X,Zhang Y Y,et al. Improving characteristic band selection in leaf biochemical property estimation considering interrelations among biochemical parameters based on the PROSPECT-D model[J]. Optics Express,2021,29(1):400-414.

[37]程介虹,陳爭光. 基于迭代保留信息變量和連續(xù)投影的近紅外光譜波長選擇方法[J]. 分析化學(xué),2021,49(8):1402-1409.

[38]Tang R N,Chen X P,Li C.Detection of nitrogen content in rubber leaves using near-infrared (NIR) spectroscopy with correlation-based successive projections algorithm (SPA)[J]. Applied Spectroscopy,2018,72(5):740-749.

[39]于豐華,馮 帥,趙依然,等. 粳稻冠層葉綠素含量PSO-ELM高光譜遙感反演估算[J]. 華南農(nóng)業(yè)大學(xué)學(xué)報,2020,41(6):59-66.

基金項目:國家重點研發(fā)計劃(編號:2022YFD1100307);貴州省科技支撐計劃(編號:黔科合支撐[2020]1Y172號、黔科合支撐[2021]一般496號、黔科合支撐[2021]一般173號);貴州科學(xué)院青年基金(編號:黔科院J字[2018]25號)。

作者簡介:彭俊杰(1996—),男,貴州貴陽人,碩士,主要從事攝影測量與遙感方面的研究工作。E-mail:1962671749@qq.com。

通信作者:汪 泓,博士,副教授,主要從事喀斯特地區(qū)遙感與數(shù)字攝影測量方面的研究。E-mail:7653606@qq.com。

猜你喜歡
葉綠素辣椒
關(guān)于辣椒的快問快答
原來,你還是這樣的辣椒
你的辣椒結(jié)出果實了嗎?
辣椒也瘋狂
提取葉綠素
揀辣椒
中外文摘(2020年9期)2020-06-01 13:47:56
鋅對白菜和香蔥葉綠素含量的影響研究
綠色科技(2019年2期)2019-05-21 07:43:20
桃樹葉綠素含量與SPAD值呈極顯著正相關(guān)
葉綠素家族概述
秋天的樹葉為什么會變色
兰溪市| 治多县| 获嘉县| 博客| 蛟河市| 浦城县| 桓台县| 抚松县| 兴和县| 巴彦淖尔市| 成都市| 社旗县| 南通市| 西贡区| 东兴市| 潍坊市| 布尔津县| 土默特左旗| 且末县| 邵武市| 渭南市| 东宁县| 桂东县| 岗巴县| 皮山县| 长宁区| 海南省| 沙坪坝区| 宁夏| 永寿县| 克拉玛依市| 嘉兴市| 松滋市| 林甸县| 汾阳市| 龙里县| 济南市| 额济纳旗| 柞水县| 达拉特旗| 南丹县|