摘要:為實(shí)現(xiàn)枸杞冠層水分信息的快速無損監(jiān)測,以“寧杞7號”枸杞為試驗對象,測定枸杞冠層葉片光譜和葉片含水率,對原始光譜進(jìn)行一階微分和連續(xù)統(tǒng)去除2種數(shù)學(xué)變換,將獲取的原始光譜(OS)、一階微分光譜(FDS)及連續(xù)統(tǒng)去除光譜(CRS)與含水率進(jìn)行相關(guān)性分析,篩選出敏感波長并構(gòu)建預(yù)測含水率的隨機(jī)森林回歸模型(RFRM)、偏最小二乘回歸模型(PLSRM)、嶺回歸模型(RRM)及一元回歸模型(URM),最后對模型的精度進(jìn)行檢驗與評價。結(jié)果表明:從敏感波長分析,基于FDS構(gòu)建的模型,其擬合度為0.716~0.938;基于CRS構(gòu)建的模型,其擬合度為0.710~0.920;基于OS構(gòu)建的模型,其擬合度為0.710~0.874;可見,基于FDS和CRS構(gòu)建的模型,擬合度均高于基于OS構(gòu)建的模型。從模型類型分析,RFRM的擬合度最高(0.874~0.938),其次為PLSRM(0.826~0.866)和RRM(0.737~0.889),URM的擬合度最低(0.710~0.730)。綜合分析,基于一階微分光譜構(gòu)建的隨機(jī)森林回歸模型(FDS+RFRM)預(yù)測效果最優(yōu),其訓(xùn)練集和測試集的擬合度分別為0.938和0.893,檢驗集[R2、RMSE、MAE及RPD]分別為0.872、0.561、0.466和2.156。研究將光譜變換與機(jī)器學(xué)習(xí)相結(jié)合,開發(fā)一套適用于枸杞冠層葉片含水率的且預(yù)測精度很高的高光譜探測模型,為枸杞冠層含水率的監(jiān)測提供適宜高效的方法。
關(guān)鍵詞:含水率;枸杞;高光譜;偏最小二乘回歸模型;隨機(jī)森林回歸模型;嶺回歸模型
中圖分類號:S127 文獻(xiàn)標(biāo)識碼:A 文章編號:2095?5553 (2024) 11?0165?08
Prediction model for the water content of Lyceum barbarum tree canopy based on
hyperspectral transformation
Li Yongmei1, 2, Wang Hao1, 3, Zhao Hongli3, Zhang Ligen4, Zhang Pencheng1
(1. School of Civil and Hydraulic Engineering, Ningxia University, Yinchuan, 750021, China;
2. Institute of Agricultural Economy and Information Technology, Ningxia Academy of Agriculture and Forestry Sciences,
Yinchuan, 750002, China; 3. China Institute of Water Resources and Hydropower Research, Beijing, 100038, China;
4. Ningxia Academy of Building Research Co., Ltd., Yinchuan, 750021, China)
Abstract: In order to achieve rapid and nondestructive monitoring of leaf water content in the canopy of Lyceum barbarum tree, Ningqi No.7 was taken as the research object to measure the spectra and water content of Lyceum barbarum canopy leaves. Two mathematical transformations (first?derivative and continuum removal) were carried out on the original spectra. Based on the correlation analysis between the original spectrum (OS), first?derivative spectra (FDS), continuum removal spectrum (CRS) and water content, sensitive wavelengths were selected. Random forest regression models (RFRM), partial least squares regression models (PLSRM), ridge regression models (RRM) and univariate regression models (URM) were constructed. Subsequently, the accuracy of these models was tested and evaluated. The results indicate that the fitting degrees of the FDS?based models and CRS?based models range from 0.716 to 0.938 and from 0.710 to 0.920, respectively, while OS?based models range from 0.710 to 0.874. It is evident that FDS?based and CRS?based models have a higher fitting degree than OS?based ones. From the analysis of model types, the random forest regression models (RFRM) exhibit the best fitting degree at 0.874-0.938 , followed by partial least squares regression models (PLSRM) at 0.826-0.866 and ridge regression models (RRM) at 0.737-0.889, then the univariate regression models (URM) at 0.710-0.730 with the worst fit . A comprehensive analysis reveals that the random forest regression model based on first?derivative spectra (FDR+RFRM) has the best prediction effect. The fitting degree of the training datasets and the test datasets are 0.938 and 0.893, respectively, and the R2, RMSE, MAE and RPD of validation datasets are 0.872, 0.561, 0.466 and 2.156, respectively. It is concluded that a hyperspectral detection model with high prediction accuracy is developed by combining spectral transformation with machine learning, which is suitable for monitoring the water content of Lyceum barbarum canopy leaves. This provides a suitable and efficient method for monitoring the water content of Lyceum barbarum canopy.
Keywords: water content; Lyceum barbarum; hyperspectral; partial least squares regression model; random forest regression model; ridge regression model
0 引言
水分是植物體內(nèi)主要的組成成份之一,它通過參與光合作用、營養(yǎng)物質(zhì)的吸收和運(yùn)輸、細(xì)胞壁的合成、溫度的調(diào)節(jié)等過程,影響作物的生長和發(fā)育,進(jìn)而影響作物產(chǎn)量與品質(zhì)[1]。隨著全球氣候變化及水資源問題的日益嚴(yán)重,水分已經(jīng)成為植物生長發(fā)育過程中所經(jīng)歷的最常見、最普遍的脅迫因子之一。寧夏地處中國內(nèi)陸,屬溫帶大陸性干旱、半干旱氣候,大氣降水、地表水和地下水都十分貧乏,導(dǎo)致該地區(qū)所面臨的水分脅迫問題日益突出,因此,為了保障農(nóng)業(yè)高質(zhì)量發(fā)展,該地區(qū)對精準(zhǔn)灌溉提出了更高的要求。枸杞作為寧夏重點(diǎn)發(fā)展的“六特”農(nóng)業(yè)產(chǎn)業(yè)之一,是寧夏脫貧致富的主要產(chǎn)業(yè),也是寧夏面向全國走向世界的一張“紅色名片”,隨著干旱災(zāi)害風(fēng)險日益增大,快速有效地診斷枸杞植株水分狀況,對支撐實(shí)現(xiàn)枸杞精準(zhǔn)灌溉,提高水資源利用效率,確保枸杞產(chǎn)量及品質(zhì)意義重大。
葉片含水率能夠直接反映植株水分狀況[2],是診斷作物水分脅迫的良好指標(biāo)[3]。傳統(tǒng)的作物水分測定方法主要有烘干法和蒸餾法,這些方法雖然精度高,但對植物具有破壞性、工作量大、時效性差[4]。高光譜遙感能夠采集地物精細(xì)的光譜信息,具有波段連續(xù)性強(qiáng)、光譜分辨率高以及光譜信息量大的特點(diǎn)。在監(jiān)測作物生理參數(shù)方面,具有非破壞性、勞動強(qiáng)度低及時效性強(qiáng)等優(yōu)勢[5],已成為作物水分監(jiān)測的重要手段。Thomas等[6]較早對水分脅迫下農(nóng)作物葉片光譜變化特征進(jìn)行了研究,并利用光譜反射率對葉片的含水量進(jìn)行了估算。Danson等[7]對測定的植物葉片光譜反射率(400~2 500 nm)進(jìn)行一階微分變換,對原始光譜、一階微分光譜與葉片結(jié)構(gòu)、葉片含水量進(jìn)行相關(guān)性分析,探討了一階微分變換在抑制葉片結(jié)構(gòu)影響、提高光譜與含水量相關(guān)性方面的作用。楊玉清等[8]基于近紅外高光譜(900~1 700 nm),通過構(gòu)建偏最小二乘回歸模型和逐步多元線性回歸模型,實(shí)現(xiàn)了對玉米葉片水分的較好預(yù)測。哈布熱等[1]基于冬小麥冠層高光譜(325~1 075 nm),采用相關(guān)性分析選取敏感波長、植被指數(shù)及光譜參數(shù),通過構(gòu)建逐步回歸模型和二元線性回歸模型,對冬小麥水分狀況進(jìn)行診斷。Peng等[9]通過數(shù)學(xué)變換獲取冬小麥冠層的變換光譜(325~1 075 nm),對變換光譜與含水率進(jìn)行相關(guān)性分析,采用主成分分析方法構(gòu)建了冬小麥含水量預(yù)測模型。張君等[10]采用主成分分析法對原始光譜及5種變換光譜進(jìn)行降維后,構(gòu)建了估測油菜葉片含水率的多元線性回歸模型、偏最小二乘回歸模型、支持向量機(jī)回歸模型,并對模型的估測效果進(jìn)行分析。
國內(nèi)外學(xué)者基于高光譜遙感信息在作物含水率監(jiān)測方面開展了大量研究。枸杞作為一種多年生灌木,目前鮮見相關(guān)研究報道。為獲取監(jiān)測枸杞冠層含水率的最優(yōu)模型,本文采用兩種數(shù)學(xué)變換,結(jié)合偏最小二乘法和隨機(jī)森林算法,構(gòu)建預(yù)測枸杞冠層含水率的偏最小二乘回歸模型和隨機(jī)森林回歸模型,同時構(gòu)建一元線性回歸模型和嶺回歸模型,對上述2類模型的預(yù)測效果進(jìn)行對比與評價,最終篩選出一套適用于枸杞冠層葉片含水率的高光譜預(yù)測模型,為實(shí)現(xiàn)枸杞水分狀況快速無損監(jiān)測提供技術(shù)支撐。
1 材料與方法
1.1 研究區(qū)域
該研究在寧夏賀蘭縣枸杞種植基地進(jìn)行。該基地位于賀蘭山東麓洪積扇的傾斜平原上,土壤肥沃、氣候干燥、日照充足、晝夜溫差大,非常適合綠色生態(tài)、無毒、無公害農(nóng)業(yè)的發(fā)展,是寧夏枸杞三大主產(chǎn)區(qū)之一,也是寧夏枸杞國家地理標(biāo)志產(chǎn)品保護(hù)區(qū)之一。研究區(qū)屬于溫帶大陸性干旱和半干旱氣候,年平均氣溫10.0 ℃,年平均降水量200.5 mm,年日照時數(shù)2 726.9 h,平均風(fēng)速0.8 m/s。
1.2 試驗材料
供試材料為“寧杞7號”。園區(qū)土壤為沙壤土。枸杞樹齡6年,種植密度3 300株/hm2,行間距為4 m,株間距為1 m。開花期灌溉前后,在研究區(qū)內(nèi)隨機(jī)選取枸杞樹,進(jìn)行鮮葉片的采集。采集鮮葉片時,在樹冠東、南、西、北4個方位分別采摘10片健康葉片,將每株枸杞樹采集的40片葉片作為一個樣本。為了減少采摘和運(yùn)輸過程中葉片水分的損失,葉片采集選擇在清晨進(jìn)行,將采摘的鮮葉片裝入自封袋中,迅速封口、標(biāo)記并放入裝有冰袋的泡沫箱中,待全部樣本采摘完畢后,將泡沫箱直接裝入移動式車載冰箱中,迅速帶回實(shí)驗室。到達(dá)實(shí)驗室后,立刻測定枸杞葉片鮮重和光譜。
1.3 數(shù)據(jù)測定
1.3.1 光譜測定
在密閉的暗室內(nèi)進(jìn)行光譜反射率的測定。測定采用ASDField Spec Pro便捷式地物光譜儀,光纖視場角為25°,光譜范圍為350~2 500 nm。用50 W的鹵素?zé)裟M太陽光,光線以與水平面成45°的恒定角度射入。測定時,將鮮葉片呈近似圓形平鋪在黑色絨布上,光纖垂直向下對準(zhǔn)樣品的中心位置,光纖距離樣本的垂直高度根據(jù)H=L/[2×tan(A/2)]進(jìn)行調(diào)整,其中H為光纖與樣本的垂直距離,L為測定范圍直徑,A為光纖視場角。每個樣本測定5條光譜,取平均值作為該樣本的光譜數(shù)據(jù)。每次測定前對光譜儀進(jìn)行標(biāo)準(zhǔn)白板校正。
1.3.2 含水率測定
采用烘干法測定含水率。在光譜反射率測定前,首先測定葉片樣本的鮮重([Wf]);光譜測定后,迅速將樣品放入烘箱,調(diào)溫至105 ℃殺青30 min,之后在70 ℃下烘干至恒重,測定其干重(Wd)。葉片含水率[LWC=[(Wf-Wd)/Wf]×100%]。葉片鮮重和干重的測定采用精度為1?的電子天平,且每個樣本測定3次后求取均值。
1.4 試驗方法
1.4.1 光譜變換
為提高光譜的信噪比,采用Savitzky-Golay對測定的光譜進(jìn)行濾波去噪處理,并獲取穩(wěn)定的原始光譜(OS)。采用Savitzky-Golay方法時,窗口點(diǎn)數(shù)設(shè)定為3,多項式階設(shè)定為2。由于一階微分光譜、連續(xù)統(tǒng)去除光譜與葉片含水率具有較強(qiáng)的相關(guān)性,能有效改善原始光譜與含水率之間的相關(guān)性[3, 7],故采用一階微分和連續(xù)統(tǒng)去除法對原始光譜進(jìn)行數(shù)學(xué)變換處理,獲取一階微分光譜(FDS)和連續(xù)統(tǒng)去除光譜(CRS)。
一階微分光譜計算式為
[Ri′=(Ri+1-Ri-1)/(λi+1-λi-1)] (1)
式中: Ri——波長i處的原始光譜反射率;
[Ri′]——Ri的一階微分光譜;
λi——第i個光譜通道的波長,光譜采樣間隔決定,本文中λ=1 nm。
連續(xù)統(tǒng)去除光譜計算式為
Scr=R/Rc (2)
式中: Scr——連續(xù)統(tǒng)去除光譜;
R——原始光譜反射率;
Rc——連續(xù)統(tǒng)線反射率。
Rc為逐點(diǎn)直線連接隨波長變化的吸收或反射凸出的“峰”值點(diǎn)并使折線在“峰”值點(diǎn)上的外角大于180°[11],從外觀上看就相當(dāng)于包裹在原始反射光譜曲線外的一層“薄膜外殼”,且薄膜外殼只與原始光譜曲線的“峰”值點(diǎn)接觸。由于光譜曲線實(shí)際是由離散的點(diǎn)組成,故可以用連續(xù)的折線作為原始光譜曲線的連續(xù)統(tǒng)線[11]。連續(xù)統(tǒng)去除光譜取值在[0,1]之間,其大小可以有效表征光譜吸收和反射特性的強(qiáng)弱。
1.4.2 模型構(gòu)建與檢驗
將OS、FDS和CRS分別與含水率進(jìn)行相關(guān)性分析,選取與含水率相關(guān)程度排序前10的光譜作為敏感波長。將敏感波長作為輸入,含水率作為輸出,采用偏最小二乘法、隨機(jī)森林算法及嶺回歸,分別構(gòu)建預(yù)測枸杞冠層含水率的偏最小二乘回歸模型(PLSRM),隨機(jī)森林回歸模型(RFRM)和嶺回歸模型(RRM)。本文PLSRM采用十折交叉驗證,模型參數(shù)如下:數(shù)據(jù)切分0.7,決策樹數(shù)量為100,樹的最大深度為10,分割節(jié)點(diǎn)數(shù)量為2,葉子節(jié)點(diǎn)的最大數(shù)量為50。此外,本文選取與含水率相關(guān)系數(shù)絕對值最大的光譜作為自變量,將含水率作為因變量,采用線性函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)和二次多項式函數(shù)構(gòu)建單變量回歸模型。
采用決定系數(shù)R2、均方根誤差RMSE、平均絕對誤差MAE和相對預(yù)測偏差RPD對模型性能進(jìn)行評估,R2為預(yù)測值與實(shí)測值的決定系數(shù),RMSE和MAE為預(yù)測誤差變幅,RPD為驗證集的標(biāo)準(zhǔn)偏差與RMSE的比值。R2越接近1,RMSE和MAE越接近0,模型監(jiān)測效果越理想。當(dāng)RPD<1.5,說明模型精度不理想;1.5≤RPD<2,說明模型具有較好預(yù)測精度;RPD≥2,則模型具有極好預(yù)測能力,能對樣本數(shù)據(jù)進(jìn)行有效預(yù)測。
2 結(jié)果與分析
2.1 冠層葉片含水率統(tǒng)計分析
將獲取的23個有效數(shù)據(jù),首先采用Excel的隨機(jī)函數(shù)為每個有效數(shù)據(jù)生成隨機(jī)數(shù),然后使用這些隨機(jī)數(shù)對數(shù)據(jù)進(jìn)行排序,最后按照2∶1將樣本數(shù)據(jù)劃分為建模集和驗證集,并對樣本進(jìn)行正態(tài)性檢驗(表1)??梢姡瑯颖炯淖儺愊禂?shù)均很小,說明總體樣本、建模樣本及驗證樣本的數(shù)據(jù)離散程度較低,數(shù)據(jù)的穩(wěn)定性和可靠性較高。同時,3個數(shù)據(jù)集的峰度絕對值均小于10,偏度絕對值均小于3,且S-W檢驗的結(jié)果顯示樣本數(shù)據(jù)與正態(tài)分布的擬合程度均接近1,因此,枸杞冠層葉片含水率統(tǒng)計分析表明:樣本數(shù)據(jù)接近標(biāo)準(zhǔn)正態(tài)分布。
2.2 光譜反射率變化特征分析
選取401~2 400 nm作為研究波段,共2 000個光譜通道。從圖1~圖3可見,所有樣本的原始光譜、一階微分光譜及連續(xù)統(tǒng)去除光譜的波形變化基本一致,但各波段光譜反射率幅值存在差異,這是由于葉片的組分含量不同,對光譜的吸收和反射存在差異所致。從圖1可見,枸杞葉片原始光譜變化特征與綠色植物變化特征一致。從圖2可見,一階微分光譜反射率相對較低,其數(shù)值在-0.010~0.015之間變化。與原始光譜相比較,一階微分光譜的峰—谷變化特征得到增強(qiáng),其中“紅邊”區(qū)域的光譜差異性增強(qiáng)最為顯著。從圖3可見,連續(xù)統(tǒng)去除光譜反射率數(shù)值歸一化到[0,1]。與原始光譜相比,除“紅邊”和“紅肩”波段外,在可見光和中紅外波段,連續(xù)統(tǒng)去除光譜的異質(zhì)性均得到顯著增強(qiáng),其中401~510 nm,1 600~1 800 nm和2 000~2 400 nm波段的光譜異質(zhì)性增強(qiáng)尤為顯著。光譜異質(zhì)性增強(qiáng)有利于對不同含水率的枸杞葉片光譜差異性進(jìn)行分析。
2.3 含水率與光譜相關(guān)性分析
借助軟件IBM SPSS Statistics 24,采用皮爾遜相關(guān)系數(shù)的計算方法,進(jìn)行雙變量相關(guān)分析,即將原始光譜、連續(xù)統(tǒng)去除光譜及一階微分光譜的每個波長對應(yīng)的光譜反射率與含水率數(shù)據(jù)分別進(jìn)行相關(guān)性分析,得到一個相關(guān)系數(shù),原始光譜、連續(xù)統(tǒng)去除光譜和一階微分光譜數(shù)據(jù)集均有2 000個光譜通道,故均得到2 000個相關(guān)性系數(shù),繪制成相關(guān)性系數(shù)圖(圖4)。由圖4(a)可見,原始光譜中,可見光波段與含水率呈現(xiàn)正相關(guān),其中僅有417 nm([r=0.547])和429 nm([r=0.533])達(dá)到0.01水平顯著相關(guān);近紅外和中紅外波段與含水率呈現(xiàn)負(fù)相關(guān),除1 900~1 980 nm波段外,其余波段均通過[p=0.01]顯著相關(guān)性檢驗,其中2 205 nm相關(guān)性最強(qiáng),相關(guān)系數(shù)為-0.744。由圖4(b)可見,連續(xù)統(tǒng)去除光譜與含水率的相關(guān)性,在可見光波段呈現(xiàn)出先負(fù)相關(guān)后正相關(guān)的變化特征,且與原始光譜相比,該波段通過[p=0.01]顯著檢驗的波長增多,相關(guān)性得到增強(qiáng),其中431 nm相關(guān)性最強(qiáng),相關(guān)系數(shù)為-0.757。近紅外波段,相關(guān)性變化波動較大。中紅外波段,其相關(guān)性變化與原始光譜基本一致。由圖4(c)可見,一階微分光譜與含水率的相關(guān)性系數(shù)的變化波動很大,可見光波段、近紅外波段及中紅外波段中均有通過[p=0.01]顯著相關(guān)性檢驗的波長,其中相關(guān)性最強(qiáng)的分別為475 nm([r=-0.712])、766 nm([r=-0.738])和2 015 nm([r=-0.793])。
分析三種光譜與含水率的相關(guān)系數(shù)分布,從通過p=0.01顯著相關(guān)性檢驗的波長中,選取相關(guān)系數(shù)絕對值排名前10的光譜(表2),作為敏感波長,用于枸杞冠層含水率預(yù)測模型的構(gòu)建。
表2中,敏感波長與含水率的相關(guān)程度按照從高到低,順序排列。從表2可見,原始光譜的敏感波長集中在中紅外波段的2 001~2 200 nm。一階微分光譜的敏感波長分布在可見光的475 nm和476 nm處,近紅外波段的766 nm和767 nm處,以及中紅外波段的1 460~1 470 nm和2 015 nm處。連續(xù)統(tǒng)去除光譜的敏感波長分布在可見光波段的410~443 nm處和中紅外波段的1601~1 618 nm處。可見,同原始光譜相比,連續(xù)統(tǒng)去除光譜與一階微分光譜的敏感波長,包含的光譜信息更豐富。
2.4 模型建立
基于表2中選取的敏感波長,構(gòu)建PLSRM和RFRM(表3)。從敏感波長分析,基于FDS構(gòu)建的模型,其擬合度為0.866~0.938;基于CRS構(gòu)建的模型,其擬合度為0.839~0.920;基于OR構(gòu)建的模型,其擬合度為0.826~0.874??梢?,光譜變換提高了模型預(yù)測精度。從模型類型分析,PLSRM訓(xùn)練集的擬合度為0.826~0.866,RFRM訓(xùn)練集的擬合度為0.874~0.938,說明RFRM的預(yù)測效果優(yōu)于PLSRM?;谝浑A微分光譜構(gòu)建的隨機(jī)森林回歸模型(FDS+RFRM)預(yù)測效果最優(yōu),其訓(xùn)練集和測試集的擬合度分別為0.938和0.893;其次預(yù)測效果較好的為基于連續(xù)統(tǒng)去除光譜構(gòu)建的隨機(jī)森林回歸模型(CRS+RFRM),其訓(xùn)練集和測試集的擬合度分別為0.920和0.881。
為了比較PLSRM和RFRM的性能,從敏感波長中選取相關(guān)系數(shù)絕對值最大的波長作為自變量,含水率作為因變量,構(gòu)建了一元回歸模型(Univariate Regression Model,URM)(表4),此外,基于表2中敏感波長構(gòu)建了RRM(表5)。
從表4可見,從敏感波長分析,基于FDS構(gòu)建的URM,其擬合度最高(0.716~0.730);基于CRS構(gòu)建的URM,其擬合度次之(0.710~0.722);基于OS構(gòu)建的URM,其擬合度最低(0.710~0.714)。從模型類型上分析,擬合度最高的URM均是一元二次回歸模型,基于FDS、基于CRS和基于OS構(gòu)建的一元二次回歸模型的擬合度分別為0.730、0.722和0.714。總體來看,URM的擬合度均大于0.7,模型具有較好的預(yù)測效果,但其模型擬合度均低于PLSRM和RFRM。
從表5可見,基于FDS構(gòu)建的RRM,其擬合度最高;其次為基于CRS構(gòu)建的RRM;基于OS構(gòu)建的RRM,其擬合度最低。將RRM的擬合度同URM擬合度進(jìn)行比較發(fā)現(xiàn),RRM的擬合度均高于URM。將RRM的擬合度同PLSRM和RFRM的擬合度進(jìn)行比較發(fā)現(xiàn),除了FDS+RRM外,其余RRM擬合度的均低于PLSRM和RFRM。
2.5 模型檢驗
對所有模型的訓(xùn)練集R2進(jìn)行對比發(fā)現(xiàn),F(xiàn)DS+RFRM和CRS+RFRM擬合度均大于0.9,初步說明2種模型對枸杞葉片含水率有較好的預(yù)測能力。為了檢驗這2種模型的可靠性,進(jìn)一步優(yōu)選最佳模型,使用驗證集數(shù)據(jù)對這2種模型進(jìn)行檢驗(圖5)。
從圖5可見,F(xiàn)DS+RFRM的預(yù)測效果優(yōu)于CRS+RFRM,其R2、RMSE和MAE分別為0.872、0.561和0.466,模型的RPD為2.156,模型具有優(yōu)秀的預(yù)測能力。CRS+RFRM有較多的離散數(shù)據(jù),該模型的R2、RMSE和MAE分別為0.545、0.841和0.615,RPD為1.632,模型預(yù)測效果一般。
3 討論
自從研究發(fā)現(xiàn)970 nm、1 200 nm、1 450 nm及1 940 nm附近為水分強(qiáng)吸收波段以來,關(guān)于作物水分的高光譜監(jiān)測研究主要集中在中紅外波段。高光譜遙感數(shù)據(jù)不僅光譜信息量大而且光譜連續(xù)統(tǒng)強(qiáng),因此除了主要的水分吸收波段外,亦存在其他能夠反映作物水分差異的敏感波段[12]。Knipling[13]較早發(fā)現(xiàn)植物紅邊峰值受水分脅迫的影響。Liu等[14]研究進(jìn)一步發(fā)現(xiàn),植物含水率越低,紅邊區(qū)域的光譜曲線越陡,表明紅邊波段也可用于預(yù)測植物含水率。賀可勛等[15]在不同的水分脅迫梯度下,研究水分脅迫對小麥光譜紅邊參數(shù)的影響,發(fā)現(xiàn)小麥紅邊位置和紅邊幅度受水分脅迫的影響在不同生長期表現(xiàn)出不同的變化特征。
除將350~400 nm和2 401~2 500 nm噪聲大的波段予以刪除外,將其余的401~2 400 nm共計2 000個光譜通道,均作為研究波段。該研究波段不僅包含了中紅外和紅邊波段,而且還包含了可見光和近紅外波段,拓寬了研究波段的光譜信息。數(shù)學(xué)變換是高光譜數(shù)據(jù)最有效的分析技術(shù)之一[16],它不僅可以突出光譜特征[17]而且能有效提取植被生物化學(xué)信息[18]。為了減少外界噪聲干擾,突出光譜差異性,本文對原始光譜進(jìn)行了一階微分變換和連續(xù)統(tǒng)去除變換,研究發(fā)現(xiàn):同OS相比,F(xiàn)DS“紅邊”(680~780 nm)區(qū)域的重疊光譜得到分解,光譜間的差異性得到增強(qiáng);CRS中紅外波段和藍(lán)邊波段,光譜間差異性同樣得到增強(qiáng)。此外,從光譜與含水率的相關(guān)性分析發(fā)現(xiàn):OS、CRS與含水率的最強(qiáng)相關(guān)系數(shù)分別為-0.793和-0.757,均優(yōu)于OS與含水率的最強(qiáng)相關(guān)系數(shù)-0.744。從模型預(yù)測效果分析,基于FDS構(gòu)建的模型,其擬合度最好;其次為基于CRS構(gòu)建的模型;基于OS構(gòu)建的模型擬合度最差;表明該2種數(shù)學(xué)變換能有效提高枸杞葉片光譜信噪比和模型的預(yù)測效果。
枸杞葉片含水率高光譜預(yù)測模型,目前主要是采用傳統(tǒng)數(shù)理統(tǒng)計方法構(gòu)建的一元回歸模型、逐步回歸及主成分回歸模型[3],模型精度有待提高。本文基于高光譜變換,不僅構(gòu)建了預(yù)測枸杞冠層葉片含水率的非參數(shù)模型RFRM,而且針對樣本數(shù)量少,敏感波長間存在多重共線性,構(gòu)建了PLSRM和RRM。同時構(gòu)建的PLSRM和RRM均有較好的擬合度,說明這2種建模方法有效解決了自變量之間多重共線性造成的回歸精度和穩(wěn)定性降低的問題。此外,通過構(gòu)建一元回歸模型,對RFRM、PLSRRM及RRM預(yù)測效果進(jìn)行比較,發(fā)現(xiàn)擬合度從高到低依次為RFRM、PLSRM、RRM、URM,其中FDS+RFRM的預(yù)測精度與穩(wěn)定性最佳,這是由于基于FDS篩選的敏感波段更分散,即包含可見光波段、紅邊和中紅外波段,其蘊(yùn)含的信息更全面;同時隨機(jī)森林學(xué)習(xí)作為一種集成機(jī)器學(xué)習(xí),對于變量的分布無嚴(yán)格要求,無需檢驗變量間的交互作用是否顯著,且對異常值與噪聲具有較高容忍度,使得該算法具有更好的穩(wěn)定性和更高的精度。今后研究中需嘗試采用更多的數(shù)學(xué)變換與光譜分析方法,挖掘全波段光譜的有效信息,實(shí)現(xiàn)光譜數(shù)據(jù)的充分利用;同時結(jié)合不同建模方法,構(gòu)建高光譜監(jiān)測模型,以期提高監(jiān)測精度,為寧夏枸杞產(chǎn)業(yè)水肥精準(zhǔn)管理提供技術(shù)支撐。
4 結(jié)論
將數(shù)學(xué)變換與機(jī)器學(xué)習(xí)相結(jié)合,為枸杞冠層葉片含水率監(jiān)測提供光譜選擇方法和建??蚣?,得到一套適用于枸杞冠層葉片含水率的高光譜探測模型即FDS+RFRM,為枸杞植株水分監(jiān)測和精準(zhǔn)灌溉提供科學(xué)參考。
1) 以“寧杞7號”枸杞為試驗對象,同步測定灌溉前后葉片光譜信息和葉片含水率數(shù)據(jù),綜合數(shù)學(xué)變換、數(shù)理統(tǒng)計與機(jī)器學(xué)習(xí)方法,在對光譜與含水率進(jìn)行相關(guān)性分析的基礎(chǔ)上,篩選出指示枸杞葉片含水率的敏感波長,構(gòu)建預(yù)測枸杞葉片含水率的高光譜模型,并優(yōu)選出最佳模型。
2) 研究發(fā)現(xiàn),數(shù)學(xué)變換增強(qiáng)枸杞冠層葉片光譜間的差異性,其中一階微分變換使得原始光譜中“紅邊”區(qū)域的重疊光譜得到分解;連續(xù)統(tǒng)去除變換使得401~510 nm,1 600~1 800 nm和2 000~2 400 nm波段的光譜差異性得到增強(qiáng)。此外,數(shù)學(xué)變換提高光譜與含水率之間的相關(guān)程度,提高模型的預(yù)測效果。FDS和CRS與葉片含水率的最強(qiáng)相關(guān)系數(shù)分別為-0.793和-0.757,而OS與含水率的最強(qiáng)相關(guān)系數(shù)為-0.744;基于FDS和基于CRS構(gòu)建的模型,其擬合度分別為0.716~0.938和 0.710~0.920,均高于基于OS構(gòu)建的模型(0.710~0.874)。最后,對模型預(yù)測效果進(jìn)行比較發(fā)現(xiàn),機(jī)器學(xué)習(xí)模型RFRM的預(yù)測效果最優(yōu),其次為PLSRM和RRM,URM預(yù)測效果最差。最終,篩選出預(yù)測枸杞冠層葉片含水率的最佳模型為基于一階微分光譜構(gòu)建的隨機(jī)森林回歸模型(FDS+RFRM),其訓(xùn)練集和測試集的擬合度分別為0.938和0.893,檢驗集R2、RMSE、MAE及RPD分別為0.872、0.561、0.466和2.156。
參 考 文 獻(xiàn)
[ 1 ] 哈布熱, 張寶忠, 李思恩, 等. 基于冠層光譜特征的冬小麥植株含水率診斷研究[J]. 灌溉排水學(xué)報, 2018, 37(10): 9-15.
Ha Bure, Zhang Baozhong, Li Si'en, et al. Estimating water content of winter wheat canopy based on its spectral characteristics [J]. Journal of Irrigation and Drainage, 2018, 37(10): 9-15.
[ 2 ] 冀榮華, 鄭立華, 鄧小蕾, 等. 基于反射光譜的蘋果葉片葉綠素和含水率預(yù)測模型[J]. 農(nóng)業(yè)機(jī)械學(xué)報, 2014, 45(8): 269-275.
Ji Ronghua, Zheng Lihua, Deng Xiaolei, et al. Forecasting chlorophyll content and moisture of apple leaves in different tree growth period based on spectral reflectance [J]. Transactions of the Chinese Society for Agricultural Machinery, 2014, 45(8): 269-275.
[ 3 ] 李永梅, 王浩, 趙勇, 等. 基于連續(xù)統(tǒng)去除法的枸杞葉片含水率高光譜估算[J]. 浙江農(nóng)業(yè)學(xué)報, 2022, 34(4): b6eddaf08d66888062cc691eb84d62f9781-789.
Li Yongmei, Wang Hao, Zhao Yong, et al. Hyperspectral estimation of leaf water content of Lycium barbarum based on continuum?removed method [J]. Acta Agriculturae Zhejiangensis, 2022, 34(4): 781-789.
[ 4 ] 代秋芳, 廖臣龍, 李震, 等. 基于CARS-CNN的高光譜柑橘葉片含水率可視化研究[J]. 光譜學(xué)與光譜分析, 2022, 42(9): 2848-2854.
[ 5 ] 馮先偉, 陳曦, 包安明, 等. 水分脅迫條件下棉花生理變化及其高光譜響應(yīng)分析[J]. 干旱區(qū)地理, 2004(2): 250-255.
[ 6 ] Thomas J R, Namken L N, Oether G F, et al. Estimating leaf water content by reflectance measurement [J]. Agronomy Journal, 1971, 63: 845-847.
[ 7 ] Danson F M, Steven M D, Malthus T J, et al. High?spectral resolution data for determining leaf water concentration [J]. International Journal of Remote Sensing, 1992, 13: 461-470.
[ 8 ] 楊玉清, 張?zhí)鹛穑?李軍會, 等. 近紅外高光譜的活體玉米葉片水分成像研究[J]. 光譜學(xué)與光譜分析, 2018, 38(12): 3743-3747.
[ 9 ] Peng Zhigong, Lin Shaozhe, Zhang Baozhong, et al. Winter wheat canopy water content monitoring based on spectral transforms and "Three?edge" parameters [J]. Agricultural Water Management, 2020, 240(1): 1-11.
[10] 張君, 蔡振江, 張東方, 等. 基于機(jī)器學(xué)習(xí)與光譜技術(shù)的油菜葉片含水率估測研究[J]. 河北農(nóng)業(yè)大報, 2021, 44(6): 122-127.
Zhang Jun, Cai Zhenjiang, Zhang Dongfang, et al. Estimation of water content in rape leaves by spectral reflectance combined with machine learning [J]. Journal of Hebei Agricultural University, 2021, 44(6): 122-127.
(下轉(zhuǎn)第 188頁)
(上接第 171頁)
[11] Clark R N, Roush T L. Reflectance spectroscopy: Quantitative analysis techniques for remote sensing application [J]. Journal of Geographical Research, 1984, 89(7): 6329-6340.
[12] 潘月, 曹宏鑫, 齊家國, 等. 基于高光譜和數(shù)據(jù)挖掘的油菜植株含水率定量監(jiān)測模型[J]. 江蘇農(nóng)業(yè)學(xué)報, 2022, 38(6): 1550-1558.
[13] Knipling E B. Physical and physiological basis for the reflectance of visible and near?infrared radiation from vegetation [J]. Remote Sensing of Environment, 1970, 1(3): 155-159.
[14] Liu Liangyun, Wang Jihua, Huang Wenjiang, et al. Estimating winter wheat plant water content using red edge parameters [J]. International Journal of Remote Sensing, 2004, 25(17): 1688-1691.
[15] 賀可勛, 趙書河, 來建斌, 等. 水分脅迫對小麥光譜紅邊參數(shù)和產(chǎn)量變化的影響[J]. 光譜學(xué)與光譜分析, 2013, 33(8): 2143-2147.
[16] 段丁丁, 何英彬, 羅善軍, 等. 不同高光譜特征參數(shù)區(qū)分馬鈴薯品種的優(yōu)劣勢分析[J]. 光譜學(xué)與光譜分析, 2018, 38(10): 3215-3220.
[17] 田安紅, 熊黑鋼, 趙俊三, 等. 分?jǐn)?shù)階微分對鹽漬土野外光譜預(yù)處理精度提升的機(jī)理分析[J]. 光譜學(xué)與光譜分析, 2019, 39(8): 2495-2500.
[18] Moros J. Vibrational spectroscopy provides a green tool for multi?component analysis [J]. Trends in Analytical Chemistry, 2009, 29(7): 578-591.